Augmented Language Models: a Survey

์ €์ž: G. Mialon, Roberto Dessรฌ, M. Lomeli, Christoforos Nalmpantis, Ramakanth Pasunuru | ๋‚ ์งœ: 2023 | DOI: arXiv:2302.07842 📄 PDF


Essence

๋ณธ ๋…ผ๋ฌธ์€ ์–ธ์–ด ๋ชจ๋ธ(Language Models, LMs)์„ ์ถ”๋ก  ๋Šฅ๋ ฅ๊ณผ ๋„๊ตฌ ์‚ฌ์šฉ ๋Šฅ๋ ฅ์œผ๋กœ ํ™•๋Œ€ํ•˜๋Š” ์ฆ๊ฐ• ์–ธ์–ด ๋ชจ๋ธ(Augmented Language Models, ALMs)์— ๋Œ€ํ•œ ํฌ๊ด„์ ์ธ ์กฐ์‚ฌ ๋…ผ๋ฌธ์ด๋‹ค. ALMs๋Š” ๋ณต์žกํ•œ ์ž‘์—…์„ ๋‹จ์ˆœํ•œ ๋ถ€์ž‘์—…์œผ๋กœ ๋ถ„ํ•ดํ•˜๊ฑฐ๋‚˜ ์™ธ๋ถ€ ๋ชจ๋“ˆ(์ฝ”๋“œ ์ธํ„ฐํ”„๋ฆฌํ„ฐ, ๊ฒ€์ƒ‰ ์—”์ง„ ๋“ฑ)์„ ํ™œ์šฉํ•˜์—ฌ ๊ธฐ์กด LMs์˜ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ, ์ผ๊ด€์„ฑ, ํ™•์žฅ์„ฑ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค.

Motivation

Achievement

Figure 1
Figure 2
  1. ์ถ”๋ก  ๋Šฅ๋ ฅ ๊ฐ•ํ™”:
    • ํ”„๋กฌํŒ…์„ ํ†ตํ•œ ์ถ”๋ก  ์œ ๋„(Chain-of-Thought, ์žฌ๊ท€์  ํ”„๋กฌํŒ…)
    • ์ž‘์—… ๋ฉ”๋ชจ๋ฆฌ(Working Memory)์™€ ๋ฐ˜๋ณต์  ํ”„๋กฌํŒ… ํ™œ์šฉ
    • ๋ช…์‹œ์  ํ•™์Šต์„ ํ†ตํ•œ ์ถ”๋ก  ๋Šฅ๋ ฅ ๊ฐœ์„ 
  2. ๋„๊ตฌ ํ™œ์šฉ ํ™•๋Œ€:
    • ๋‹ค๋ฅธ ๋ชจ๋ธ ํ˜ธ์ถœ, ์ •๋ณด ๊ฒ€์ƒ‰(๋ฌธ์„œ ๊ฒ€์ƒ‰, ๊ฒ€์ƒ‰ ์—”์ง„, ์›น ๋„ค๋น„๊ฒŒ์ด์…˜)
    • ์ฝ”๋“œ ์ธํ„ฐํ”„๋ฆฌํ„ฐ์™€ ๊ธฐํ˜ธ ๋ชจ๋“ˆ์„ ํ†ตํ•œ ๊ณ„์‚ฐ
    • ๊ฐ€์ƒ/๋ฌผ๋ฆฌ ์„ธ๊ณ„์— ๋Œ€ํ•œ ํ–‰๋™(๋กœ๋ด‡ ์กฐ์ž‘ ๋“ฑ)
  3. ํ•™์Šต ๋ฐฉ๋ฒ•๋ก  ๋‹ค์–‘ํ™”:
    • ์ง€๋„ ํ•™์Šต(Supervision), ๊ฐ•ํ™” ํ•™์Šต(Reinforcement Learning)์„ ํ†ตํ•œ ALM ํ•™์Šต
    • ํœด๋ฆฌ์Šคํ‹ฑ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๊ณผ ํ•™์Šต ๊ธฐ๋ฐ˜ ์ ‘๊ทผ์˜ ๋น„๊ต

How

Figure 3
Figure 4
Figure 5

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4.5/5 Overall: 4.4/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ๋น ๋ฅด๊ฒŒ ๋ฐœ์ „ํ•˜๋Š” ALM ๋ถ„์•ผ๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ์ •๋ฆฌํ•œ ์šฐ์ˆ˜ํ•œ ์„œ๋ฒ ์ด๋กœ, ์ถ”๋ก ๊ณผ ๋„๊ตฌ ์‚ฌ์šฉ์„ ํ†ตํ•ฉ์ ์œผ๋กœ ๋‹ค๋ฃจ๊ณ  ๋ช…ํ™•ํ•œ ๋ถ„๋ฅ˜์ฒด๊ณ„๋ฅผ ์ œ์‹œํ•˜์—ฌ ์ปค๋ฎค๋‹ˆํ‹ฐ์— ์‹ค์งˆ์  ๊ธฐ์—ฌ๋ฅผ ํ•œ๋‹ค. ๋‹ค๋งŒ ์ผ๋ถ€ ํ•ต์‹ฌ ๊ฐœ๋…์˜ ์ฒ ํ•™์  ๊ธฐ์ดˆ๊ฐ€ ์—ฌ์ „ํžˆ ๋ช…ํ™•ํ•˜์ง€ ์•Š๋‹ค๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ฆ๊ฐ• ์–ธ์–ด๋ชจ๋ธ์˜ ์„œ๋ฒ ์ด์—์„œ SciBERT์™€ ๊ฐ™์ด ๋„๋ฉ”์ธ ํŠนํ™” ์‚ฌ์ „ํ›ˆ๋ จ LLM์˜ ์›๋ฆฌ ๋ฐ ํ™•์žฅ์‚ฌ๋ก€๋ฅผ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Augmented Language Models ๋…ผ๋ฌธ์€ REALM๊ณผ ๊ฐ™์ด ์™ธ๋ถ€ ๊ฒ€์ƒ‰ ๊ธฐ๋Šฅ์„ ๊ฒฐํ•ฉํ•œ RAGํ˜• LLM์˜ ๋‹ค์–‘ํ•œ ์‚ฌ๋ก€์™€ ์ด๋ก ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ฆ๊ฐ• ์–ธ์–ด๋ชจ๋ธ ์„œ๋ฒ ์ด๋Š” ๋…ผ๋ฌธ ์š”์•ฝ ๋ฐ ํ•™์ˆ ๋ฌธ์„œ ์ฒ˜๋ฆฌ์— LLM ๋„๊ตฌ ๊ฒฐํ•ฉ์˜ ์ด๋ก ์ /๊ธฐ์ˆ ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ReAct ํ”„๋ ˆ์ž„์›Œํฌ๋Š” reasoning-acting ๋™์‹œ ์ œ์–ด์™€ ์™ธ๋ถ€ ๋„๊ตฌ ์—ฐ๋™์œผ๋กœ, ์ฆ๊ฐ• LLM ๋Šฅ๋ ฅ์˜ ์‹ค์งˆ์  ๊ตฌํ˜„ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM์˜ ๊ธฐ๋ฐ˜ ์•„ํ‚คํ…์ฒ˜์™€ ๋Šฅ๋ ฅ์„ ์„ค๋ช…ํ•˜๋Š” ๊ธฐ์ดˆ ์„œ๋ฒ ์ด ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Augmented Language Models: a Survey ๋…ผ๋ฌธ์€ ChatGPT ๋ฐ ์ƒ์„ฑํ˜• AI๊ฐ€ ๊ณผํ•™ ์—ฐ๊ตฌ ํ™˜๊ฒฝ์—์„œ ์–ด๋–ป๊ฒŒ ๊ธฐ๋Šฅ์ด ํ™•์žฅ๋˜๋Š”์ง€, ์ž‘๋™ ์›๋ฆฌ๋ฅผ ์ „์ฒด์ ์œผ๋กœ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Toolformer ๋…ผ๋ฌธ์€ LLM ์Šค์Šค๋กœ ์™ธ๋ถ€ ๋„๊ตฌ ์‚ฌ์šฉ๋ฒ•์„ ํš๋“ํ•˜๋Š” ์ฆ๊ฐ• LLM ๊ฐœ๋…์˜ ๊ธฐ์ˆ ์  ๋ฐ”ํƒ•์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Augmented Language Models: a Survey ๋…ผ๋ฌธ์€ LLM์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋‹ค์–‘ํ•œ ํ‰๊ฐ€ยท๋ณด์ • ๋ฐฉ๋ฒ•์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ •๋ฆฌํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ ํ™œ์šฉ ๋ฐฉ๋ฒ•๋ก ์˜ ํ˜„ํ™ฉ๊ณผ ๋ถ„๋ฅ˜๋ฅผ ์‹ฌ๋„ ์žˆ๊ฒŒ ๋‹ค๋ค„ ๋ณธ ๋…ผ๋ฌธ์˜ ์ฒด๊ณ„์  ํ”„๋ ˆ์ž„์›Œํฌ์— ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Gemini์™€ ๊ฐ™์€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์˜ ๊ฐœ๋…์  ์ง„ํ™”๋Š” ์ฆ๊ฐ•๋ชจ๋ธ ์„œ๋ฒ ์ด์˜ ๋…ผ์˜ ํ‹€ ์•ˆ์—์„œ ์ค‘์š”ํ•œ ๋น„๊ต ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Augmented Language Models ๋…ผ๋ฌธ์€ LLM์„ ์™ธ๋ถ€ ๋„๊ตฌ์™€ ๊ฒฐํ•ฉํ•œ ํ™•์žฅ๋œ ํ™œ์šฉ ๋ฐฉ์‹์œผ๋กœ GPT-4์˜ ๊ธฐ์ €์  ๊ฐœ๋…์— ๋Œ€์•ˆ์  ์‹œ๊ฐ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ๊ณผ AGI ๊ฐ€๋Šฅ์„ฑ์— ๋Œ€ํ•œ ์œ ์‚ฌํ•œ ํ‰๊ฐ€ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Augmented Language Models ๋ฆฌ๋ทฐ๋Š” ์—์ด์ „ํŠธ ์ง€๋Šฅ ๊ตฌ์กฐ๊ฐ€ ์•„๋‹ˆ๋ผ, ๋„๊ตฌ ์‚ฌ์šฉ๊ณผ ์ถ”๋ก  ํ™•์žฅ์— ์ง‘์ค‘ํ•œ ์ฆ๊ฐ• LLM ์ „์ฒด ์กฐ์‚ฌ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ์‹œ์Šคํ…œ์˜ ๋Šฅ๋ ฅ ํ™•์žฅ๊ณผ ํ†ตํ•ฉ์„ ์œ„ํ•œ ๋ฐฉ๋ฒ•๋ก ์  ์ ‘๊ทผ๋ฒ•์„ ์ข…ํ•ฉ์ ์œผ๋กœ ์กฐ์‚ฌํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM With Tools ๋…ผ๋ฌธ์€ ์™ธ๋ถ€ ํˆด ๊ฒฐํ•ฉ LLM์˜ ์ง„ํ™” ๋ฐ ๋‹ค์–‘ํ•œ ์‚ฌ๋ก€๋ฅผ ์„œ๋ฒ ์ดํ•˜์—ฌ ์ฆ๊ฐ• ์–ธ์–ด๋ชจ๋ธ ๋…ผ์˜์˜ ์ตœ์‹  ํ™•์žฅ ๋ฐฉํ–ฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
RAG ์‹œ์Šคํ…œ์„ ํŠน์ • ์‘์šฉ ๋ถ„์•ผ์— ํ™•์žฅ ์ ์šฉํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Augmented Language Models ๋…ผ๋ฌธ์€ ์™ธ๋ถ€ ๋„๊ตฌ ๋ฐ ํ™˜๊ฒฝ๊ณผ ๊ฒฐํ•ฉ๋œ LLM ์‘์šฉ์„ ํญ๋„“๊ฒŒ ์ •๋ฆฌํ•˜์—ฌ SciCode์˜ ๋ฒค์น˜๋งˆํฌ ํ™œ์šฉ ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Augmented Language Models: a Survey๋Š” AAAR-1.0 ๋ฒค์น˜๋งˆํฌ๊ฐ€ ํ‰๊ฐ€ํ•˜๋Š” ๋‹ค์–‘ํ•œ AI ๋ณด์กฐ ์—ฐ๊ตฌ ์ž‘์—…๊ณผ ์ฆ๊ฐ• ๋ชจ๋ธ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Augmented Language Models: a Survey๋Š” Toolformer์™€ ๊ฐ™์€ ๋„๊ตฌ ํ™œ์šฉ ๊ธฐ๋ฐ˜ LLM์˜ ์„ ํ–‰ ์‚ฌ๋ก€์™€ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ฒด๊ณ„์ ์œผ๋กœ ๋ถ„์„ํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
HLM-Cite ๋…ผ๋ฌธ์€ ์ฆ๊ฐ• ์–ธ์–ด ๋ชจ๋ธ์˜ ์‹ค์ œ ๊ณผํ•™ ๋…ผ๋ฌธ ์ธ์šฉ ์˜ˆ์ธก ๋ฌธ์ œ์— ์ ์šฉ๋œ ์‹ค์ฆ์  ํ™œ์šฉ ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •