Understanding the planning of LLM agents: A survey

์ €์ž: Xu Huang, Weiwen Liu, Xiaolong Chen, Xingmei Wang, Hao Wang ์™ธ | ๋‚ ์งœ: 2024 | DOI: 10.48550/arXiv.2402.02716 📄 PDF


Essence

Figure 1: Taxonomy on LLM-Agent planning

LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ ๊ณ„ํš ์ˆ˜๋ฆฝ์˜ 5๊ฐ€์ง€ ์ฃผ์š” ๋ถ„๋ฅ˜

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์„ ์ž์œจ ์—์ด์ „ํŠธ์˜ ๊ณ„ํš ๋ชจ๋“ˆ๋กœ ํ™œ์šฉํ•˜๋Š” ์ตœ์‹  ์—ฐ๊ตฌ๋“ค์„ ์ฒด๊ณ„์ ์œผ๋กœ ๋ถ„์„ํ•œ ์ฒซ ๋ฒˆ์งธ ์ข…ํ•ฉ ์„ค๋ฌธ ๋…ผ๋ฌธ์ด๋‹ค. ๊ธฐ์กด์˜ ๊ธฐํ˜ธ ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•๊ณผ ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด LLM์˜ ์ถ”๋ก  ๋ฐ ๋„๊ตฌ ํ™œ์šฉ ๋Šฅ๋ ฅ์„ ํ™œ์šฉํ•œ ๊ณ„ํš ์ˆ˜๋ฆฝ ๋ฐฉ๋ฒ•๋“ค์„ 5๊ฐ€์ง€ ๋ฒ”์ฃผ๋กœ ๋ถ„๋ฅ˜ํ•˜์—ฌ ์ƒ์„ธํžˆ ๋ถ„์„ํ•œ๋‹ค.

Motivation

Achievement

Figure 2: Types of task decomposition manners

์ž‘์—… ๋ถ„ํ•ด์˜ ๋‘ ๊ฐ€์ง€ ๋ฐฉ์‹: (a) ๋ถ„ํ•ด-์šฐ์„  ๋ฐฉ์‹๊ณผ (b) ์ธํ„ฐ๋ฆฌ๋น™ ๋ฐฉ์‹

  1. ์ฒด๊ณ„์  ๋ถ„๋ฅ˜ ์ฒด๊ณ„ ์ œ์‹œ: ๊ธฐ์กด์— ์‚ฐ๋ฐœ์ ์œผ๋กœ ์—ฐ๊ตฌ๋˜๋˜ LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ ๊ณ„ํš ๋ฐฉ๋ฒ•๋“ค์„ ์ž‘์—… ๋ถ„ํ•ด(Task Decomposition), ๋‹ค์ค‘ ๊ณ„ํš ์„ ํƒ(Multi-plan Selection), ์™ธ๋ถ€ ๋ชจ๋“ˆ ํ™œ์šฉ(External Planner-aided Planning), ๋ฐ˜์‚ฌ ๋ฐ ๊ฐœ์„ (Reflection & Refinement), ๋ฉ”๋ชจ๋ฆฌ ์ฆ๊ฐ• ๊ณ„ํš(Memory-augmented Planning) 5๊ฐ€์ง€๋กœ ์ฒด๊ณ„์ ์œผ๋กœ ๋ถ„๋ฅ˜
  2. ๊ฐ ๋ฐฉํ–ฅ๋ณ„ ์ƒ์„ธ ๋ถ„์„: ๊ฐ ๋ฒ”์ฃผ์— ๋Œ€ํ•ด ๋™๊ธฐ, ๊ธฐ๋ณธ ์•„์ด๋””์–ด, ๋Œ€ํ‘œ ๋ฐฉ๋ฒ•๋“ค(CoT, ReAct, HuggingGPT, Plan-and-Solve ๋“ฑ), ์žฅ๋‹จ์ ์„ ํฌ๊ด„์ ์œผ๋กœ ๋…ผ์˜
  3. ๊ณต์‹์  ๋ฌธ์ œ ํ‘œํ˜„: ๊ฐ ๋ฐฉ๋ฒ•์„ ์ˆ˜ํ•™์ ์œผ๋กœ ๋ช…ํ™•ํžˆ ํ‘œํ˜„ํ•˜์—ฌ ์ƒ์ดํ•œ ์ ‘๊ทผ ๋ฐฉ์‹ ๊ฐ„์˜ ๋ณธ์งˆ์  ์ฐจ์ด๋ฅผ ๋ช…ํ™•ํžˆ ํ•จ
  4. ์ข…ํ•ฉ์  ๋ฒค์น˜๋งˆํฌ ํ‰๊ฐ€: 4๊ฐœ์˜ ์ฃผ์š” ๋ฒค์น˜๋งˆํฌ์—์„œ ๋Œ€ํ‘œ ๋ฐฉ๋ฒ•๋“ค์„ ํ‰๊ฐ€ํ•˜์—ฌ ์‹ค์ฆ์  ๋น„๊ต ์ œ๊ณต

How

์ž‘์—… ๋ถ„ํ•ด(Task Decomposition) ๋ฐฉ๋ฒ•

๋‹ค์ค‘ ๊ณ„ํš ์„ ํƒ(Multi-plan Selection)

์™ธ๋ถ€ ๋ชจ๋“ˆ ํ™œ์šฉ(External Planner-aided Planning)

๋ฐ˜์‚ฌ ๋ฐ ๊ฐœ์„ (Reflection & Refinement)

๋ฉ”๋ชจ๋ฆฌ ์ฆ๊ฐ• ๊ณ„ํš(Memory-augmented Planning)

Originality

Limitation & Further Study

ํ˜„์žฌ ํ•œ๊ณ„์ 

ํ›„์† ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ๊ธ‰์†ํžˆ ๋ฐœ์ „ํ•˜๋Š” LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ ๊ณ„ํš ๋ถ„์•ผ์— ๋Œ€ํ•œ ์ฒซ ์ฒด๊ณ„์  ์ข…ํ•ฉ ๋ถ„์„์„ ์ œ๊ณตํ•˜๋ฉฐ, 5๊ฐ€์ง€ ๋ช…ํ™•ํ•œ ๋ถ„๋ฅ˜ ์ฒด๊ณ„์™€ ์ƒ์„ธํ•œ ๊ธฐ์ˆ ์  ๋ถ„์„์„ ํ†ตํ•ด ์ปค๋ฎค๋‹ˆํ‹ฐ์— ์ค‘์š”ํ•œ ์ฐธ๊ณ ์ž๋ฃŒ๊ฐ€ ๋  ๊ฒƒ์œผ๋กœ ํ‰๊ฐ€๋œ๋‹ค. ํ–ฅํ›„ ๊ฐ ๋ฐฉํ–ฅ์˜ ํ•œ๊ณ„ ๊ทน๋ณต๊ณผ ๋ฐฉ๋ฒ•๋ก  ๊ฐ„ ๊ฒฐํ•ฉ ์—ฐ๊ตฌ๊ฐ€ ํ•ต์‹ฌ ๊ณผ์ œ๊ฐ€ ๋  ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
625๋ฒˆ ๋…ผ๋ฌธ์€ LLM ํ”Œ๋ž˜๋‹ ๋ฉ”์ปค๋‹ˆ์ฆ˜์˜ ์ตœ์‹  ํŠธ๋ Œ๋“œ์™€ ๋ถ„๋ฅ˜๋ฒ•์„ ์ฒด๊ณ„์ ์œผ๋กœ ์ •๋ฆฌํ•˜์—ฌ ์„ค๋ฌธ์  ์ธ์‚ฌ์ดํŠธ๋ฅผ ์‹ฌํ™”ํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์˜ ์ƒ์„ฑ ์›๋ฆฌ์™€ ๊ตฌ์กฐ์  ๋ถ„๋ฅ˜๋ฅผ ์‹ฌ์ธต์ ์œผ๋กœ ๋‹ค๋ฃฌ ์„œ๋ฒ ์ด๋กœ, ๊ณ„ํš ์ˆ˜๋ฆฝ ๋ชจ๋“ˆ์— ๋Œ€ํ•œ ๊นŠ์ด ์žˆ๋Š” ์ดํ•ด๋ฅผ ํ™•์žฅ์‹œ์ผœ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Large Language Model based Multi-Agents ๋…ผ๋ฌธ์€ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ํ˜‘๋™ ๊ธฐ๋ฒ• ์ค‘์‹ฌ์˜ ์ตœ์‹  ์—ฐ๊ตฌ๋ฅผ ๋น„๊ต ์ •๋ฆฌํ•˜์—ฌ, ๋‹จ์ผ ์—์ด์ „ํŠธ planning ํ•ด๋ฒ•๊ณผ ์ฐจ๋ณ„ํ™”ํ•ด ๋ณผ ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ์—์ด์ „ํŠธ๋ฅผ ํ™œ์šฉํ•œ ๊ตฌ์ฒด์  ํ”Œ๋ž˜๋‹ ๋ฐ ์Šˆํผ๋ฐ”์ด์ € ๋ฐฉ์‹๊ณผ ๊ธฐ์กด ๊ธฐํ˜ธ ๊ธฐ๋ฐ˜/๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ๋“ค์„ ๋น„๊ตํ•ด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฉ€ํ‹ฐ์Šคํ… ๋ฐ์Šคํฌํ†ฑ ์ž‘์—… ์ž๋™ํ™”๋ฅผ ์œ„ํ•œ ์œ ์‚ฌํ•œ ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ Agent S์™€ ๋™์ผํ•œ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃฌ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
039๋ฒˆ ๋…ผ๋ฌธ์€ LLM ์—์ด์ „ํŠธ์˜ ๋ฉ”๋ชจ๋ฆฌ ์•„ํ‚คํ…์ฒ˜ ๋ฐ ๊ณ„ํš๊ณผ ๊ธฐ์–ต์ด ๋งŒ๋‚˜๋Š” ์ง€์ ์— ๋ณ„๋„์˜ ์‹œ๊ฐ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ LLM ์‹œ์Šคํ…œ์˜ ํ”Œ๋ž˜๋‹ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๋ฐ ํ˜‘์—… ๊ตฌ์กฐ๋ฅผ ๋‹ค์–‘ํ•œ ์‹œ๊ฐ์—์„œ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM์˜ ํ”Œ๋ž˜๋‹ ๋Šฅ๋ ฅ๊ณผ ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ ํ˜‘์—… ๊ณ„ํš ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์‹ฌ๋„ ์žˆ๊ฒŒ ๋น„๊ตยท๋ถ„์„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •