Essence
LLM ๊ธฐ๋ฐ ์์ด์ ํธ ๊ณํ ์๋ฆฝ์ 5๊ฐ์ง ์ฃผ์ ๋ถ๋ฅ
๋ณธ ๋
ผ๋ฌธ์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ์์จ ์์ด์ ํธ์ ๊ณํ ๋ชจ๋๋ก ํ์ฉํ๋ ์ต์ ์ฐ๊ตฌ๋ค์ ์ฒด๊ณ์ ์ผ๋ก ๋ถ์ํ ์ฒซ ๋ฒ์งธ ์ข
ํฉ ์ค๋ฌธ ๋
ผ๋ฌธ์ด๋ค. ๊ธฐ์กด์ ๊ธฐํธ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๊ณผ ๊ฐํํ์ต ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด LLM์ ์ถ๋ก ๋ฐ ๋๊ตฌ ํ์ฉ ๋ฅ๋ ฅ์ ํ์ฉํ ๊ณํ ์๋ฆฝ ๋ฐฉ๋ฒ๋ค์ 5๊ฐ์ง ๋ฒ์ฃผ๋ก ๋ถ๋ฅํ์ฌ ์์ธํ ๋ถ์ํ๋ค.
How
์์
๋ถํด(Task Decomposition) ๋ฐฉ๋ฒ
- ๋ณต์กํ ์์
์ ๋ถํ ์ ๋ณต ์ ๋ต์ผ๋ก ์ฌ๋ฌ ๋ถ๋ถ์์
(sub-task)์ผ๋ก ๋ถํด
- ๋ถํด-์ฐ์ ๋ฐฉ์: ๋ชจ๋ ๋ถ๋ถ์์
์ ๋ฏธ๋ฆฌ ๋ถํด ํ ์์ฐจ์ ์ผ๋ก ๊ณํ ์๋ฆฝ (HuggingGPT, Plan-and-Solve, ProgPrompt)
- ์ธํฐ๋ฆฌ๋น ๋ฐฉ์: ๋ถ๋ถ์์
๋ถํด์ ๊ณํ์ ๋ฒ๊ฐ์ ์ํํ๋ฉฐ ๋์ ์กฐ์ (CoT, ReAct, PAL, PoT)
- CoT: ์์์ ์์ ๋ฅผ ํตํด ๋จ๊ณ๋ณ ์ถ๋ก ์ ๋
- Zero-shot CoT: "๋จ๊ณ๋ณ๋ก ์๊ฐํด๋ณด์"๋ ์ง์๋ก ์ถ๋ก ๋ฅ๋ ฅ ํ์ฑํ
- ReAct: ์ถ๋ก (Thought)๊ณผ ๊ณํ(Action)์ ๋ถ๋ฆฌํ์ฌ ๊ต๋๋ก ์ํ
- PoT/PAL: ํ๋ก๊ทธ๋๋ฐ ์ฝ๋๋ก ์ถ๋ก ๊ณผ์ ์ ํ์ํ
๋ค์ค ๊ณํ ์ ํ(Multi-plan Selection)
- ์ฌ๋ฌ ๋์ ๊ณํ์ ์์ฑํ ํ ํธ๋ฆฌ ํ์ ๋ฑ์ ์ ๋ต์ผ๋ก ์ต์ ๊ณํ ์ ํ
- ToT(Tree-of-Thought), GoT(Graph-of-Thought), CoT-SC ๋ฑ์ด ๋ํ
์ธ๋ถ ๋ชจ๋ ํ์ฉ(External Planner-aided Planning)
- LLM์ด ์์
์ ํ์ํํ๊ณ ์ ๋ฌธ ๊ณํ ์์คํ
(์: PDDL ๊ธฐ๋ฐ ๊ณํ๊ธฐ)์ด ์ค์ ๊ณํ ์์ฑ
- LLM+P, LLM+PDDL ๋ฑ์ ๋ฐฉ๋ฒ
๋ฐ์ฌ ๋ฐ ๊ฐ์ (Reflection & Refinement)
- ์ด๊ธฐ ๊ณํ ์์ฑ ํ ์ค๋ฅ ๋ฐ์, ํผ๋๋ฐฑ ์์ง, ๊ณํ ๊ฐ์ ์ ๋ฐ๋ณต ํ๋ก์ธ์ค
- Reflexion, CRITIC, Self-Refine ๋ฑ์ด ์คํจ ๊ฒฝํ์ผ๋ก๋ถํฐ ํ์ต
๋ฉ๋ชจ๋ฆฌ ์ฆ๊ฐ ๊ณํ(Memory-augmented Planning)
- ์์, ๊ณผ๊ฑฐ ๊ฒฝํ, ๋๋ฉ์ธ ์ง์ ๋ฑ์ ๋ณ๋ ๋ฉ๋ชจ๋ฆฌ์ ์ ์ฅํ๊ณ ๊ณํ ์ ๊ฒ์ ํ์ฉ
- REMEMBER, MemoryBank ๋ฑ์ ๋ฐฉ๋ฒ
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ๊ธ์ํ ๋ฐ์ ํ๋ LLM ๊ธฐ๋ฐ ์์ด์ ํธ ๊ณํ ๋ถ์ผ์ ๋ํ ์ฒซ ์ฒด๊ณ์ ์ข
ํฉ ๋ถ์์ ์ ๊ณตํ๋ฉฐ, 5๊ฐ์ง ๋ช
ํํ ๋ถ๋ฅ ์ฒด๊ณ์ ์์ธํ ๊ธฐ์ ์ ๋ถ์์ ํตํด ์ปค๋ฎค๋ํฐ์ ์ค์ํ ์ฐธ๊ณ ์๋ฃ๊ฐ ๋ ๊ฒ์ผ๋ก ํ๊ฐ๋๋ค. ํฅํ ๊ฐ ๋ฐฉํฅ์ ํ๊ณ ๊ทน๋ณต๊ณผ ๋ฐฉ๋ฒ๋ก ๊ฐ ๊ฒฐํฉ ์ฐ๊ตฌ๊ฐ ํต์ฌ ๊ณผ์ ๊ฐ ๋ ๊ฒ์ผ๋ก ์์๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
625๋ฒ ๋
ผ๋ฌธ์ LLM ํ๋๋ ๋ฉ์ปค๋์ฆ์ ์ต์ ํธ๋ ๋์ ๋ถ๋ฅ๋ฒ์ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ์ฌ ์ค๋ฌธ์ ์ธ์ฌ์ดํธ๋ฅผ ์ฌํํ๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ์์ด์ ํธ ์์คํ
์ ์์ฑ ์๋ฆฌ์ ๊ตฌ์กฐ์ ๋ถ๋ฅ๋ฅผ ์ฌ์ธต์ ์ผ๋ก ๋ค๋ฃฌ ์๋ฒ ์ด๋ก, ๊ณํ ์๋ฆฝ ๋ชจ๋์ ๋ํ ๊น์ด ์๋ ์ดํด๋ฅผ ํ์ฅ์์ผ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Large Language Model based Multi-Agents ๋
ผ๋ฌธ์ ๋ค์ค ์์ด์ ํธ ํ๋ ๊ธฐ๋ฒ ์ค์ฌ์ ์ต์ ์ฐ๊ตฌ๋ฅผ ๋น๊ต ์ ๋ฆฌํ์ฌ, ๋จ์ผ ์์ด์ ํธ planning ํด๋ฒ๊ณผ ์ฐจ๋ณํํด ๋ณผ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ์์ด์ ํธ๋ฅผ ํ์ฉํ ๊ตฌ์ฒด์ ํ๋๋ ๋ฐ ์ํผ๋ฐ์ด์ ๋ฐฉ์๊ณผ ๊ธฐ์กด ๊ธฐํธ ๊ธฐ๋ฐ/๊ฐํํ์ต ๊ธฐ๋ฐ ๋
ผ๋ฌธ๋ค์ ๋น๊ตํด๋ณผ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฉํฐ์คํ
๋ฐ์คํฌํฑ ์์
์๋ํ๋ฅผ ์ํ ์ ์ฌํ ์์ด์ ํธ ํ๋ ์์ํฌ๋ก Agent S์ ๋์ผํ ๋ฌธ์ ๋ฅผ ๋ค๋ฃฌ๋ค.
๋ค๋ฅธ ์ ๊ทผ
039๋ฒ ๋
ผ๋ฌธ์ LLM ์์ด์ ํธ์ ๋ฉ๋ชจ๋ฆฌ ์ํคํ
์ฒ ๋ฐ ๊ณํ๊ณผ ๊ธฐ์ต์ด ๋ง๋๋ ์ง์ ์ ๋ณ๋์ ์๊ฐ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฉํฐ์์ด์ ํธ LLM ์์คํ
์ ํ๋๋ ๋ฉ์ปค๋์ฆ ๋ฐ ํ์
๊ตฌ์กฐ๋ฅผ ๋ค์ํ ์๊ฐ์์ ๋น๊ตํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM์ ํ๋๋ ๋ฅ๋ ฅ๊ณผ ๋ฉํฐ์์ด์ ํธ ํ์
๊ณํ ๋ฉ์ปค๋์ฆ์ ์ฌ๋ ์๊ฒ ๋น๊ตยท๋ถ์ํ ์ ์์ต๋๋ค.