Essence
Figure 1: ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ์ด์ฉํ ์ ๋ต์ ์ถ๋ก (๋ค์ํ ์ฐธ์ฌ์ ์ญํ : ๊ฒฝ๋งค ์ฐธ์ฌ์, ํฌ์ปค ํ๋ ์ด์ด, ๊ฒ์ ์ด๋ก ๋ถ์๊ฐ, ํ ๋ก ์)
๋ณธ ๋
ผ๋ฌธ์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ์ ๋ต์ ์ถ๋ก (Strategic Reasoning) ๋ฅ๋ ฅ์ ์ข
ํฉ์ ์ผ๋ก ์กฐ์ฌํ ์๋ฒ ์ด์ด๋ค. ์ ๋ต์ ์ถ๋ก ์ ๋ค์ค ์์ด์ ํธ ํ๊ฒฝ์์ ์๋๋ฐฉ์ ํ๋์ ์์ธกํ๊ณ ์ด์ ๋ฐ๋ผ ์ ๋ต์ ์ ์์ ์ผ๋ก ์กฐ์ ํ๋ ๊ณ ์ฐจ์์ ์ถ๋ก ๋ฅ๋ ฅ์ผ๋ก, LLM์ด ๋ณด์ ํ ์๋ก์ด ์ธ์ง ๋ฅ๋ ฅ์ผ๋ก ์ฃผ๋ชฉ๋ฐ๊ณ ์๋ค.
Evaluation
Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.2/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ LLM์ ์ ๋ต์ ์ถ๋ก ๋ฅ๋ ฅ์ ์ข
ํฉ์ ์ผ๋ก ์ ๋ฆฌํ ์์์ ์ ํ ์๋ฒ ์ด๋ก, ์ฐ์ฌ๋ ๋ฌธํ์ ์ฒด๊ณํ์ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ ์ ์์ ๊ธฐ์ฌํ์ง๋ง, ์ค์ ์ ์ฉ ํ๊ฒฝ์์์ ์ ๋ขฐ์ฑ ๊ฒ์ฆ๊ณผ ์ค๋ฆฌ์ ์ํ์ฑ ๋ถ์์ด ๋ณด๊ฐ๋์ด์ผ ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ค์ค ์์ด์ ํธ ์ฌํ ์๋ฎฌ๋ ์ด์
์ ์๋ฆฌ์ AI ์๋ฎฌ๋ ์ด์
์ ์ฉ์ ๋ค๋ฃจ์ด, ์ ๋ต์ ์ถ๋ก ๊ณผ ์ฌํ์ ์ญ๋์ฑ ์ฐ๊ฒฐ์ฑ์ ์ฌํ์ํด.
๊ธฐ๋ฐ ์ฐ๊ตฌ
AnyTool ๋
ผ๋ฌธ์ ๋๊ท๋ชจ ๋ค์ค์์ด์ ํธ ํ๊ฒฝ์์ LLM์ ๋๊ตฌ ํ์ฉ ๋ฐ ์ ๋ต์ ์์ฌ๊ฒฐ์ ๊ตฌ์กฐ๋ฅผ ์ฌ๋ ์๊ฒ ๋ถ์ํ์ฌ 498์ ์ ๋ต์ ์ถ๋ก ์กฐ์ฌ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
625(PlanGenLLMs)๋ LLM์ ๊ณํ ๋ฐ ์ ๋ต์ ์ถ๋ก ๋ฅ๋ ฅ ๋ฐํ ์๋ฆฌ์ ์ฃผ์ ๋ฐฉ๋ฒ๋ก ์ ์๋ฒ ์ดํ์ฌ, 498์ ์ ๋ต์ ์ถ๋ก ๋ฅ๋ ฅ ๊ฐ๋
์ ์ด๋ก ์ ํ ๋๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ค์ค ์์ด์ ํธ ๊ธฐ๋ฐ ์ ๋ณด ์ถ์ถ ๋ฐ ์ ๋ต์ reasoning์ ํ ๋๋ฅผ ๋ง๋ จํด ๋ณธ ๋
ผ๋ฌธ์ ์ ๋ต ์๋ฎฌ๋ ์ด์
์ดํด์ ๋ฐํ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM์ ์ ๋ต์ ์ถ๋ก ์ ํฌํจํ ๊ณผํ์ ์ถ๋ก ์ฑ๋ฅ ์งํ์ฌ์ ํต์ฌ ๊ณผ์ ์ ๋ํ ์ข
ํฉ์ ๊ณ ์ฐฐ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
655(ReAct)๋ LLM์ reasoning-acting ๊ฒฐํฉ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ, 498์ ๋ค์ค ์์ด์ ํธ ์ถ๋ก capability ํ๊ฐ์ ๋ณด์์ ๋น๊ต๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
ReTool ๋
ผ๋ฌธ์ ์ ๋ต์ ๋๊ตฌ ์ฌ์ฉ์ด ๊ฐ๋ฅํ LLM ๊ฐํํ์ต ํ๋ ์์ํฌ๋ก, 498์ ์ ๋ต์ ์ถ๋ก ๋ฅ๋ ฅ ํ๊ฐ๋ฅผ ์ค์ ์์คํ
์ ์ฉ ์ธก๋ฉด์์ ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
๊ณ ์ฐจ์์ ์ฌํ์ ์ํ๊ณผ ๋ค์ค ์์ด์ ํธ ์๋๋ฆฌ์ค์์ ์ ๋ต์ ์ถ๋ก ๋ฐ ํ๋ ๋์ญํ ํ๊ฐ๋ก ๋ณธ ๋
ผ๋ฌธ ๋ถ์ ๋ฒ์๋ฅผ ํ์ฅํฉ๋๋ค.
์์ฉ ์ฌ๋ก
LLM์ ์ ๋ต์ /๊ณ ์ฐจ์์ ์ถ๋ก ์ด ์ค์ ๊ณผํ์ฐ๊ตฌ ๋ฐ ๋
ผ๋ฌธ์์ฑ์ ๋ฏธ์น๋ ์ํฅ ํ๊ฐ์ ์ฐ๊ด์ฑ์ด ์์ต๋๋ค.
์์ฉ ์ฌ๋ก
498์ LLM์ ์ ๋ต์ ์ถ๋ก ๋ฐ ๋๊ตฌ ์ฌ์ฉ์ ์ ์ฉ๋ ์ค์ ์์คํ
์ฌ๋ก๋ก, 499์ ํ์คํ ํ๋ ์์ํฌ๊ฐ ์ค์ ๋ก ์ด๋ป๊ฒ ๊ตฌํ๋ ์ ์๋์ง ๋ณด์ฌ์ค๋๋ค.