์ ์: Mengkang Hu, Yuhang Zhou, Wendong Fan, Yuzhou Nie, Bowei Xia, Tao Sun, Ziyu Ye, Zhaoxuan Jin, Yingru Li, Qiguang Chen, Zeyu Zhang, Yifeng Wang, Qianshuo Ye, Bernard Ghanem, Ping Luo, Guohao Li | ๋ ์ง: 2025-06-11 | DOI: 10.48550/arXiv.2505.23885 📄 PDF
Essence
Figure 2: WORKFORCE์ OWL์ ๊ฐ์. ๊ธฐ์กด ์ ๊ทผ๊ณผ ๋ฌ๋ฆฌ ์ ๋๋ฉ์ธ ์ ์ ์ ์ ์ฒด ์ฌํ์ต ์์ด ๋ชจ๋์ ํ์ฅ ๊ฐ๋ฅ
LLM ๊ธฐ๋ฐ ๋ค์ค ์์ด์ ํธ ์์คํ
์์ ๋๋ฉ์ธ๋ณ ํนํ๋ ์ค๊ณ๋ก ์ธํ ์ด์์ฑ ๋ถ์กฑ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, ์ ๋ต ๊ณํ(Planner)๊ณผ ๋๋ฉ์ธ ํนํ ์คํ(Worker)์ ๋ถ๋ฆฌํ ๋ชจ๋์ WORKFORCE ํ๋ ์์ํฌ์ ์ด๋ฅผ ์ต์ ํํ๋ OWL ํ์ต ํจ๋ฌ๋ค์์ ์ ์ํ๋ค.
How
Figure 3: WORKFORCE ํ๋ ์์ํฌ ๊ฐ์. Planner, Coordinator, Worker Pool์ ๊ณ์ธต์ ๊ตฌ์กฐ
์ถ๋ก ๋ฉ์ปค๋์ฆ (Inference):
- Planner Agent: ์ฌ์ฉ์ ์ง๋ฌธ์ ๋ถ์ํ์ฌ worker ์ญ๋ ๋ ์ง์คํธ๋ฆฌ ๊ธฐ๋ฐ ์ธ๋ถ ์์
์ผ๋ก ๋ถํด
- Coordinator Agent: Worker ์ญ๋ ํ๊ฐ ํ ์ ์ ํ worker์ ์์
ํ ๋น, ์์
์์กด์ฑ ๊ด๋ฆฌ, ๊ฒฐ๊ณผ ํตํฉ
- Worker Nodes: ์น ์์ด์ ํธ(๊ฒ์, ์น ์ฝํ
์ธ ์ถ์ถ), ๋ฌธ์ ์ฒ๋ฆฌ ์์ด์ ํธ(๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ), ์ถ๋ก /์ฝ๋ฉ ์์ด์ ํธ(๋ถ์, ์ฝ๋ ์คํ) ๋ฑ ๋๋ฉ์ธ ํนํ ๋๊ตฌ ํ์ฉํ์ฌ ์์
์ํ
- Task Channel: ์ค์ํ๋ ๊ณต์ ์ฑ๋๋ก ์์
๋ฐ ๊ฒฐ๊ณผ ํต์ , Worker ๊ฐ ์ง์ ๋ฉ์์ง ์ ๊ฑฐ๋ก ์ปจํ
์คํธ ์ ๋ฆฌ
- Replanning Mechanism: Worker ์คํจ ๊ฐ์ง ์ ์๋ ์ฌ๊ณํ์ผ๋ก ์ถ๋ก ์๊ฐ ์ค์ผ์ผ๋ง ๊ฐ๋ฅ
ํ๋ จ ๋ฉ์ปค๋์ฆ (OWL):
- 2๋จ๊ณ ํ๋ จ: (1) Supervised Fine-Tuning(SFT)์ผ๋ก Planner ์ด๊ธฐํ, (2) ์ค์ ํ๊ฒฝ ํผ๋๋ฐฑ ๊ธฐ๋ฐ ๊ฐํํ์ต(RL)์ผ๋ก ์ผ๋ฐํ ๋ฅ๋ ฅ ํฅ์
- ๋๋ฉ์ธ ๋ถ๊ฐ์ง๋ก Planner ์ต์ ํ: Worker ์ํคํ
์ฒ ๋ณ๊ฒฝ ์์ด Planner๋ง ํ์ตํ๋ฏ๋ก ์ฌํ๋ จ ์ค๋ฒํค๋ ์ต์ํ
- Custom Dataset: GAIA ๋ฒค์น๋งํฌ ๋ฏธ์ฌ์ฉ ๋
๋ฆฝ์ ๋ฐ์ดํฐ์
์ผ๋ก ํ๋ จํ์ฌ ๋๋ฉ์ธ ๊ฐ ์ผ๋ฐํ ๊ฒ์ฆ
Evaluation
์ดํ: WORKFORCE์ OWL์ ๋ค์ค ์์ด์ ํธ ์์คํ
์ ๋๋ฉ์ธ ๊ฐ ์ด์์ฑ ๋ฌธ์ ์ ์ฐ์ํ ๋ชจ๋์ ํด๊ฒฐ์ฑ
์ ์ ์ํ๋ฉฐ, GAIA ๋ฒค์น๋งํฌ์์ ์์ฉ ์์คํ
์ ์ด๊ณผํ๋ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค๋ ์ ์์ ์ค์ง์ ๊ธฐ์ฌ๊ฐ ์๋ค. ๋ค๋ง Worker ์ค๊ณ ์ผ๋ฐํ, ํ์ต ๋ฉ์ปค๋์ฆ ์์ธํ, ๋ณด๋ค ๋ค์ํ ๋๋ฉ์ธ ๊ฒ์ฆ ๋ฑ์ด ์ถ๊ฐ๋๋ฉด ์ํฅ๋ ฅ์ด ๋ ๋์์ง ๊ฒ์ผ๋ก ์์๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
OWL์ ๋ค์ค์์ด์ ํธ WORKFORCE ๊ตฌ์กฐ ์ค๊ณ๊ฐ AutoGen์ ๊ธฐ๋ณธ ์์ด์ ํธ ํ์
ํ๋ ์์ํฌ์ ๋ฐํํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์์ด์ ํธ ๋ฉ๋ชจ๋ฆฌ ๊ตฌ์กฐ์ ์ํฌํฌ์ค ์ญํ ๋ถ๋ฆฌ๋ฅผ ๋ค๋ฃจ๋ Agentic Memory ๋
ผ๋ฌธ์ด ์ค๊ณ์ ๋ชจ๋ํ ๋ฐ ๊ธฐ์ต ์ฒด๊ณ ๊ฐ๋ฐ์ ํ ๋๊ฐ ๋จ.
๊ธฐ๋ฐ ์ฐ๊ตฌ
596์ Agentic AI์ ๋ฉํฐ์์ด์ ํธ ํ๋ ฅ๊ณผ ์ํฌํ๋ก ์ต์ ํ ์ด๋ก ์ ์ ์ํด, 864์ ์์ ์๋ VASP ๊ณ์ฐ ์์คํ
์ ์ค๊ณ์ ์ฐธ๊ณ ๊ฐ ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Prompt ์ผ๊ด์ฑ ๋ฐ self-consistency ์ ๋ ๋ฐฉ๋ฒ์ด ๋ค์ค์์ด์ ํธ ์์คํ
์ ๊ณํ๊ณผ ๊ธฐ์ต ์ฑ๋ฅ ๋ณด์์ ๋์์ด ๋จ.
๋ค๋ฅธ ์ ๊ทผ
LLM ๊ธฐ๋ฐ ์์ด์ ํธ ํ์
/๋ถ์
๋ฐ ์ฌํ์ ์ํธ์์ฉ ๋ฉ์ปค๋์ฆ์ ๋ํ ๋น๊ต์ ์ ๊ทผ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
MechAgents ๋
ผ๋ฌธ์ ํนํ๋ ๊ณตํ ๋ฉ์ปค๋์ฆ ์ค๊ณ ํ์
์์คํ
์ผ๋ก, OWL์ ์ผ๋ฐ์ ๋ค์ค์์ด์ ํธ ์์
๋ณด์กฐ ๊ตฌ์กฐ์ ๋น๊ตํด ๋ณผ ์ ์๋ ์ฐจ๋ณ์ ์ฌ๋ก์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฉํฐ์์ด์ ํธ LLM ์์คํ
์ ํ๋๋ ๋ฉ์ปค๋์ฆ ๋ฐ ํ์
๊ตฌ์กฐ๋ฅผ ๋ค์ํ ์๊ฐ์์ ๋น๊ตํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
WORKFORCE์ ์ ์ฌํ ๋ชจ๋ํ ๋ฉํฐ์์ด์ ํธ ์ํธ์์ฉ ๋ฐ ๊ณํ ์๋ฆฝ ๋ฐฉ๋ฒ์ ์ต์ ๋ํฅ์ ๋ณผ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
PlanGenLLMs๋ OWL์ด ์ ์ํ ํ๋๋ ๋ถ๋ฆฌ ๊ธฐ๋ฒ๊ณผ ํ๋๋ ์์ปค ๊ตฌ์กฐ ๋ฑ LLM ๊ธฐ๋ฐ ์์ด์ ํธ ํ๋๋ ํ๊ฐ๋ฅผ ํ๋ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
OWL ๋
ผ๋ฌธ์ ๋ค์ํ ๋ถ์ผ์์ ์ผ๋ฐ๋ชฉ์ ๋ฉํฐ์์ด์ ํธ AI ํ์ต ๋ฐ ์ํฌ๋ก๋ ์ค์ผ์ค๋ง์ ์๋ํ์ฌ Biomni ์์คํ
์ ์ ์ฉ๋ฒ์ ํ์ฅ์ ์์ฌ์ ์ ์ค๋ค.
์์ฉ ์ฌ๋ก
OWL ํ๋ ์์ํฌ๊ฐ ์ค์ง์ ๋ฉํฐ์์ด์ ํธ ํ๋๋ ํ๊ฐ์ฒด๊ณ๋ฅผ ์ด๋ป๊ฒ ๊ตฌ์ฒดํํ๋์ง PlanGenLLMs์ ํ๊ฐ ํฌ์ธํธ์ ์ฐ๊ณ ๊ฐ๋ฅํฉ๋๋ค.