์ ์: Samuel Schmidgall, Yusheng Su, Ze Wang, Ximeng Sun, Jialian Wu, Xiaodong Yu, Jiang Liu, Michael Moor, Zicheng Liu, Emad Barsoum | ๋ ์ง: 2025-06-17 | DOI: 10.48550/arXiv.2501.04227 📄 PDF
Essence
Agent Laboratory๋ ์ธ๊ฐ์ ์ฐ๊ตฌ ์์ด๋์ด๋ฅผ ์
๋ ฅ๋ฐ์ ํนํ๋ LLM ์์ด์ ํธ ํ์ดํ๋ผ์ธ์ ํตํด ์ฐ๊ตฌ ๋ณด๊ณ ์์ ์ฝ๋ ์ ์ฅ์๋ฅผ ์์ฑํ๋ค.
Agent Laboratory๋ ์ธ๊ฐ์ ์ฐ๊ตฌ ์์ด๋์ด ์คํ์ ์ง์ํ๋ ์์จ์ LLM ๊ธฐ๋ฐ ํ๋ ์์ํฌ๋ก, ๋ฌธํ ๊ฒํ , ์คํ ์ํ, ๋ณด๊ณ ์ ์์ฑ์ ์ธ ๋จ๊ณ๋ฅผ ๊ฑฐ์ณ ์์ ํ ์ฐ๊ตฌ ์ฑ๊ณผ๋ฌผ์ ์์ฑํ๋ค. ๊ธฐ์กด ์๋ํ ์ฐ๊ตฌ ๋ฐฉ๋ฒ ๋๋น 84% ๋น์ฉ ๊ฐ์ถ์ ๋ฌ์ฑํ๋ฉด์๋ ๋์ ํ์ง์ ๊ธฐ๊ณํ์ต ์ฐ๊ตฌ๋ฅผ ์ํํ ์ ์์์ ๋ณด์ฌ์ค๋ค.
Evaluation
์ดํ: Agent Laboratory๋ ์ธ๊ฐ์ ์ฐฝ์์ฑ์ ์กด์คํ๋ฉด์ LLM ์์ด์ ํธ์ ์๋ํ ๋ฅ๋ ฅ์ ํ์ฉํ๋ ์ค์ฉ์ ์ด๊ณ ๊ฒฝ์ ์ ์ธ ์ฐ๊ตฌ ์ง์ ์์คํ
์ ์ ์ํ๋ค. ํนํ co-pilot ๋ชจ๋์ ๋น์ฉ ํจ์จ์ฑ์ ์ค์ง์ ๊ธฐ์ฌ๋๊ฐ ๋์ผ๋, ์์ฑ๋ ์ฐ๊ตฌ์ ๊ณผํ์ ์ํฅ๋ ฅ, ํ๊ฐ ๋ฐฉ๋ฒ๋ก ์ ์ ๋ขฐ์ฑ, ๋ค์ํ ๊ณผํ ๋ถ์ผ๋ก์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ ์ธก๋ฉด์์ ์ถ๊ฐ ๊ฒ์ฆ๊ณผ ๊ฐ์ ์ด ์๊ตฌ๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Agent Laboratory(059)๋ ์์ด์ ํธ ๊ธฐ๋ฐ ๊ณผํ์ ์ฐ๊ตฌ ์๋ํ์ ํ์
ํ๊ฒฝ ์ค๊ณ ์๋ก ์ ์ ์ํ์ฌ, WebAgent-R1(871)์ด ์ค์ ๋ก ๊ตฌํํ๋ ์ฐ๊ตฌ ํ๊ฒฝ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ ๊ธฐ๋ฐ ๊ณผํ ์๋ํ์ ์ด๋ก ์ ํ๋ ์์ํฌ๋ฅผ ํญ๋๊ฒ ๋ค๋ฃจ์ด Agent Laboratory์ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ฐ๊ตฌ ๋ณด์กฐ์ฉ LLM ์์ด์ ํธ ํ์ฉ์ ๋ํ ๊ทผ๋ณธ์ ์ธ ๋ฐฉ๋ฒ๋ก ๊ณผ, ์คํ ์๋ํ์ ๊ธฐ์ด ํ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Agent Laboratory ๋
ผ๋ฌธ์ LLM ์์ด์ ํธ์ ์ฐ๊ตฌ ๋ณด์กฐ ํ์ฉ ๊ฐ๋ฅ์ฑ์ ์ค์ ํ๋ ์์ํฌ๋ก ๊ตฌํํ์ฌ, AutoGen์ general-purpose multi-agent ํ์
ํ๋ซํผ๊ณผ ๋์์ ํด๊ฒฐ์ฑ
์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
Agent Laboratory ๋
ผ๋ฌธ์ ๋ค์ค ์์ด์ ํธ ์์คํ
์ ํ๋ ฅ/์คํ ์๋ํ ์ธก๋ฉด์ ์ค์ ์ ์ฐ๊ตฌ ํ๋์ ์ ์ฉํ ์ฌ๋ก๋ก ์๋ก์ด ์๊ฐ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ์ด์ฉํ ์คํ ์ํ ๋ฐ ๋ณด๊ณ ์ ์๋ ์์ฑ์ ๋ค๋ฅธ ๋ฐฉ์์ผ๋ก ๊ตฌํํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
817์ ์์จ์ AI ๊ณผํ์ ํ์ ํตํ ๊ณผํ์ ๋ฐ๊ฒฌ์ ๋ค๋ฃจ๋ฉฐ, 059์ Agent Laboratory์ ์ ์ฌํ๊ฒ ์คํ-๋ณด๊ณ ์ ์๋ํ์ ์ค์ ์ ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ์์ด์ ํธ๋ฅผ ํ์ฉํ ์ฐ๊ตฌ ์๋ํ๋ฅผ ๋ค๋ฅธ ์ํคํ
์ฒ๋ ์ ๊ทผ๋ฒ์ผ๋ก ๊ตฌํํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ๊ธฐ๋ฐ ์ฐ๊ตฌ ์ง์ ์์คํ
์ ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ก ์ผ๋ก ์ ๊ทผํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
059๋ ๋จธ์ ๋ฌ๋ ์ฐ๊ตฌ ์๋ํ๋ฅผ ๋ชฉํ๋ก ํ ์์ด์ ํธ ํ๋ ์์ํฌ๋ฅผ ๋ณด์ฌ์ฃผ๋ฉฐ, 1094์ ์์ ์ฐ๊ตฌ ์๋ํ ๋ฐฉํฅ์ฑ๊ณผ ๋ค๋ฅธ ๋๋ฉ์ธ ์ ์ฉ๋ก๋ฅผ ์ ์ํ๋ค.
ํ์ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ๋ค์ค์์ด์ ํธ ํ์ฉ์ ํตํ ์๋ ์ฐ๊ตฌ Life Cycle ํ๋ ์์ํฌ์ ์ค์ ๊ตฌํ ์์๋ฅผ ๋ณด์ฌ์ค๋ค.
ํ์ ์ฐ๊ตฌ
840์ LLM ๊ธฐ๋ฐ ๊ณผํ ํ์ ํ๋ ์์ํฌ๋ฅผ ํฌ๊ด์ ์ผ๋ก ์๋ฒ ์ดํด, 059์ ๊ฐ๋ณ ์์คํ
์ ์์ ๊ฐ๋
์์ ์ฌ์ ์ํ๋ค.
ํ์ ์ฐ๊ตฌ
828์ AI์ฐ๊ตฌ์ ์๋ ํฌ ์๋ ์๋ํ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ 059์ ๊ตฌํ์ฌ๋ก์ ํ์ธต ๋ฒ์ฉ์ ์์ฌ์ ์ ๋ํ๋ค.
์์ฉ ์ฌ๋ก
AI ๊ธฐ๋ฐ ์๋ ๊ฒ์ฌ ๋ฐ ๋ฐ์ฆ์ ํตํ ๊ณผํ ์คํ ์๋ํ ์ฌ๋ก๋ก Agent Laboratory ์์ฉ์ ์ค์ ์๋ฅผ ๋ณด์ฌ์ค๋๋ค.
์์ฉ ์ฌ๋ก
๊ณผํ์ ๋ฐฉ์ ์ ์๋ ๋ฐ๊ฒฌ์ ์ํ LLM ๊ธฐ๋ฐ ํ์ดํ๋ผ์ธ์ด Agent Laboratory์ ์ฐ๊ตฌ ์ํ, ๊ฒํ ๊ธฐ๋ฅ๊ณผ ํ์ค ์ ์ฉ์์ ๋ง๋ ์ ์์ต๋๋ค.