์ ์: Yubin Kim, Ken Gu, Chanwoo Park, Chunjong Park, Samuel Schmidgall, A. Ali Heydari, Yao Yan, Zhihan Zhang, Yuchen Zhuang, Mark Malhotra, Paul Pu Liang, Hae Won Park, Yuzhe Yang, Xuhai Xu, Yilun Du, Shwetak Patel, Tim Althoff, Daniel McDuff, Xin Liu | ๋ ์ง: 2025-12-17 | DOI: 10.48550/arXiv.2512.08296 📄 PDF
Essence
Figure 1: ๋ชจ๋ธ ์ง๋ฅ(Intelligence Index)๊ณผ ์์ด์ ํธ ๊ตฌ์กฐ์ ๋ฐ๋ฅธ ์ฑ๋ฅ ๋ณํ. ์ธ ๊ฐ์ง LLM ๊ณ์ด(OpenAI, Google, Anthropic)์์ ๋ค์ค ์์ด์ ํธ ์์คํ
(MAS) ๋ณํ์ด ๋จ์ผ ์์ด์ ํธ ์์คํ
(SAS) ๋๋น ์์ดํ ํ์ฅ ํน์ฑ์ ๋ณด์.
๋ณธ ๋
ผ๋ฌธ์ ์ธ์ด ๋ชจ๋ธ ๊ธฐ๋ฐ ์์ด์ ํธ ์์คํ
์ ์ฑ๋ฅ์ ๊ฒฐ์ ํ๋ ์ ๋์ ํ์ฅ ์์น(scaling laws)์ ์ต์ด๋ก ์ฒด๊ณ์ ์ผ๋ก ๋์ถํ ์ฐ๊ตฌ์ด๋ค. ๋๊ตฌ ํ์ฉ๋, ๋ชจ๋ธ ๋ฅ๋ ฅ, ์์
ํน์ฑ ๊ฐ์ ์ํธ์์ฉ์ ๋ถ์ํ์ฌ ๋ค์ค ์์ด์ ํธ ์์คํ
(MAS)์ด ์ธ์ ์ฑ๋ฅ์ ํฅ์์ํค๊ณ ์ธ์ ์ ํ์ํค๋์ง ์ ๋ํํ๋ ์์ธก ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค.
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ์์ด์ ํธ ์์คํ
์ ํ์ฅ ์์น์ ์ ๋ํํ๋ ์ฒซ ๋๊ท๋ชจ ์ ์ด ์คํ์ผ๋ก์, "๋ค์ค ์์ด์ ํธ = ํญ์ ์ด๋"์ด๋ผ๋ ํต์ค์ ์ ๊ตํ๊ฒ ๋ฐ๋ฐํ๊ณ ์์
-์ํคํ
์ฒ ์ ๋ ฌ์ด ์ฑ๊ณต์ ํต์ฌ์์ ์ฆ๋ช
ํ๋ค. ํนํ ๋๊ตฌ-์ขํํ ํธ๋ ์ด๋์คํ, ๋ฅ๋ ฅ ํฌํ, ํ
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
AutoGen์ ๋ฉํฐ์์ด์ ํธ LLM ์ ํ๋ฆฌ์ผ์ด์
ํ๋ ์์ํฌ๋ก, ์์ด์ ํธ ์์คํ
ํ์ฅ ์์น ์ฐ๊ตฌ๊ฐ ๋ถ์ํ๋ ๋ค์ค ์์ด์ ํธ ์์คํ
์ ์ค์ ๊ตฌํ ๊ธฐ๋ฐ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ฐ์ค ๋ฐ๊ฒฌ๊ณผ ๊ท์น ํ์ต ์๋ฒ ์ด๋ ๋ฉํฐ์์ด์ ํธ ์์คํ
์ด ์ง์์ ๋ฐ๊ฒฌํ๋ ์ด๋ก ์ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ์ฌ ์์ด์ ํธ ํ์ฅ ์์น ์ฐ๊ตฌ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ์์ด์ ํธ ์์คํ
์ ์ฑ๋ฅ์ ์ข์ฐํ๋ ์์(๋๊ตฌ ํ์ฉ, ์ค์ผ์ผ๋ง, ํ์
)์ ๋ํ ์ข
ํฉ/์ฌ์ธต ๋ฆฌ๋ทฐ ๋
ผ๋ฌธ์ผ๋ก, scaling law ์ฐ๊ตฌ์ ํต์ฌ ํ ๋๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ง๋ฅํ ์์ด์ ํธ ์์คํ
์ ํ์ฅ ๋ฒ์น๊ณผ ์ค๊ณ ์๋ฆฌ๋ฅผ ์ข
ํฉ์ ์ผ๋ก ๋ค๋ฃจ๋ ๋ฆฌ๋ทฐ๋ก, ๋ค์ค ์์ด์ ํธ ํ์ฅ๋ฒ์น์ ์ ๋ํํ ๋
ผ๋ฌธ์ ๋ฐฐ๊ฒฝ์ง์์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์์ด์ ํธ ์์คํ
์ ํ์ฅ ์์น์ ์ ๋ํํ ์ฐ๊ตฌ๋ก, ๋ค์ค ์คํํธ๋ผ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ Earth-Agent์ ๋ฉํฐ์์ด์ ํธ ์ค๊ณ ์ต์ ํ์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
295 ๋
ผ๋ฌธ์ ๋ฉํฐ์์ค ํ๊ฒฝ์์ ๋ค์ค ์์ด์ ํธ ์ค์ผ์คํธ๋ ์ด์
๊ณผ ์ ๋ณด ๊ฒ์์ ๋ค๋ฃธ์ผ๋ก์จ, MAS ์ฑ๋ฅ ์ค์ผ์ผ๋ง ๋ฒ์น์ ๋ํ ๋ค์ํ ๊ตฌํ ๋ฐฉ์์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Sparks of science ๋
ผ๋ฌธ์ ์์ด์ ํธ ํ์ฅ๋ณด๋ค๋ ๊ตฌ์กฐ์ ํจํด ๊ธฐ๋ฐ ์ฐฝ์์ฑ ์ฆ์ง์ ์ด์ ์ ๋ง์ถ์ด ์ํธ๋ณด์๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋๊ท๋ชจ AI ์์ด์ ํธ ์์คํ
์ ์ฑ๋ฅ ๋ฐ ํ์ฅ์ฑ, ์ ๋ขฐ์ฑ์ ๊ดํ ์ฒด๊ณ์ ๋
ผ์๋ฅผ ํ ๋๋ก ์๋ก์ด ๋ฒค์น๋งํฌ ํ๊ฐ์ ํ์์ฑ์ ๋ถ๊ฐํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์์ด์ ํธ ํ์ฅ ์์น์ ์ ๋ํํ๋ ์ฐ๊ตฌ๋ AI ์์ด์ ํธ ์ ๋ขฐ์ฑ ๊ณผํ์ด ์ ์ํ ํ๋ ์์ํฌ๋ฅผ ์ฑ๋ฅ ์์ธก ์ฐจ์์์ ํ์ฅํ๋ ์ํธ ๋ณด์์ ์ฐ๊ตฌ๋ค.
์์ฉ ์ฌ๋ก
์์ด์ ํธ ์์คํ
์ฑ๋ฅ ํ์ฅ ์๋ฆฌ๋ฅผ ์ค์ MAS(Multi-Agent System)์ ๋ํด ์ ๋์ ์ผ๋ก ๋ถ์ํ ์ฌ๋ก๋ก, ์ด๋ก ์ ๋ฆฌ๋ทฐ๊ฐ ์ค์ฆ์ฐ๊ตฌ๋ก ์ด์ด์ง๋ค.
๋ฐ๋ก /๋นํ
๋ค์ค ์์ด์ ํธ ์์คํ
์ ๋ฆฌ์คํฌ ๋ฐ ์ํ์ฑ ์ฐ๊ตฌ๋ฅผ ๋์กฐ์ ์ผ๋ก ์ ์ํ์ฌ ํ์ฅ ์ ์ฑ๋ฅ ์ ํ/๋ถ์์ ์ฑ ๋ฌธ์ ๋ฅผ ์ค๋ช
ํฉ๋๋ค.