Essence
๋
ผ๋ฌธ์ ๊ตฌ์กฐ: LLM ๋ฒค์น๋งํฌ๋ถํฐ AI ์์ด์ ํธ ํ๋กํ ์ฝ๊น์ง ํฌ๊ด์ ๋ฒ์ฃผํ
๋ณธ ๋
ผ๋ฌธ์ 2019๋
๋ถํฐ 2025๋
๊น์ง ๊ฐ๋ฐ๋ ์ฝ 60๊ฐ์ LLM ๋ฐ ์์จ AI ์์ด์ ํธ(Autonomous AI Agents) ๋ฒค์น๋งํฌ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ํตํฉํ๊ณ , 2023-2025๋
์ฃผ์ ์์ด์ ํธ ํ๋ ์์ํฌ์ ์ค์ ์์ฉ ์ฌ๋ก๋ฅผ ์ข
ํฉ์ ์ผ๋ก ๋ฆฌ๋ทฐํ๋ค. ํนํ ๋ค์ค ์์ด์ ํธ ํ๋ ฅ ํ๋กํ ์ฝ(Agent Communication Protocol, Model Context Protocol, Agent-to-Agent Protocol)์ ์กฐ์ฌํ๋ฉฐ ๋ฏธ๋ ์ฐ๊ตฌ ๋ฐฉํฅ์ ์ ์ํ๋ค.
How
AI ์์ด์ ํธ์ ํต์ฌ ์์: ์ธ์ง(Perception), ๊ธฐ์ต(Memory), ํ๋(Action)
- ๋ฒค์น๋งํฌ ๋ถ๋ฅ ๋ฐฉ๋ฒ๋ก : ํ๊ฐ ๋์(์ง์ ์ถ๋ก , ์ํ, ์ฝ๋ ๋ฑ), ํ๊ฐ ๋ฐฉ์(์ ์ /๋์ ), ๋๋ฉ์ธ ์ ์ฉ์ฑ์ ๊ธฐ์ค์ผ๋ก ๊ณ์ธต์ ๋ถ๋ฅ
- ์์ด์ ํธ ํ๋ ์์ํฌ ๋ถ์: ์ธ์-๊ธฐ์ต-ํ๋(Perception-Memory-Action) 3๊ฐ์ง ๋ชจ๋ ๊ตฌ์ฑ ๋ถ์, ๋ฐ์ฌ(Reflection), ๊ณํ(Planning), ๋๊ตฌ ํ์ฉ(Tool Use), ๋ค์ค ์์ด์ ํธ ํ๋ ฅ ํจํด ์ถ์ถ
- Agentic RAG ์ํคํ
์ฒ: Retrieval-Augmented Generation์ ์์จ ์์ด์ ํธ์ ๊ฒฐํฉํ์ฌ ์ค์๊ฐ ๋ฐ์ดํฐ ๊ฒ์๊ณผ ์ ์ํ ์ํฌํ๋ก์ฐ ๊ตฌํ
Agentic ์ํฌํ๋ก์ฐ: ๋ฐ์ฌ-๊ณํ-ํ๋-ํ๊ฐ ์ํ ๊ตฌ์กฐ
- ์์ฉ ์ฌ๋ก ์์ง: ๊ฐ ๋๋ฉ์ธ๋ณ ๊ตฌ์ฒด์ ๊ตฌํ ํํฉ, ์ฑ๊ณผ, ์ ์ฝ์ฌํญ ๋ฌธ์ํ
- ํ๋กํ ์ฝ ๋น๊ต: ์์ด์ ํธ ๊ฐ ํต์ ๋ฐฉ์, ๋ฉ์์ง ํ์, ์ํธ์ด์ฉ์ฑ ์ธก๋ฉด์์ 3๊ฐ์ง ํ๋กํ ์ฝ ๋น๊ต
์์ด์ ํธ ๊ธฐ๋ฐ RAG ํ๋ ์์ํฌ: ๋์ ์ ๋ณด ๊ฒ์๊ณผ ๋ฐ๋ณต์ ์ ์
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ LLM๊ณผ ์์จ AI ์์ด์ ํธ ๋ถ์ผ์ ๋น ๋ฅธ ๊ธฐ์ ๋ฐ์ ์ผ๋ก ์ธํ ๋จํธํ ๋ฌธ์ ๋ฅผ ์ฒด๊ณ์ ์ธ ๋ถ๋ฅ์ฒด๊ณ, ์ข
ํฉ์ ๋น๊ต ๋ถ์, ๋ค์ํ ์์ฉ ์ฌ๋ก๋ฅผ ํตํด ํจ๊ณผ์ ์ผ๋ก ํตํฉํ๋ ์ค์ํ ๋ฆฌ๋ทฐ ๋
ผ๋ฌธ์ด๋ค. ํนํ ๋ค์ค ์์ด์ ํธ ํ๋ ฅ ํ๋กํ ์ฝ ๋ถ์๊ณผ ๊ตฌ์ฒด์ ๋ฏธ๋ ์ฐ๊ตฌ ๋ฐฉํฅ ์ ์๊ฐ ํ๊ณ์ ์ฐ์
๊ณ์ ์ค์ง์ ๊ฐ์น๋ฅผ ์ ๊ณตํ๋, ์ผ๋ถ ์ ๋ฌธ ๋ถ์ผ(๋ณด์, ๋ฉํฐ ์์ด์ ํธ ์คํจ ๋ถ์)์์๋ ๋์ฑ ์ฌํ๋ ๋ถ์์ด ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
810๋ฒ ๋
ผ๋ฌธ์ LLM ํ๊ฐ ํ๋ ์์ํฌ ์ ๋ฆฝ์ 361๋ฒ ๋
ผ๋ฌธ์ LLM ์ถ๋ก ๋ฐ ์์ด์ ํธ ํ๊ฐ ์ข
ํฉ ๋ฆฌ๋ทฐ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ๊ณต์ ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Evaluation of OpenAI O1 ๋
ผ๋ฌธ์ AGI์๋์ ์์ด์ ํธ ์ฑ๋ฅ ํ๊ฐ์ ์ฌํ์ ์ํฅ์ ๋ํ ๋ฆฌ๋ทฐ๋ก ๋ณธ ๋
ผ๋ฌธ์ ๊ธฐ๋ฐ์ ํ์ฑํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ํ์ธ์ด๋ชจ๋ธ์ ์ถ๋ก ์ ๋ ๋ฐ ํ๊ฐ ๋ฐฉ๋ฒ๋ก ์ ํฌ๊ด์ ์ผ๋ก ๋
ผ์ํ๋ฉฐ, ๊ฐํํ์ต ๊ธฐ๋ฐ ๊ณ ๊ธ ์ถ๋ก ํจํด์ ์ฐ๊ตฌ์ ๋งฅ๋ฝ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
361๋ฒ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์์ด์ ํธ์ ๋
ผ๋ฆฌ์ถ๋ก ์๋ํ ์๋ฒ ์ด๋ก 2225์ ๊ด๋ จ๋ ์์ฑ ๋ฐ ๊ฒ์ฆ ํ๋ ์์ํฌ์ ์ด๋ก ์ ๋งฅ๋ฝ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM ์ถ๋ก ์์ AI ์์ด์ ํธ๋ก์ ์ ์ด ๋ฐ ๊ตฌ์กฐ์ ๊ตฌ์ฑ์ ๋ํ ํฌ๊ด์ ์๋ฒ ์ด๋ก 835๋ฒ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Autonomous Agents for Scientific Discovery๋ ๊ณผํ AI ์์ด์ ํธ ์ฒด๊ณํ์ ๋ฐ์ ์ฌ๋ฅผ ํญ๋๊ฒ ์ ๋ฆฌํ ์๋ฒ ์ด๋ก, ๋ฒค์น๋งํฌ ํตํฉ์ ์ด๋ก ์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ์์ด์ ํธ ์์คํ
์ ์ฑ๋ฅ์ ์ข์ฐํ๋ ์์(๋๊ตฌ ํ์ฉ, ์ค์ผ์ผ๋ง, ํ์
)์ ๋ํ ์ข
ํฉ/์ฌ์ธต ๋ฆฌ๋ทฐ ๋
ผ๋ฌธ์ผ๋ก, scaling law ์ฐ๊ตฌ์ ํต์ฌ ํ ๋๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM ๋ฐ ์์จ ์์ด์ ํธ ๋ฒค์น๋งํฌ ์ฒด๊ณ์ ๋ฆฌ๋ทฐ๊ฐ AI Scientist ์์คํ
์ ์ ์ฒด ์๋ํ ํ์ดํ๋ผ์ธ ๊ตฌํ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI์ ๊ณผํ์ ๋ฐ๊ฒฌ, ์์ด์ ํฐ๋ธ ์์คํ
, ๋ฒค์น๋งํน ํ๋ ์์ํฌ์ ์ด์ ์ ๋ง์ถ๋ ๋ ๋
ผ๋ฌธ์ ํจ๊ป ์ฝ์์ผ๋ก์จ ์ต๊ทผ LLM/์์ด์ ํธ ํ๊ฐ์ ํฐ ์กฐ๋ง์ด ๊ฐ๋ฅํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ์ถ๋ก ๋ฅ๋ ฅ ํ๊ฐ ๋ฐ ๋ฒค์น๋งํน์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ฐ์ค ๋ฐ๊ฒฌ๊ณผ ๊ท์น ํ์ต์ ์ฒ ํ์ ํ๋ ์์ํฌ์ ๊ธฐ๋ฐํด ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ์ฌ, ๋ฒค์น๋งํฌ ์ค์ฌ AI4Science ๋ฆฌ๋ทฐ์ ์ํธ ๋ณด์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ๊ณผํ ์ฐ๊ตฌ ์๋ํ ์์คํ
์ ์ค์ ๊ตฌํ ๋ฅ๋ ฅ๊ณผ ํ๊ณ๋ฅผ ๋ถ์ํ๋ ์ ์ฌํ ๊ด์ ์ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ณต์กํ ์ ์ฝ ๋ฐ๊ฒฌ ๊ณผ์ ์์ LLM ์์ด์ ํธ์ ์ถ๋ก ๋ฐ ๊ณํ ๋ฅ๋ ฅ์ ํ๊ฐํ๋ ๊ด๋ จ ๋
ผ๋ฌธ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
From Automation to Autonomy ๋
ผ๋ฌธ์ ์์ด์ ํธ์ ๊ณผํ ์๋ํ์ ํจ๋ฌ๋ค์ ์ ํ์ ํญ๋๊ฒ ์กฐ๋งํ์ฌ ๋ณธ ๋
ผ๋ฌธ์ ์ฒด๊ณ์ ๋ฆฌ๋ทฐ์ ์ํธ๋ณด์์ ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ๊ธฐ๋ฐ ์ฝ๋ ์์ฑ์ ๊ณผํ ๊ณ์ฐ ๋ฌธ์ ์ ์ ์ฉํ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
LLM์ ์ธ์ง ๋ฐ ์ถ๋ก ๋ฅ๋ ฅ์ด ์์จ ์์ด์ ํธ๋ก ์ด๋ป๊ฒ ํ์ฅ๋๋์ง ์ข
ํฉ์ ์ผ๋ก ๋ถ์ํ์ฌ, ๊ต๊ณผ์์ ์ค๋ช
์ด์์ ์ค์ ์ ํจ์๋ฅผ ์ ๊ณตํ๋ค.
ํ์ ์ฐ๊ตฌ
742๋ฒ ๋
ผ๋ฌธ์ LLM ์์ด์ ํธ์ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐยท์์ฑ ๋ฑ ๊ตฌ์ฒด์ ๊ณผํ ๊ณผ์
์๋ํ๋ฅผ ์ํ ๋ฉํฐ์์ด์ ํธ ํ๋ ์์ํฌ๋ก 361๋ฒ ๊ฐ๊ด ๋ฆฌ๋ทฐ์ ์์ฉ ์ธก๋ฉด์ ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
๋ ์๊ฐ์ ๋ฐ์ ๋ชจ๋์ ์ํคํ
์ฒ์ ์์ด์ ํธ ์ค๊ณ๋ฅผ ์ค์ง์ ์ธ LLM ๊ธฐ๋ฐ ๊ณผํ ์์ด์ ํธ๋ก ํ์ฅยท์ ์ฉํ๋ ์ ๊ทผ์ ๋ค๋ฃน๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM์ด ๊ณผํ ๋ฐ๊ฒฌ ๊ณผ์ ์์ ์๋ํ์์ ์์จ์ฑ์ผ๋ก ์งํํ๋ ํ๋ฆ์ ์์ธํ ๋ค๋ฃจ๋ฏ๋ก, LLM ๊ธฐ๋ฐ ๊ณผํ์์ด์ ํธ ๋ฐ์ ์ ์ค์ ํ๋ ์์ํฌ๋ฅผ ๋ณด์ํด์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
AI Scientist ์์คํ
์ ์์จ AI ์์ด์ ํธ ์ฐ๊ตฌ์ ์๋-ํฌ-์๋ ์๋ํ ์ ์ฉ ์ฌ๋ก๋ก ๋ณธ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ์ ์ค์ง์ ํ์ฅ์
๋๋ค.
ํ์ ์ฐ๊ตฌ
SEVerA ๋
ผ๋ฌธ์ ์์ฒด ํ์ฅ, ์๊ธฐ์งํ ์์ด์ ํธ ํ๊ฐ๋ก AGI ์ฌํ์ ์ํฅ ๋ฐ ํ๊ฐ ํ๋ ์์ํฌ์ ์ค์ง์ ์ฌ๋ก๋ฅผ ์ถ๊ฐํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ์์ด์ ํธ์ ์ถ๋ก ๋ฐ ๊ณผํ ์๋ํ์ ๊ดํ ํฌ๊ด์ ๋ฒค์น๋งํฌ์ ํ๊ฐ ์ง์นจ์ ์ ๊ณตํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM ์ถ๋ก ์์ ์ค์ ์์จ ์์ด์ ํธ๋ก์ ํ์ฅ ๋ฐ ์๋ฆฌ ์ฐจ์ด๋ฅผ ์ข
ํฉ์ ์ผ๋ก ๋ถ์ํ๋ฏ๋ก, 3288์ ์ค์ ์์ฉ ๋ฐ ๋ฐ์ ๋ฐฉํฅ์ ๋ชจ์ํ ์ ์์ต๋๋ค.
์์ฉ ์ฌ๋ก
MLE-bench๋ LLM ๊ธฐ๋ฐ ์์ด์ ํธ์ ๋จธ์ ๋ฌ๋ ํ์คํฌ ํ๊ฐ ๋ฒค์น๋งํฌ๋ฅผ ์ ์, ์ค์ง์ ๋ฒค์น๋งํน ์์ฉ์ ๋ณด์ฌ์ค๋ค.
์์ฉ ์ฌ๋ก
LLM ๊ธฐ๋ฐ ์ํ์ค ๋ชจ๋ธ๋ง ๋ฐ ๋์์ธ ์์ญ์์ ์ค์ ์์ฉ ์ฌ๋ก๋ฅผ ํตํด, ์ด ๋ฆฌ๋ทฐ ๋
ผ๋ฌธ์ ๋
ผ์ ํญ์ ๋ํ์ค๋ค.
์์ฉ ์ฌ๋ก
๊ณผํ ๋
ผ๋ฌธ์ ์ธ์ฉ ์์ธก ๋ฌธ์ ์ ์์ด์ ํธ ์ํฌํ๋ก์ฐ๋ฅผ ์ ์ฉํ ์ค์ ์ฌ๋ก๋ก, ๋ฒค์น๋งํฌ์ ์์ฉ์ ์ฐ๊ณ๋ฅผ ๋ณด์ฌ์ค๋๋ค.