์ ์: Lianhao Zhou, Hongyi Ling, Cong Fu, Yepeng Huang, Michael Sun, Wendi Yu, Xiaoxuan Wang, Xiner Li, Xingyu Su, Junkai Zhang, Xiusi Chen, Chenxing Liang, Xiaofeng Qian, Heng Ji, Wei Wang, Marinka Zitnik, Shuiwang Ji | ๋ ์ง: 2025-10-10 | DOI: - 📄 PDF
Essence
๊ทธ๋ฆผ 1: AI ๊ธฐ๋ฐ ๊ณผํ ๋ฐ๊ฒฌ์ ์ํ 3๋จ๊ณ ์ํฌํ๋ก์ฐ ๊ฐ์. ๊ฐ์ค ๋ฐ๊ฒฌ(Phase 1) โ ์คํ ์ค๊ณ ๋ฐ ์คํ(Phase 2) โ ๊ฒฐ๊ณผ ๋ถ์ ๋ฐ ๊ฐ์ (Phase 3)
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM) ๊ธฐ๋ฐ ์์จ ์์ด์ ํธ(Scientific Agents)๊ฐ ๊ณผํ ๋ฐ๊ฒฌ์ ์ ์ฒด ์๋ช
์ฃผ๊ธฐ๋ฅผ ์๋ํํ๊ณ ๊ฐ์ํํ ์ ์๋ ์๋ก์ด ํจ๋ฌ๋ค์์ ์ ์ํ๋ค. ์ด๋ค ์์ด์ ํธ๋ ์์ฐ์ธ์ด, ํ๋ก๊ทธ๋๋ฐ ์ฝ๋, ๋ฌผ๋ฆฌ ์ ๋ณด๋ฅผ ํตํฉํ์ฌ ์ธ๊ฐ ๊ณผํ์, ๊ณ์ฐ ๋๊ตฌ, ๋ฌผ๋ฆฌ ์ฅ๋น์ ์ ์ฐํ๊ฒ ์ํธ์์ฉํ๋ค.
How
๊ทธ๋ฆผ 3: ์์จ ๊ณผํ ๋ฐ๊ฒฌ์ ์ํ ์ ๋ณด์ด๋ก ์ ํ๋ ์์ํฌ
Phase 1: ๊ฐ์ค ๋ฐ๊ฒฌ ๋ฉ์ปค๋์ฆ
- ์ง์ ์ถ์ถ: ๊ณผํ ๋ฌธํ, ๋ฐ์ดํฐ๋ฒ ์ด์ค(PubMed, Materials Project), ๋
ผ๋ฌธ ๋ฐ ๋ํ์์ RAG(Retrieval-Augmented Generation) ๋๋ ๋ค์ค๋ชจ๋ฌ LLM์ ํตํด ๊ตฌ์กฐํ๋ ์ง์ ์ถ์ถ
- ๊ฐ์ค ์์ฑ: ํ๋กฌํํธ ๊ธฐ๋ฐ(prompt-based), ์ง์ ๊ทธ๋ํ ํ์ฉ, ๋ค์ค ์์ด์ ํธ ์ํธ์์ฉ, ์งํ ์๊ณ ๋ฆฌ์ฆ ๊ฒฐํฉ์ ํตํ ์๋ก์ด ๊ฐ์ค ์์ฑ
- ๊ฒ์ฆ: ๋ฉํธ๋ฆญ ๊ธฐ๋ฐ ํํฐ๋ง(novelty, feasibility, significance) ๋๋ ์์ด์ ํธ ๊ธฐ๋ฐ ํ๊ฐ
Phase 2: ์คํ ์ค๊ณ ๋ฐ ์คํ
- ์ค๊ณ: RAG ๊ธฐ๋ฐ ๊ณํ(์ ์ฌ ์ ํ ์ฐ๊ตฌ ์ฐธ๊ณ ), ์ธ๊ฐ์ ๊ณ ์์ค ์ง์นจ(human guidance), ์ฌ์ ์ ์๋ ์ก์
ํ
ํ๋ฆฟ, ์คํ ํ ํผ๋๋ฐฑ ํตํฉ
- ์คํ: ๋๊ตฌ ์ฌ์ฉ(Tool Use) - ๊ธฐ์กด ์๋ฎฌ๋ ์ดํฐ/๋ก๋ด/DB ํ์ฉ ์ฝ๋ ์์ฑ
- ์คํ: ๋๊ตฌ ์์ฑ(Tool Creation) - ์๋ก์ด ์๊ณ ๋ฆฌ์ฆ/๋๊ตฌ์ ์ฝ๋ ์๋ ์์ฑ (ToolUniverse, MAPPS, CodePDE, AlphaEvolve, TOOLMAKER ๋ฑ)
- ๋ค์ค ์์ด์ ํธ ๊ณ์ธต ๊ตฌ์กฐ: ๋จ์ผ ์์ด์ ํธ์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด ์ ๋ฌธ๊ฐ ์ญํ (์ค๊ณ์, ์คํ์, ํ๊ฐ์) ๋ถ๋ด
Phase 3: ๊ฒฐ๊ณผ ๋ถ์ ๋ฐ ๊ฐ์
- ์๋ ์์ฒด ์์ : ์์ด์ ํธ๊ฐ ๊ฒฐ๊ณผ๋ฅผ ๊ฒํ ํ๊ณ ๋ฌธ์ ๋ฅผ ์๋ณํ์ฌ ์ํฌํ๋ก์ฐ ๊ฐ์
- ์ธ๊ฐ-in-the-loop: ์ธ๊ฐ ํผ๋๋ฐฑ์ ๋ฐ๋ณต์ ์ผ๋ก ํตํฉํ์ฌ ์ ์ง์ ๊ฐ์
- ์ธ๋ถ ํ๊ฐ: ์คํ ์ฌ๊ฒ์ฆ, ๋๋ฃ ๊ฒํ (peer review) ํ๋ก์ธ์ค ์๋ํ
Evaluation
์ดํ: ์ด ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ณผํ ์์ด์ ํธ์ ํํฉ์ ๊ฐ์ฅ ํฌ๊ด์ ์ผ๋ก ์ ๋ฆฌํ ์๋ฏธ ์๋ ๋ฆฌ๋ทฐ ๋
ผ๋ฌธ์ผ๋ก, ๊ณผํ ๋ฐ๊ฒฌ์ ์ ์ฒด ์ฌ์ดํด์ ํตํฉํ๋ ํ๋ ์์ํฌ์ ์ ๋ณด์ด๋ก ์ ํ์ํ๋ฅผ ์ ์ํ ์ ์์ ํ์ ์ ยท์ค๋ฌด์ ๊ธฐ์ฌ๊ฐ ํฌ๋ค. ๋ค๋ง ์์ ์ํคํ
์ฒ์ ํตํฉ๋ณด๋ค๋ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค์ ์กฐ์ง์ ๋ถ๋ฅ์ ๋ฌด๊ฒ๊ฐ ์์ผ๋ฉฐ, ์ ์๋ ํ๊ณ์ ๋ค(์ผ๋ฐํ ๋ฅ๋ ฅ, ์์ ์ฑ, ์ค์ ํจ์จ์ฑ)์ด ์ค์ ์์ฉ ๋จ๊ณ์์ ์ผ๋ง๋ ๊ทน๋ณต๋์๋์ง์ ๋ํ ์ฌํ ๋ถ์์ด ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
HuggingGPT ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋ฉํฐ๋๊ตฌยท์์ด์ ํธ ํ์
์๋ํ ํ๋ ์์ํฌ๋ก, 137 ๋
ผ๋ฌธ์ ์ค์ผ์คํธ๋ ์ด์
๊ฐ๋
์ ๊ธฐ์ ์ ๊ธฐ๋ฐ์ ๋ง๋ จํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
834๋ฒ ๋
ผ๋ฌธ์ ๊ณผํ์ ๋ฐ๊ฒฌ ์๋ํ์ ์ด๋ก ์ ํต์ฌ๊ณผ ํ๊ณ๋ฅผ ์ ์ํ์ฌ, 137๋ฒ์ ํตํฉ ์์ด์ ํธ ํจ๋ฌ๋ค์์ ๋ฐฐ๊ฒฝ ํ ๋๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ ๋ฐ๊ฒฌ์ ์ํ ์์จ ์์ด์ ํธ์ ๊ธฐ๋ฐ ๊ฐ๋
์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ ์คํ ์๋ํ๋ฅผ ์ํ ์์จ ์์ด์ ํธ์ ๊ธฐ๋ฐ ๊ฐ๋
์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ ๋ฐ๊ฒฌ์ ์ํ ์์จ ์์ด์ ํธ์ ๊ธฐ๋ฐ ๊ฐ๋
๊ณผ ๋ฐฉ๋ฒ๋ก ์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ ๋ฐ๊ฒฌ์ ์ํ ์์จ ์์ด์ ํธ์ ๊ธฐ๋ฐ ๊ฐ๋
์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Autonomous Agents for Scientific Discovery๋ ๊ณผํ AI ์์ด์ ํธ ์ฒด๊ณํ์ ๋ฐ์ ์ฌ๋ฅผ ํญ๋๊ฒ ์ ๋ฆฌํ ์๋ฒ ์ด๋ก, ๋ฒค์น๋งํฌ ํตํฉ์ ์ด๋ก ์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Autonomous Agents for Scientific Discovery ๋
ผ๋ฌธ์ ์์ด์ ํธ ๊ธฐ๋ฐ ๊ณผํ ํ๊ตฌ ์๋ํ์ ๊ธฐ๋ฐ ๋ชจ๋ธ์ ์ ๊ณตํ์ฌ 285์ ์๋ ์ฐ๊ตฌ ํ๋ ์์ํฌ ์ค๊ณ์ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ฅผ ์ ์ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
137์ ๊ณผํ ๋ถ์ผ์์ ์์จ ์์ด์ ํธ์ ๊ตฌ์กฐ์ ์ค์ผ์คํธ๋ ์ด์
์ ๋ํ ์๋ฒ ์ด ๋
ผ๋ฌธ์ผ๋ก 559์ ์์คํ
์ํคํ
์ฒ ์ค๊ณ์ ๊ฐ๋
์ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Autonomous Agents for Scientific Discovery๋ AI ๊ณผํ์ ์์คํ
์ ๊ตฌ์กฐ์ ๋ชจ๋, ๊ฒ์ฆ-ํด์์ฑ์ ํ์์ฑ์ ์ด์ฒด์ ์ผ๋ก ์ ์ํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
137์ ๊ณผํ์ ๋ฐ๊ฒฌ์ ์ํ ์์จ ์์ด์ ํธ ์ค์ผ์คํธ๋ ์ด์
์ ์ด๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ๊ณผํ ๋ฐ๊ฒฌ ์์ด์ ํธ์ ์ด๋ก ์ ยท๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ฌํ์ฑ ์๋ ํ๊ฐ ์์คํ
๊ตฌ์ถ์ ์ํ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Autonomous Agents for Scientific Discovery๋ ์์ด์ ํธ ๊ธฐ๋ฐ ์คํ ์ค๊ณยท๊ณผํ์ ์ธ์ฌ์ดํธ ๋์ถ ๊ฐ๋
์ ์ ์, 3132์ ์๋ํ๋ ์ค๋ช
๋ฐ bias ์ง๋จ ๋ฐฉ๋ฒ๋ก ์ ์ด๋ก ์ ํ ๋๊ฐ ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์จ ์คํ ์ค๊ณ ๋ฐ ์ํ์ ์ํ AI ์์ด์ ํธ ์์คํ
์ผ๋ก ์ ์ฌํ ์ ๊ทผ๋ฒ์ ๊ณต์ ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ค์ค ์์ด์ ํธ AI ์์คํ
์ ํ์ฉํ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ๋์์ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ ๋ฐ๊ฒฌ ์๋ํ๋ฅผ ์ํ ์์จ ์์ด์ ํธ ์์คํ
์ ์ ์ฌํ ์ ๊ทผ ๋ฐฉ์์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ๊ธฐ๋ฐ ์ฐ๊ตฌ ์ง์ ์์คํ
์ ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ก ์ผ๋ก ์ ๊ทผํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์จ ๊ณผํ ์์ด์ ํธ์ ๋ฅ๋ ฅ๊ณผ ํ๊ณ๋ฅผ ํ์ํ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
137๋ฒ ๋
ผ๋ฌธ์ ๊ณผํ์ ๋ฐ๊ฒฌ์ ์ํ ํตํฉ ์์ด์ ํธ ์์คํ
์ ๊ตฌ์ฒด์ ํจ๋ฌ๋ค์์ ์ ์ํด, 834๋ฒ ๋
ผ๋ฌธ์ ๋ฌธ์ ์์์ ํด๊ฒฐ๋ฐฉ์์ ์ ๊ณตํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Towards an AI co-scientist ๋
ผ๋ฌธ์ ์ธ๊ฐ-์์ด์ ํธ ํ์
๊ธฐ๋ฐ ์๋ ๊ณผํ ์ฐ๊ตฌ ํ๋ก์ ํธ๋ฅผ ์คํํ๋ ค๋ ๋ฐฉํฅ์ฑ๊ณผ ๊ตฌ์ฒด ์ฌ๋ก๋ฅผ ์ ๊ณตํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
363๋ฒ ๋
ผ๋ฌธ์ ์์ด์ ํธ ๊ธฐ๋ฐ ๊ฐ์ค ํ์ ๋ฐ ์๋ ์คํ ํ๊ฐ ๋ฐฉ์์ ์ถ๊ฐ๋ก ์ ๊ตํํ์ฌ, 137๋ฒ์ ๊ณผํ ์๋ํ ํ๋ฆ์ ๋ณด๊ฐํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Autonomous Agents for Scientific Discovery ๋
ผ๋ฌธ์ ์ค์ ํ์ฅ ์ ์ฉ์ ์ํ ์์ด์ ํธ ๊ธฐ๋ฐ ๊ณผํ ์๋ํ ์ฌ๋ก์ ํ๋ ์์ํฌ๋ฅผ ํฌ๊ด์ ์ผ๋ก ์ ์ํด, ์ด๋ก ์ ๋
ผ์์ ์ค์ฉ์ ์ฐ๊ณ๋ฅผ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
Accelerating scientific discovery with Co-Scientist ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์์จ ์์ด์ ํธ๊ฐ ๊ณผํ ๋ฐ๊ฒฌ์์ ์ด๋ป๊ฒ ์ธ๊ฐ๊ณผ ์ํธ์์ฉํ ์ง ๊ณ ์ฐฐํ์ฌ, ์ง๋ฅํ ๊ณผํ์๋ํ์ ๋ฏธ๋์์ ๋ณด์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ์ ์ถ๋ก ๋ฐ ์คํ ์๋ํ์์ LLM ๋ค์ค ์์ด์ ํธ ํ๋ ฅ์ ๋ํ ์ค์ ์ ์ฉ ์ฌ๋ก๋ฅผ ์ ๊ณตํด, ๋ณธ ์ฐ๊ตฌ์ ์๋ํ ํ์ดํ๋ผ์ธ ๊ตฌ์ถ๊ณผ ์ฐ๊ฒฐ๋ฉ๋๋ค.
์์ฉ ์ฌ๋ก
The Virtual Lab ๋
ผ๋ฌธ์ ๋๊ท๋ชจ ๋ค์ค ์์ด์ ํธ๊ฐ ์ค์ ์คํ์ ๊ณผํ ๋ฌธ์ (์: ๋จ๋ฐฑ์ง ๊ตฌ์กฐ)์์ ์ด๋ป๊ฒ ํ์ ์ ์ผ๋ก ๊ธฐ์ฌํ ์ ์๋์ง ๋ณด์ฌ์ค๋๋ค.
๋ฐ๋ก /๋นํ
137๋ฒ ๋
ผ๋ฌธ์ AI Scientist์ ์ด์์ ์๋ํ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ ๋ฐ๋ฉด, 081๋ฒ์ ์คํ๋ ฅ ๋ถ์กฑ์ ํ๊ณ๋ฅผ ๋นํ์ ์ผ๋ก ๋ถ์ํฉ๋๋ค.