์ ์: Shuo Ren, Can Xie, Pu Jian, Zhenjiang Ren, Chunlin Leng, Jiajun Zhang | ๋ ์ง: 2025-03-31 | DOI: [์ ๊ณต๋์ง ์์] 📄 PDF
Essence
๊ทธ๋ฆผ 1: LLM ๊ธฐ๋ฐ ๊ณผํ ์์ด์ ํธ์ ์ ํ์ ์ธ ์ํคํ
์ฒ
๋ณธ ๋
ผ๋ฌธ์ ๊ฐ์ค ์์ฑ, ์คํ ์ค๊ณ, ๋ฐ์ดํฐ ๋ถ์ ๋ฑ ๊ณผํ์ ๋ฐ๊ฒฌ ์ ๊ณผ์ ์ ์๋ํํ๋ LLM ๊ธฐ๋ฐ ๊ณผํ ์์ด์ ํธ(Scientific Agent)์ ์ํคํ
์ฒ, ์ค๊ณ, ๋ฒค์น๋งํฌ, ์์ฉ, ์ค๋ฆฌ์ ๊ณ ๋ ค์ฌํญ์ ํฌ๊ด์ ์ผ๋ก ๊ฒํ ํ ์๋ฒ ์ด ๋
ผ๋ฌธ์ด๋ค. ์ผ๋ฐ ๋ชฉ์ ์ LLM๊ณผ ๋ฌ๋ฆฌ ๋๋ฉ์ธ ํนํ ์ง์, ๊ณ ๊ธ ๋๊ตฌ ์งํฉ, ๊ฐ๊ฑดํ ๊ฒ์ฆ ๋ฉ์ปค๋์ฆ์ ํตํฉํ์ฌ ์ฌํ์ฑ ์๋ ๊ณผํ์ ๋ฐ๊ฒฌ์ ์ฃผ๋ํ๋ค.
How
๊ทธ๋ฆผ 1: ์ ํ์ LLM ๊ธฐ๋ฐ ๊ณผํ ์์ด์ ํธ์ ์ํฌํ๋ก์ฐ
์ํคํ
์ฒ ๋ฐ ๋ฉ์ปค๋์ฆ ์ค๊ณ:
- Planner ๋ฉ์ปค๋์ฆ: ์ฌ์ฉ์์ ๊ณผํ ๋ฌธ์ ๋ฅผ ๋ถ๋ถ ๊ณผ์ (sub-task)๋ก ๋ถํดํ๊ณ , ๋ฉ๋ชจ๋ฆฌ์์ ๋งฅ๋ฝ/์ง์์ ๊ฒ์, ์ก์
์คํ์ด์ค๋ฅผ ํตํด ๋๊ตฌ ํธ์ถ ์กฐ์จ. Prompt ๊ธฐ๋ฐ (๋ช
์์ ํ
ํ๋ฆฟ, ๋งฅ๋ฝ ๋ณด๊ฐ, ์๊ธฐ ์ฑ์ฐฐ, ํ์ ๊ธฐ๋ฐ, ์ญํ ์ํธ์์ฉ, ํ๋ก๊ทธ๋๋ฐ ๊ธฐ๋ฐ)๊ณผ ํ์ต ๊ธฐ๋ฐ(๋๋ฉ์ธ ๋ฏธ์ธ์กฐ์ , ๊ฐํํ์ต) ๋ ๊ฐ์กฑ์ผ๋ก ๊ตฌ๋ถ
- Memory ๋ฉ์ปค๋์ฆ: ๊ณผ๊ฑฐ ์คํ ๊ถค์ , ๊ฒ์๋ ๋ฌธํ, ๋๋ฉ์ธ ์ง์ ๋ฒ ์ด์ค, ๊ฒ์ฆ ๊ฒฐ๊ณผ ๋ฑ์ ์ ์ฅํ์ฌ ์ดํ ๊ฒฐ์ ์ ์ ์ ํ์ฉ
- Action Space: API ํธ์ถ, ์ฝ๋ ์คํ, ์๋ฎฌ๋ ์ดํฐ ์ํธ์์ฉ, ๋ฌธํ ๊ฒ์ ๋ฑ ๋ค์ํ ์ธ๋ถ ๋๊ตฌ ๋ฐ ํ๊ฒฝ๊ณผ์ ์ธํฐํ์ด์ค
- Verifier: ์ค๊ฐ ๊ฒฐ๊ณผ์ ์ ํ๋, ์ผ๊ด์ฑ, ๊ณผํ์ ํ๋น์ฑ์ ๊ฒ์ฆํ๊ณ , ์ถ๊ฐ ์ก์
๋๋ ์์ ์ด ํ์ํ ๊ฒฝ์ฐ Planner์ ํผ๋๋ฐฑ ์ ๊ณต
๋ฐ๋ณต ํ๋ก์ธ์ค: ์ฌ์ฉ์ ์ฟผ๋ฆฌ โ Planner ๋ถํด โ Memory ๊ฒ์ โ Action Space ์คํ โ Verifier ๊ฒ์ฆ โ ๋ฉ๋ชจ๋ฆฌ ์ ์ฅ โ (ํ์์ ์ฌ๊ณํ) โ ์ต์ข
๊ฒฐ๊ณผ ๋ฐํ
Evaluation
Novelty: 4/5 Technical Soundness: 3.5/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ณผํ ์์ด์ ํธ์ ๋ํ ์ฒซ ์ฒด๊ณ์ ๋ฉ์ปค๋์ฆ ์ค์ฌ ๋ถ์์ ์ ๊ณตํ๋ฉฐ, 120+ ๋
ผ๋ฌธ๊ณผ 40+ ๋ฒค์น๋งํฌ๋ฅผ ์ ๋ฆฌํ ํฌ๊ด์ ์์์ผ๋ก์์ ๊ฐ์น๊ฐ ํฌ๋ค. ๋ค๋ง ์ ๊ณต๋ ๋ณธ๋ฌธ์์๋ ์ํคํ
์ฒ ๊ฐ์๋ง ๋ค๋ฃจ์ด Memory, Action Space, Verifier, Benchmarks, Applications, Ethics์ ๋ํ ์ค์ง์ ๋ด์ฉ์ด ๋ถ์กฑํ๋ฉฐ, ์ค์ฆ์ ์ฑ๋ฅ ๋น๊ต์ ๋๋ฉ์ธ ๊ฐ ์ ์ด ๊ฐ๋ฅ์ฑ์ ๋ํ ์ ๋์ ํ๊ฐ๊ฐ ํ์ํ๋ค. ์์ฑ๋ ์๋ฒ ์ด๋ก์๋ ๋์ ์ฐธ๊ณ ๊ฐ์น๋ฅผ ๊ฐ์ง ๊ฒ์ผ๋ก ์์๋๋, ํ์ฌ ์ ์๋ ๋ณธ๋ฌธ๋ง์ผ๋ก๋ ๋ฉ์ปค๋์ฆ ๋ถ๋ฅ์ ๋ช
ํ์ฑ๊ณผ ์ค์ฉ์ ์ค๊ณ ๊ฐ์ด๋๋ผ์ธ์ ์ฃผ๋ก ์์กดํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
835๋ LLM ๊ธฐ๋ฐ AI ๊ณผํ์ ํ๋ ์์ํฌ์ ๊ธฐ์ ์ ๋ฉํ์๋ฒ ์ด๋ก, 817์ AI-made scientist ํ ๊ตฌ์ถ์ ํ์์ ๊ฐ๋
์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM ์ถ๋ก ์์ AI ์์ด์ ํธ๋ก์ ์ ์ด ๋ฐ ๊ตฌ์กฐ์ ๊ตฌ์ฑ์ ๋ํ ํฌ๊ด์ ์๋ฒ ์ด๋ก 835๋ฒ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
081์ ๋
ผ์ง๋ 835 ๋
ผ๋ฌธ์ ๋๊ท๋ชจ LLM ๊ธฐ๋ฐ ๊ณผํ ์ฐ๊ตฌ ์๋ํ ํ๋ ์์ํฌ ํํฉ๊ณผ ํ๊ฐ๋ฅผ ๊ธฐ๋ฐ ์ผ์ ๋นํ์ ์ผ๋ก ์ฝ์ด์ผ ํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ์ง์ ๋ฐ๊ฒฌ์ ์ํ LLM ์์ด์ ํธ ์์คํ
์ ์ด๋ก ์ ํ ๋์ ๋ค์ํ ํ์ฉ ์ฌ๋ก๋ฅผ ๋ค๋ฃจ๊ณ ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ์ถ๋ก ๊ณผ LLM ๊ธฐ๋ฐ AI-๊ณผํ์ ํ๋ ์์ํฌ์ ๋๊ท๋ชจ ์๋ฒ ์ด๋ก, ๋ฌผ๋ฆฌ ๋ฌธ์ ์ ํด์์ฑ๊ณผ ๊ฒ์ฆ์ฑ์ ์ด์ ์ ๋ง์ถ ์ฐ๊ตฌ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
From Automation to Autonomy ๋
ผ๋ฌธ์ LLM์ ๊ณผํ ์๋ํ ์์คํ
์ ์ ์ฉํ๊ธฐ ์ํ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ก ๊ณผ ํํฉ์ ํฌ๊ด์ ์ผ๋ก ์ ๋ฆฌํด, ๋ณธ ๋
ผ๋ฌธ์ ์ด๋ก ์ ํ ๋๊ฐ ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Towards Scientific Intelligence: A Survey of LLM-based Scientific Agents๋ LLM ๊ธฐ๋ฐ AI ์ฐ๊ตฌ์agent์ ์ญํ ๊ณผ ํ๊ณ์ ๋ํด ์ด๊ด์ ์ผ๋ก ๋ค๋ฃจ์ด, 857์ AI ์ฐ๊ตฌ์ ์ฐธ์ฌ ํ๋ ๋
ผ์์ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
835๋ฒ์ LLM ๊ธฐ๋ฐ ๊ณผํ ์ง๋ฅ ๋ฐ ์์ด์ ํธ ๊ตฌ์กฐ์ ์ต์ ๋ํฅ์ ๊ฐ๊ดํ์ฌ, PersonaAI์ ๋ฐฐ๊ฒฝ ์ด๋ก ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฐ์ดํฐ ๋ชจ๋ธ๋ง ์์
์์ AI ์์ด์ ํธ์ ์ฑ๋ฅ์ ํ๊ฐํ ์ ์ฌ ๋ฒค์น๋งํฌ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ์์ด์ ํธ ๊ธฐ๋ฐ ์ฐ๊ตฌ(์คํ ๋ฆฌ์์น)์ ๋น์ ๊ณผ ํ์ํ ์ญ๋์ ๋
ผ์ํ ๋
ผ๋ฌธ์ผ๋ก, ๊ณผํ ์์ด์ ํธ์ ๋ฏธ๋์ ๋ํ ์
์ฒด์ ๋
ผ์๋ฅผ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ ์ฝ ๋ฐ๊ฒฌ ๊ณผ์ ์์ ๋ฉํฐ-์์ด์ ํธ ์์คํ
์ ์ฑ๋ฅ๊ณผ ์์จ์ฑ์ ํ๊ฐํ๋ ๊ด๋ จ ๋ฒค์น๋งํฌ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ์ ๊ฐ์ค ์์ฑ์ ์ํ LLM ๊ธฐ๋ฐ ๋ฉํฐ์์ด์ ํธ ์์คํ
์ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ์ ๊ฐ์ค ๋ฐ๊ฒฌ ์๋ํ์ ์ต์ ๋ํฅ๊ณผ ๊ธฐ์ ์ ํ๊ณ์ ๋ํ ์๋ฒ ์ด๋ก์, LLM ๊ธฐ๋ฐ ๊ณผํ ์์ด์ ํธ ์๋ฒ ์ด์ ์ํธ๋ณด์์ ์ผ๋ก ์ฝ์ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ ์ ์ฒด ๋๋ ํธ๋์คํฌ๋ฆฝํ ๋ฏน ๋ฐ์ดํฐ ๋ถ์์ ์ํ ์์จ ๋จธ์ ๋ฌ๋ ์์คํ
์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
352๋ฒ ๋
ผ๋ฌธ์ ์์จ ๊ณผํ AI์์ด์ ํธ ๊ด๋ จ ์ต์ ๊ธฐ์ ๊ณผ ๋์ ๊ณผ์ , ๋ฐ์ ๋ฐฉํฅ์ ํฌ๊ด์ ์ผ๋ก ์๋ฒ ์ด ํ์ฌ ์ํธ ๋น๊ต๊ฐ ์ฉ์ดํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ ๋ฐ๊ฒฌ ์๋ํ๋ฅผ ์ํ ์์จ ์์ด์ ํธ ์์คํ
์ ์ ์ฌํ ์ ๊ทผ ๋ฐฉ์์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
Towards end-to-end automation of AI research ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ณผํ ์ฐ๊ตฌ ์์ด์ ํธ๋ฅผ ์ค์ ์ฐ๊ตฌ ์๋ํ์ ์ ์ฉํ ํ๋ ์์ํฌ๋ก, ๋ณธ ์๋ฒ ์ด์ ์ค๊ณ์ ๋น๊ตํ ๋งํ๋ค.
ํ์ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ๊ณผํ์ ์ง๋ฅ(AI Scientist)์ ๋ํ ์ข
ํฉ ๋ฆฌ๋ทฐ๋ก์, ๋ฐ์ดํฐ ๊ธฐ๋ฐ ํจ๋ฌ๋ค์๊ณผ AI ๋๊ตฌํ ๊ฒฝํฅ ๋
ผ์๋ฅผ ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Towards Scientific Intelligence๋ ๋ค์ํ๊ณ ์ฌ์ธต์ ์ธ ๊ณผํ LLM ์ง์ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ SciKnowEval์ ๋๊ท๋ชจ ๋ค๋จ๊ณ ์ง๋จ์ ๋ฐ์ ๋ฐฉํฅ์ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
Towards an AI co-scientist(825)๋ LLM ๊ธฐ๋ฐ ๊ณผํ์ ์์ด์ ํธ์ ์ค์ ์ ์ฉ ๋ฐฉํฅ๊ณผ ๋์ ๊ณผ์ ๋ฅผ ๋
ผ์ํ๋ฏ๋ก, 835 ์ฐ๊ตฌ์ ๋ฒ์๋ฅผ ํ์ฅํด์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
506๋ฒ ๋
ผ๋ฌธ์ LLM์ ํ์ฉํ ๋ฐ์ดํฐ ์ฃผ๋ ๊ณผํ์ ํ๊ตฌ ์๋ํ์ ์ธ๋ถ ์ฐ๊ตฌ ํธ๋ ๋๋ฅผ ์ถ๊ฐ์ ์ผ๋ก ์ ๊ณตํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
835๋ฒ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ณผํ ์์ด์ ํธ ์ ์ฒด ๋ํฅ์ ์๋ฒ ์ดํ์ฌ, 794๋ฒ ๋
ผ๋ฌธ์์ ์ ์ํ AI Scientist์ ์ ์ฌ ์์คํ
์ ๋ฐ์ ์์์ ๊ฒํ ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ๊ณผํ์ ์ง๋ฅ(Scientific Intelligence)์ ๋ํ ํฌ๊ด์ ์๋ฒ ์ด๋ก, ์์ด์ ํฑ ์ฌ์ด์ธ์ค ๊ฐ๋
์ ํ์ฅ์ ๋
ผ์๋ฅผ ์ ๊ณตํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ ํ๊ตฌ ๋ถ์ผ์์ LLM ๊ธฐ๋ฐ AI Scientist ์์คํ
์ ๋ฐ์ ์ฒด๊ณ์ ์ผ๋ก ๊ฒํ ํ๊ณ , OmniScientist ํ๋ ์์ํฌ์ ์ ์ฌํ ์ฌ๋ก๋ฅผ ์ ๋ฆฌํฉ๋๋ค.
์์ฉ ์ฌ๋ก
794๋ฒ ๋
ผ๋ฌธ์ด AI Scientist-v2๋ผ๋ ์ค์ ์๋ ๊ณผํ ๋ฐ๊ฒฌ ์์คํ
์ ๊ตฌํํ ์ฌ๋ก์ด๋ฏ๋ก, 835๋ฒ ์๋ฒ ์ด์ ์ ์ฉ ์์๋ก ์ ํฉํฉ๋๋ค.