Essence
Figure 1. An automated cycle of scientific discovery in the cognitive sciences. An experimentalist proposes experiments,
์ธ์ง๊ณผํ์์ ๋๊ท๋ชจ์ธ์ด๋ชจ๋ธ(LLM)๊ณผ ๊ธฐ์ด๋ชจ๋ธ(Foundation Models)์ ํ์ฉํ์ฌ ๊ณผํ์ ๋ฐ๊ฒฌ์ ์ ์ฒด ์ฌ์ดํด์ ์๋ํํ๋ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. ์คํ ์ค๊ณ, ํ๋ ๋ฐ์ดํฐ ์์ฑ, ๋ชจ๋ธ ํฉ์ฑ, ๋ฐ๋ณต ์ต์ ํ์ ๋ชจ๋ ๋จ๊ณ๋ฅผ in silico๋ก ๊ตฌํํ๋ ๊ณ ์์ ์๋ํ๋ ์ธ์ง๊ณผํ ์์ง์ด๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ LLM๊ณผ ๊ธฐ์ด๋ชจ๋ธ์ ํ์ฉํ ์ธ์ง๊ณผํ์ ์์ ์๋ํ๋ ๋ฐ๊ฒฌ ์์ง์ ์ ์ํ๋ ์ผ์ฌ์ฐฌ ๋น์ ์ผ๋ก, ๊ณผํ์ ๋ฐ๊ฒฌ ํ๋ก์ธ์ค๋ฅผ ๊ทผ๋ณธ์ ์ผ๋ก ์ฌ์ค๊ณํ๊ณ ๋๊ท๋ชจ ์ด๋ก ๊ฐ๋ฐ์ ๊ฐ๋ฅํ๊ฒ ํ๋ค. ๋ค๋ง ํ์ ์ธ์ด ํํ๋ ฅ, ํฉ์ฑ ๋ฐ์ดํฐ ํ๋น์ฑ, 'ํฅ๋ฏธ๋ก์' ํ๊ฐ์ ๊ฐ๊ด์ฑ, ์ค์ ์ธ๊ฐ ๊ฒ์ฆ์ด๋ผ๋ ์ค์ง์ ๋ฌธ์ ๋ค์ด ์ฌ์ ํ ํด๊ฒฐ ๋๊ธฐ ์ค์ด๋ฉฐ, ์ด๋ค์ ๊ทน๋ณตํด์ผ ์ง์ ํ ์๋ํ ๋ฐ๊ฒฌ์ด ํ์คํ๋ ์ ์์ ๊ฒ์ผ๋ก ๋ณด์ธ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ฐ์ค ๋ฐ๊ฒฌ ์๋ํ์ ์ด๋ก ์ ํ์ ํฌ๊ด์ ์ผ๋ก ์๊ฐํ๋ ์๋ฒ ์ด๋ก, ์ธ์ง๊ณผํ ๋ถ์ผ LLM ํ์ฉ์ ์ด๋ก ์ ๊ธฐ๋ฐ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ธ์ง๊ณผํ ๋ชจ๋ธ ํฉ์ฑ ๋ฐ ์๋ํ๋ฅผ ์ํ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
From Automation to Autonomy์์๋ LLM ๊ธฐ๋ฐ ๊ณผํ์ ๋ฐ๊ฒฌยท์๋ํ์ ์ด๋ก ์ ํ๋ ์์ํฌ๋ฅผ ๋ค๋ฃจ๋ฉฐ, ๋ณธ ๋
ผ๋ฌธ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
857์ AI ์ฐ๊ตฌ์์ ์ญํ , ํ๊ณ, ๋์ ๊ณผ์ ๋ฅผ ํ๊ตฌํ์ฌ, 188์ ์๋ํ ์ธ์ง๊ณผํ ์์ง์ ๋ฏธ๋์ ๋
ผ์์ ์ด๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
247์ LLM ๊ธฐ๋ฐ ๋ฌธํ์งํ ์๋ฎฌ๋ ์ด์
์ ์ธ์ง๊ณผํ ๋ด ์ฌํ์ ๋๋ ฅ ํ์ต ์ธก๋ฉด์์ 188๊ณผ ๋ฌธ์ ์ ๊ทผ์ ๋ค๋ฅด๋ ๊ด๋ จ์ฑ์ ๊ฐ์ง๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ํ์ฉํ ๊ณผํ์ ๋ฐ๊ฒฌ ์๋ํ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ฐ ๊ฒ์ฆ ์๋ํ๋ฅผ ์ํ AI ์์คํ
์ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
The AI Scientist-v2 ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์๋์ ๊ณผํ์ ๋ฐ๊ฒฌ์ ์ํฌํ๋ก์ฐ๋ฅผ ๋ค์ํ ๋ถ์ผ์ ๊ฑธ์ณ ํ๊ฐํ์ฌ, ์ธ์ง๊ณผํ ์ธ ๋ค๋ฅธ ๋ถ์ผ์ ์๋ํ ํ๋ ์์ํฌ์ ๋น๊ตํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ธ์ง๊ณผํ ์คํ ์ค๊ณ ์๋ํ๋ฅผ ์ํ LLM ํ์ฉ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ๊ธฐ๋ฐ ๊ณผํ ์ฐ๊ตฌ ์๋ํ ๋ฐ ์คํ ์ค๊ณ๋ฅผ ์ํ ์ ์ฌํ ์ ๊ทผ ๋ฐฉ์์ ์ฌ์ฉํ๋ค.
ํ์ ์ฐ๊ตฌ
188์ LLM์ด ์ธ๊ฐ ์คํ ๋์ฒด๋ฅผ ๋์ด ์ธ์ง๊ณผํ ์ ์ฒด์ ์๋ํ ์คํ ์์ง ๊ตฌ์ถ์ผ๋ก ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
825๋ ์ธ๊ณต์ง๋ฅ ๊ณต๋๊ณผํ์ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ, 188์ ์ธ์ง๊ณผํ ์ ์ฒด ์ฌ์ดํด ์๋ํ ๋น์ ์ ์ค์ ์ธ๊ฐ-AI ํ์
์ผ๋ก ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
Towards end-to-end automation of AI research ๋
ผ๋ฌธ์ AI ์ฐ๊ตฌ ์ ๊ณผ์ ์ ์๋ํํ๋ ๊ตฌ์ฒด์ ์์คํ
์์ค ์ฌ๋ก๋ฅผ ์ ์ํฉ๋๋ค.