Essence
Figure 1: The AI Scientist์ ๊ฐ๋
๋ - ์์ด๋์ด ์์ฑ๋ถํฐ ๋
ผ๋ฌธ ์์ฑ ๋ฐ ์๋ ๋ฆฌ๋ทฐ๊น์ง์ ์ ์ฒด ํ์ดํ๋ผ์ธ
๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ ์์ ์๋ํ๋ ๊ณผํ ์ฐ๊ตฌ ์ํ ์์คํ
์ผ๋ก, ์์ด๋์ด ์์ฑ์์ ์คํ ์ํ, ๋
ผ๋ฌธ ์์ฑ, ๋๋ฃ ๊ฒํ ๊น์ง ์ ์ฒด ๊ณผํ ์ฐ๊ตฌ ํ๋ก์ธ์ค๋ฅผ ์๋์ผ๋ก ์ฒ๋ฆฌํ ์ ์๋ค. ํ ํธ์ ๋
ผ๋ฌธ ์์ฑ์ 15๋ฌ๋ฌ ๋ฏธ๋ง์ ๋น์ฉ์ด ์์๋๋ฉฐ, ์๋ ๋ฆฌ๋ทฐ ์์คํ
์ด ์ธ๊ฐ ์์ค์ ๊ฐ๊น์ด ์ฑ๋ฅ์ผ๋ก ๋
ผ๋ฌธ ํ์ง์ ํ๊ฐํ๋ค.
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ์ ๋ฅ๋ ฅ์ ๊ณผํ ์ฐ๊ตฌ์ ์์ ์๋ํ๋ก ํ์ฅํ ํ๊ธฐ์ ์๋๋ก, ์ ๋น์ฉ ๊ณ ์๋์ ์๋ ์ฐ๊ตฌ ์ํ ๊ฐ๋ฅ์ฑ์ ์
์ฆํ์๋ค. ๋ค๋ง, ์์ฑ ๋
ผ๋ฌธ์ ์ค์ ํ์ ์ ๊ฐ์น, ๋ค์ํ ๋๋ฉ์ธ์ผ๋ก์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ, ๊ณผํ ์ถํ ์์คํ
์ ๋ฏธ์น ์ค๋ฆฌ์ ์ํฅ์ ๋ํ ์ฌ์ธต ๋ถ์์ด ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
795๋ ์คํ์๋๋ ๊ณผํ์ ๋ฐ๊ฒฌ ์๋ํ ์์คํ
์ ๋
ผ์ํ๋ฉฐ, 762์ ์ฐฝ์์ ์์ด๋์ด ์ ๋๋ ์ด์
์์คํ
์ ์ฐ๊ตฌ์ ๊ทผ๊ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
AI Scientist์ ๊ฐ๋
์ ๊ธฐ๋ฐ์ด ๋๋ 'The AI Scientist' ๋
ผ๋ฌธ์ ํตํด ์ ๋ฐ์ ์ธ fully-automated research ๋ฐฉํฅ์ฑ์ ์ดํดํ ์ ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
AI ๋๊ตฌ ์ฑํ์ด ๊ณผํ์ ์์ฐ์ฑ๊ณผ ํ์ ๋ฒ์์ ๋ฏธ์น๋ ์ํฅ ๋ถ์์ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
AIGS ๋
ผ๋ฌธ์ ai ์คํ ์๋ํ์ ๊ณผํ์ ๋ฐ์ฆ ์ค์ฌ ์ ๊ทผ์ผ๋ก, The AI Scientist์ ์คํ์๋๋ ๋ฐ๊ฒฌ ํ๋ก์ธ์ค ์๋ํ์ ๋์์ ํด๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
The AI Scientist ๋
ผ๋ฌธ์ ์์ ์๋ํ๋ ๊ณผํ ์ฐ๊ตฌ ํ๋ก์ธ์ค๋ฅผ ๊ตฌํํ๋ฉฐ, Human-in-the-loop ๊ธฐ๋ฐ ์ฐ๊ตฌ ์๋ํ ํ๋ฆ๊ณผ ๋์กฐ์ ์ผ๋ก ๋ณผ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
795๋ฒ์ ์คํ์๋๋ ๊ณผํ ์๋ํ๋ผ๋ ๋ชฉํ๋ฅผ ์ค์ ์์คํ
์ฌ๋ก๋ก ๋
ผ์ํด, 834๋ฒ์ ์ด๊ด์ ๊ณผ์ ์ ์์ ์ํธ๋ณด์์ ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Genesis ๋
ผ๋ฌธ์ ์์คํ
์๋ฌผํ ์ฐ๊ตฌ ์๋ํ๋ผ๋ ์ค์ ์ฐ๊ตฌ ์๋๋ฆฌ์ค์์ AI ๊ธฐ๋ฐ ์๋ ์ฐ๊ตฌ ์ํ ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
795 ๋
ผ๋ฌธ์ ์คํ์๋๋ ์๋ ๊ณผํ์ ์์คํ
์ ์๊ฐํ์ฌ, 038์ ์ฐ๊ตฌ ์๋ช
์ฃผ๊ธฐ ์๋ํ ํ๋ ์์ํฌ์ ๋ค๋ฅธ ๊ตฌํ์ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ด ๊ณผํ ์ฐ๊ตฌ ๋ฐฉ๋ฒ๋ก ์ ๋ฏธ์น๋ ์ํฅ์ ๋ค๋ฅธ ๊ด์ ์์ ๋ถ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
The AI Scientist ๋
ผ๋ฌธ์ ์ข
๋ฃํ ๊ณผํ ์คํ ์๋ํ์ ์ฑ๊ณต ์ฌ๋ก์ ํ๊ณ๋ฅผ ์ค์ฆ์ ์ผ๋ก ๋ณด์ฌ์ฃผ์ด, Exp-bench ๋ฐ์ดํฐ์ ์ฑ๋ฅ ์ฐจ์ด๋ฅผ ๋ช
๋ฃํ ๋ณด์ฌ์ค๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ์์ฑ ์ฐ๊ตฌ ์์ด๋์ด์ ํ์ ์ฑ ํ๊ฐ๋ฅผ ์ํ ๋ค๋ฅธ ์๋ํ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
795 ๋
ผ๋ฌธ์ 248์ ๊ณผํ ์คํ ์๋ํ ์๋ฐ์ฑ ํ๊ฐ์์ ํ๋ฐ ๋ ๋์๊ฐ ์ฐ๊ตฌ ์๋ํ ์ ์ฒด ํ์ดํ๋ผ์ธ์ LLM agent๋ฅผ ์ ์ฉํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
795๋ฒ ๋
ผ๋ฌธ์ AI Scientist์ ์ด์ฐฝ๊ธฐ ๋ฒ์ ์ ์๊ฐํ๋ฉฐ ์๋ ๊ณผํ ๋ฐ๊ฒฌ ํ๋ ์์ํฌ์ ๋ฐ์ ๊ณผ์ ์ ์ดํดํ๊ธฐ ์ํด ๊ฐ์ด ์ฝ์ผ๋ฉด ์ข์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
The AI Scientist ๋
ผ๋ฌธ์ ์์ ์๋ ๊ณผํ ์ฐ๊ตฌ ์์คํ
์ ๋ค๋ฃจ๊ณ ์์ด AI-Researcher์ ์ค์ํ ๋น๊ต ๋์์ด ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ๋๊ตฌ๊ฐ ๊ณผํ ์ฐ๊ตฌ์ ๋ฏธ์น๋ ์ํฅ์ ๋ค๋ฅธ ๋ฐ์ดํฐ ๋ถ์ ๋ฐฉ๋ฒ์ผ๋ก ์ธก์ ํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ๊ณผํ-์ ์ฑ
๋ณํ ๋ฅ๋ ฅ์ ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ก ์ผ๋ก ํ๊ฐํ๋ ๋์์ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery ๋
ผ๋ฌธ์ end-to-end ๊ณผํ ์๋ํ๋ผ๋ ์ ์ฌ ๋ชฉํ๋ฅผ ๊ฐ๊ณ OmniScientist์ ๋ค๋ฅธ ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI์ ๊ณผํ ์ฐ๊ตฌ ์ตํฉ์ ํํฉ๊ณผ ๋ฏธ๋๋ฅผ ๋ค๋ฃจ๋ ์ ์ฌํ ์๋ฒ ์ด ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI Scientist v2๋ ์ฐ๊ตฌ ์๋ํ์ ํ์ค์ ์ด๋ ค์, ์ต์ ํ๋ ํ์ดํ๋ผ์ธยท์ํฌํ๋ก์ฐ ๊ตฌํ ๋ฑ, end-to-end ์๋ํ์ ๋ ๋ค๋ฅธ ์ฑ๊ณต ์ฌ๋ก๋ฅผ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
The AI Scientist: ์๋ ๊ณผํ๋ฐ๊ฒฌ์ ๊ตฌ์ฒด์ ๊ตฌํ์ ํตํด Nobel Turing Challenge์ ๋น์ ์ ์ค์ง์ ์ผ๋ก ๋ฐ์ ์ํค๊ณ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
The AI Scientist ๋
ผ๋ฌธ์ AI4Science์ ์๋ํ ๋ฐ ํจ๋ฌ๋ค์์ ์ ํ์ ์ค์ fully automated scientist ๊ตฌํ ์ฌ๋ก๋ก ํ์ฅํด์ ๋ค๋ฃฌ๋ค.
ํ์ ์ฐ๊ตฌ
CycleResearcher๋ ๋
ผ๋ฌธ ์์ฑ-๋ฆฌ๋ทฐ-๊ฐ์ ์ ์ํ์ ์๋ํ์ ์ธ๊ฐ ์ ๋ฌธ๊ฐ ์์ค์ ๋ฆฌ๋ทฐ ์ฑ๋ฅ ๋น๊ต๋ฅผ ์ค์ฆํ์ฌ, AI Scientist์ ์๋ํ๋ ์ฐ๊ตฌ ์ฌ์ดํด์ ๋ณด์์ ์ผ๋ก ์ดํ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
795 ๋
ผ๋ฌธ์ 844์ LLM ์ ๋ ์ง๋ฅ ํ๊ฐ๋ฅผ ๋์ด, AI Scientist๋ก์์ LLM ์๋ ๊ณผํ ๋ฐ๊ฒฌ ํ
์คํธ๋ฅผ ๋ฐ์ ์ํต๋๋ค.
ํ์ ์ฐ๊ตฌ
795๋ SOTA ์์ค ์๋ ๊ณผํ๋ฐ๊ฒฌ ์์ด์ ํธ ๊ฐ๋ฐ์ ์ถ๊ตฌํ๋ฉด์, 922์์ ๋ณด์ฌ์ค ์ธ๊ฐ+AI ์กฐํฉ์ ๊ฐ๋ฅ์ฑ์ ์๋ํ ์์ค๊น์ง ์ด๋๋ค.
ํ์ ์ฐ๊ตฌ
The AI Scientist ๋
ผ๋ฌธ์ Sparks์ ์ ์ฌํ๊ฒ ์์ ์๋ํ๋ ๊ณผํ์ AI ์์คํ
์ ์คํ ๊ฐ๋ฅ์ฑ์ ๋ค์ํ ๊ณผํ ๋ถ์ผ์์ ์ถ๊ฐ๋ก ์
์ฆํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery๋ LLM ๊ธฐ๋ฐ AI-๊ณผํ์ ์์คํ
์ ๊ฐ์กฐํ๋ฉฐ, ํด์ ๊ฐ๋ฅ์ฑ๊ณผ ์ํธ์์ฉ ๋ชจ๋ ๊ฐ๋
๊ณผ ์ฐ๊ด์ง์ด ๋ณผ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
The AI Scientist-v2 ๋
ผ๋ฌธ์ ํ์ธต ๋ ์งํ๋ ์๋ํ ์ํฌ์๊ธ ๊ณผํ ๋
ผ๋ฌธ ์์ฐ ๋ฐ ํ๊ฐ ์์คํ
์ผ๋ก, ์ด๊ธฐ AI Scientist ์์คํ
์ ์ ์ฌ๋ ฅ๊ณผ ํ๊ณ๋ฅผ ์ค์ง์ ์ผ๋ก ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
AI-Researcher ๋
ผ๋ฌธ๋ ๊ณผํ ์ฐ๊ตฌ ์ ์ฒด ํ์ดํ๋ผ์ธ์ ์๋ํํ๋ AI ์์คํ
์ ๋ค๋ฃจ์ด AI Scientist๊ฐ ์ ์ํ๋ ์คํ์๋๋ ์๋ํ์ ์ผ๋งฅ์ํตํ๋ค.
ํ์ ์ฐ๊ตฌ
The AI Scientist(795)๋ ์์ ์๋ํ ๊ณผํ ํ๋ ์์ํฌ์ ์งํฅ์ ์ ์ ์ํ๋ฉฐ, 436์์ ๊ตฌํ๋ ์ฐ๊ตฌ ์ ๊ณผ์ ์๋ํ์ ํ์ฅ ๋น์ ๊ณผ ๋ง๋ฟ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
795๋ฒ ๋
ผ๋ฌธ์ fully automated open-ended AI scientist ์์คํ
๊ฐ๋ฐยท์์์ ์ค์ ์ ๋์ด, 352๋ฒ์ Agentic Science ํจ๋ฌ๋ค์์ ์ค์ง์ ์ผ๋ก ๊ตฌํํ๋ค.
ํ์ ์ฐ๊ตฌ
The AI Scientist-v2 ๋
ผ๋ฌธ์ ๊ณผํ ํจ๋ฌ๋ค์ ์ ํ์์ ์ค์ fully-automated open-ended discovery system ๊ตฌํ ์ฌ๋ก๋ก ์ด์ด์ง๋ค.
ํ์ ์ฐ๊ตฌ
795๋ฒ์ AI Scientist ์์คํ
์ ์ ๋ขฐ์ฑ๊ณผ ์ ๋ขฐ ๋ฉํธ๋ฆญ ์ ์ฉ, ์ค์ ๋ฐ๋ณต ๊ฐ๋ฅ์ฑ๊ณผ ์์ ์ฑ ๋ฌธ์ ๋ฅผ ์ฌํํ์ฌ ๋
ผ์ํ๋ค.
ํ์ ์ฐ๊ตฌ
795๋ฒ ๋
ผ๋ฌธ์ ์์ ์๋ํ๋ ์คํ์๋๋ ๊ณผํ ์ํฌํ๋ก์ฐ AI(โAI Scientistโ)๋ฅผ ์ ์ํด, 3090์ ํตํฉ biosequence ์ค๊ณ ํ๋ ์์ํฌ์ ๋ฏธ๋ ๋ฐฉํฅ ์ ์์ ๋์์ ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
The AI Scientist๋ Fully Automated Open-Ended Scientific Discovery๋ฅผ ํตํ AlphaFold ๋ฑ ์ค์ง ๊ณผํ ๋ฐ์ ์ํฅ ํ๊ฐ์ ๋ํ ์ฌ๋ก ํ์ฅ์ฐ๊ตฌ๋ก, 3130์ ์ค์ฆ๋ถ์์ ๋ณด์ํ๋ค.
ํ์ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ์๋ ๊ณผํ ์คํยท๋ฐ๊ฒฌ์ ์๋ํฌ์๋ ์๋ํ ์์คํ
์ ๋ฐ์ ๋ฐฉํฅ์ ๋ณด์ฌ์ค.
์์ฉ ์ฌ๋ก
Discovering symbolic differential equations with symmetry in AI Scientist ์์คํ
์์ ์์ฑ๋ ๋
ผ๋ฌธ ๋ฐ ์์ด๋์ด๋ฅผ ์ค์ ์ํ์ ๊ณต์ ๋ฐ๊ฒฌ ๋ฌธ์ ์ ์ ์ฉํฉ๋๋ค.
์์ฉ ์ฌ๋ก
The AI Scientist ๋
ผ๋ฌธ์ LLM์ ์ค์ ๊ธฐ์ ์ ์๊ฐ์ฑ์ฅ ๋ฐ ์ง์ ํ์ฉ ํ๊ณ๋ฅผ ์คํ์ ์ผ๋ก ๋ณด์ฌ์ฃผ๋ฉฐ, ์๋ํ ๊ณผํ ์ํ์์ expertise assessment์ ์ค์ ์ ์๋ฏธ๋ฅผ ์ ๊ณตํ๋ค.
๋ฐ๋ก /๋นํ
๋ ๋ค AI Scientist์ ํ๊ณ์ ๊ฐ๋ฅ์ฑ์ ๋นํ์ ์ผ๋ก ํ๊ฐํ๋ ๋
ผ๋ฌธ์ผ๋ก, ๊ฐ์์ ์คํ์ ๋ถ์์ ๊ธฐ๋ฐํด ์๋ก์ ๊ฒฐ๋ก ์ ํ์ธยท๋ณด์ํ ์ ์์ต๋๋ค.
๋ฐ๋ก /๋นํ
Towards a Science of AI Agent Reliability๋ ์๋ํ ๊ณผํ ์์คํ
์ ์ ๋ขฐ์ฑยทํ๊ณ๋ฅผ ์ง์ค์ ์ผ๋ก ๋
ผ์ํ๋ฉฐ, AI Scientist์ ์ค์ฉ์ฑ/ํ๊ณ์ ๊ท ํ ์๊ฒ ์ฝ๊ธฐ ์ข๋ค.
๋ฐ๋ก /๋นํ
์์ ์๋ํ๋ AI ๊ณผํ์ ์์คํ
์ ์ถ๊ตฌ์, ์ธ๊ฐ์ค์ฌ ๊ฒ์ฆ ๊ฐ์กฐ๋ผ๋ ๊ด์ ์์ ์๋ฐ๋ ์๊ฐ์ ์ ๊ณตํฉ๋๋ค.