Essence
Figure 1 | The AI Scientist-v2 Workflow. The workflow consists of several phases covering
The AI Scientist-v2๋ agentic tree search๋ฅผ ํ์ฉํ ์๋ ๊ณผํ ๋ฐ๊ฒฌ ์์คํ
์ผ๋ก, ์ธ๊ฐ ์์ฑ ์ฝ๋ ํ
ํ๋ฆฟ ์์กด์ฑ์ ์ ๊ฑฐํ๊ณ VLM ๊ธฐ๋ฐ ํผ๋๋ฐฑ์ ํตํฉํ์ฌ ์์ ํ AI๊ฐ ์์ฑํ ๋
ผ๋ฌธ์ด ์ค์ peer review๋ฅผ ํต๊ณผํ ์ฒซ ์ฌ๋ก๋ฅผ ๋ฌ์ฑํ๋ค.
Achievement
Figure 1 | The AI Scientist-v2 Workflow. The workflow consists of several phases covering
The AI Scientist-v2 ์์คํ
๊ฐ๋ฐ: ์ธ๊ฐ ํ
ํ๋ฆฟ ์์กด์ฑ ์ ๊ฑฐ ๋ฐ tree-based ์คํ ์คํ์ผ๋ก ์์จ์ฑ ํฅ์ | ์ฒซ AI ์์ฑ peer-reviewed ๋
ผ๋ฌธ: ICLR 2025 workshop์ ์ ์ถํ 3ํธ ์ค 1ํธ์ด ํ๊ท reviewer ์ ์ 6.33์ผ๋ก ์์ฉ ๊ธฐ์ค์ ์ด๊ณผํ์ฌ peer review ํต๊ณผ ๋ฌ์ฑ | VLM ๊ธฐ๋ฐ ํผ๋๋ฐฑ ๋ฉ์ปค๋์ฆ: figure์ caption์ ์ง, ๋ช
ํ์ฑ, ํ
์คํธ ํด์ ์ผ๊ด์ฑ ๊ฐ์ | ์คํ์์ค ๊ณต๊ฐ: ์์ ํ ์ฝ๋ ๋ฐ workshop ์คํ ๋ฐ์ดํฐ ๊ณต๊ฐ๋ก ํฅํ ์ฐ๊ตฌ ์ด์ง
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 5/5 Clarity: 4/5 Overall: 4/5
์ดํ: The AI Scientist-v2๋ agentic tree search์ VLM ํผ๋๋ฐฑ์ ํตํด ์๋ํ๋ ๊ณผํ ๋ฐ๊ฒฌ์ ์์จ์ฑ๊ณผ ๊น์ด๋ฅผ ์ ์๋ฏธํ๊ฒ ํฅ์์์ผฐ์ผ๋ฉฐ, AI ์์ฑ ๋
ผ๋ฌธ์ด ์ค์ peer review๋ฅผ ํต๊ณผํ ์ฒซ ์ฌ๋ก๋ก์ ๊ณผํ ์ฐ๊ตฌ์ AI ์๋ํ ๊ฐ๋ฅ์ฑ์ ์
์ฆํ๋ค. ๋ค๋ง workshop ์์ค์ ์ ํ, ๋ฎ์ ํต๊ณผ์จ(3ํธ ์ค 1ํธ), ๊ทธ๋ฆฌ๊ณ ์ฌ์ ํ ๊ณผํ์ ์๊ฒฉ์ฑ ๋ถ์กฑ์ด conference ์์ค์ ์ํฅ๋ ฅ์ผ๋ก์ ํ๋๋ฅผ ์ ์ฝํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
์๋ํ๋ ์คํ ๊ฒฐ๊ณผ ์ถ์ถ ๋ฐ ๋ฆฌ๋๋ณด๋ ์์ฑ์ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ ํ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์์จ AI ๊ณผํ ์ฐ๊ตฌ ์์คํ
๊ฐ๋ฐ์ ๊ธฐ๋ฐ์ด ๋๋ ๋ฐฉ๋ฒ๋ก ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
AI ๊ธฐ๋ฐ ๊ณผํ์ ๋ฐ๊ฒฌ ์๋ํ์ ์๋ฒ ์ด ๋
ผ๋ฌธ์ผ๋ก 794๋ฒ ๋
ผ๋ฌธ์ ์ ์ฒด ์ฐ๊ตฌ ๋งฅ๋ฝ์ ์ดํดํ๋ ๋ฐ ์ฐธ๊ณ ๊ฐ ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
795๋ฒ ๋
ผ๋ฌธ์ AI Scientist์ ์ด์ฐฝ๊ธฐ ๋ฒ์ ์ ์๊ฐํ๋ฉฐ ์๋ ๊ณผํ ๋ฐ๊ฒฌ ํ๋ ์์ํฌ์ ๋ฐ์ ๊ณผ์ ์ ์ดํดํ๊ธฐ ์ํด ๊ฐ์ด ์ฝ์ผ๋ฉด ์ข์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Virtual lab powered by 'AI scientists'(868)๋ ์๋ํ๋ AI ์คํ์ค์์ agentic scientific discovery๋ฅผ ๋ค์ํ ๋ฐฉ์์ผ๋ก ๊ตฌํํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
825์ AI ๊ณต๋ ๊ณผํ์ ์์คํ
๊ณผ 794์ ์๋ํ๋ AI ๊ณผํ ๋ฐ๊ฒฌ ์์คํ
์ ๋น์ทํ ๋ชฉ์ ์ด์ง๋ง ์ํคํ
์ฒ์ ์ ๊ทผ๋ฒ(๋ฉํฐ์์ด์ ํธ vs. ์ํฌ์ต ์์ค ์๋ํ)์ด ๋ฌ๋ผ ๋น๊ตํด ๋ณผ ๊ฐ์น๊ฐ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
The AI Scientist ์๋ฆฌ์ฆ๋ ์คํ์๋๋ ๊ณผํ ์ฐ๊ตฌ ์๋ํ์ ์ฑ๋ฅ ํ๊ฐ์ ์ง๋จ์ ํตํด MLRC-BENCH์ ๋ชฉ์ ์ด ์ ์ฌํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
The AI Scientist-v2๋ ์์ ์๋ํ๋ ๊ณผํ ๋ฐ๊ฒฌ ์์คํ
์ ํ๊ณ์ ๊ฐ์ ์ ํ
์คํธํ๋ ๋ฒค์น๋งํฌ๋ก, Sakana.ai AI Scientist์ ๋
๋ฆฝ์ ํ๊ฐ์ ์ํธ ๋ณด์์ ์ผ๋ก ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
The AI Scientist-v2 ๋
ผ๋ฌธ์ AI ์ฐ๊ตฌ์ ์์ด์ ํธ๊ฐ ์ค์ ๋
ผ๋ฌธ ์งํ๊น์ง ์ํํ๋ ์ ์ฒด ์๋ ์ฐ๊ตฌ ํ์ดํ๋ผ์ธ ๊ตฌํ ์ฌ๋ก๋ก, AI-Researcher์ ์ฒด๊ณ๋ณ ์ฑ๋ฅยทํ๊ณ๋ฅผ ๋น๊ตํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
The AI Scientist-v2 ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์๋์ ๊ณผํ์ ๋ฐ๊ฒฌ์ ์ํฌํ๋ก์ฐ๋ฅผ ๋ค์ํ ๋ถ์ผ์ ๊ฑธ์ณ ํ๊ฐํ์ฌ, ์ธ์ง๊ณผํ ์ธ ๋ค๋ฅธ ๋ถ์ผ์ ์๋ํ ํ๋ ์์ํฌ์ ๋น๊ตํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
Co-Scientist(3001)๋ AI ๊ณผํ์ ์์ด์ ํธ์ ๊ณผํ์ ๋ฐ๊ฒฌ ์๋ํ์ ๋ํ ๋ ๋ค๋ฅธ ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
817์ ํ ๊ธฐ๋ฐ AI ๊ณผํ์ ๊ฐ๋
์ ํ์ฅํ๋ฉฐ, 794์ ์ํฌ์ต ๋ ๋ฒจ ์๋ ๋ฐ๊ฒฌ์ ๋ค์ค ์์ด์ ํธ ๊ด์ ์์ ๋ฐ์ ์ํต๋๋ค.
ํ์ ์ฐ๊ตฌ
The AI Scientist-v2 ๋
ผ๋ฌธ์ ํ์ธต ๋ ์งํ๋ ์๋ํ ์ํฌ์๊ธ ๊ณผํ ๋
ผ๋ฌธ ์์ฐ ๋ฐ ํ๊ฐ ์์คํ
์ผ๋ก, ์ด๊ธฐ AI Scientist ์์คํ
์ ์ ์ฌ๋ ฅ๊ณผ ํ๊ณ๋ฅผ ์ค์ง์ ์ผ๋ก ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
285๋ฒ ๋
ผ๋ฌธ์ AI๊ฐ ์ค์ค๋ก ์ ์คํ์ ์ค๊ณยท์คํํ๋ '์คํ์๋๋ ์คํ ๋ฆฌ์์น'๋ฅผ ๋ชฉํ๋ก, ํธ๋ฆฌ ๊ตฌ์กฐ ์๋ ํ์์ ์ค์ ๋ก ์ด๋ป๊ฒ ๊ตฌํํ ์ ์๋์ง ํ์ฅ ์ค๋ช
ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
794๋ฒ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์์ด์ ํธ๊ฐ ์ค์ ์ํฌ์ ์์ค์ ๋ฌผ๋ฆฌํ ๋
ผ๋ฌธ์ ์์ฑํ๋ ์ฌ๋ก๋ฅผ ๋ค๋ฃจ์ด, 922๋ฒ ํ๊ณ AI ๋ํ์์ ํ์ฉ์ ์ค์ง์ ๊ฒฐ๊ณผ์ ๋ณด์๋๋ค.
ํ์ ์ฐ๊ตฌ
794๋ฒ ๋
ผ๋ฌธ์ ๋ ํฐ ๊ท๋ชจ์ AI Scientist ์์คํ
๊ด์ ์์ 671์์ ํ๊ฐํ ์ฝ๋ ๊ตฌํ ๋ฅ๋ ฅ์ ์ค์ ์๋ ๊ณผํ์ฐ๊ตฌ์ ์ด๋ป๊ฒ ์ ์ฉํ๋์ง ๋ณด์ฌ์ค๋ค.
ํ์ ์ฐ๊ตฌ
์ด๊ธฐ ๋ฒ์ AI Scientist ๋
ผ๋ฌธ์ LLM์ ์ ์ฃผ๊ธฐ ๊ณผํ ์ฐ๊ตฌ์ ์ ์ฉํ ์ค์ ์๋ํ ์ฌ๋ก๋ฅผ ์ ์ํ์ฌ, ์๋ฒ ์ด์ ๋ด์ฉ๊ณผ ์ค์ ๊ตฌํ ์์๋ฅผ ์ฐ๊ณํด๋ณผ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
835๋ฒ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ณผํ ์์ด์ ํธ ์ ์ฒด ๋ํฅ์ ์๋ฒ ์ดํ์ฌ, 794๋ฒ ๋
ผ๋ฌธ์์ ์ ์ํ AI Scientist์ ์ ์ฌ ์์คํ
์ ๋ฐ์ ์์์ ๊ฒํ ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
794์ AI Scientist v2 ๋
ผ๋ฌธ์ 090์ฒ๋ผ AI ์ฐ๊ตฌ์์ด์ ํธ ๋ฒค์น๋งํน์ ์ค์ ์ค์ฌ ํ๊ฐ๋ฅผ ๋ํ๋ฉฐ, ์๋ ์ฐ๊ตฌ ์์คํ
ํ๊ฐ์ ์ค์ ํ์ฅ ์ฌ๋ก๋ฅผ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
The AI Scientist-v2 ๋
ผ๋ฌธ์ AI ์์ฒ๋ชจ๋ธ์ ํ์ฉํด ์๋ ๋
ผ๋ฌธ ์์ฑ ๋ฑ ์ค์ ๊ณผํ ๋ฐ๊ฒฌ์ ์คํํ ์ฌ๋ก ์ฐ๊ตฌ๋ก Gemini ๊ธฐ๋ฐ ๊ณผํ ๊ฐ์ํ ๋
ผ๋ฌธ๊ณผ ์ง์ ์ฐ๊ฒฐ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
The AI Scientist-v2 ๋
ผ๋ฌธ์ AI ์ฐ๊ตฌ์์ ์์๊ถ ๋
ผ๋ฌธ ์์ฑ ๋ฑ ์๋-ํฌ-์๋ ๊ณผํ ์๋ํ์ ์งํ๋ ์ค์ฆ ์ฌ๋ก๋ฅผ ๋ณด์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Workshop ์์ค์์ ์ ์๋ํ๋ AI ๊ณผํ์ ์์คํ
์ ํ๊ตฌํ๋ฉฐ, Towards a Medical AI Scientist์ ์๋ฃํนํ ๋ชจ๋ธ์ ๋์ฑ ์ผ๋ฐํํฉ๋๋ค.
์์ฉ ์ฌ๋ก
AI ๊ธฐ๋ฐ ์ค์๊ฐ ์คํ ๊ธฐํ๊ณผ ์๋ ๋ฐ์ดํฐ ๋ถ์(432)์ AI Scientist-v2์ ์ํ ์์ ์๋ํ ๊ณผํ ์คํ์ ์ค์ ์ ์์ฉ ์ฌ๋ก๋ฅผ ๋ณด๊ฐํฉ๋๋ค.
์์ฉ ์ฌ๋ก
794๋ฒ ๋
ผ๋ฌธ์ด AI Scientist-v2๋ผ๋ ์ค์ ์๋ ๊ณผํ ๋ฐ๊ฒฌ ์์คํ
์ ๊ตฌํํ ์ฌ๋ก์ด๋ฏ๋ก, 835๋ฒ ์๋ฒ ์ด์ ์ ์ฉ ์์๋ก ์ ํฉํฉ๋๋ค.
์์ฉ ์ฌ๋ก
805๋ฒ ๋
ผ๋ฌธ์ ์ค์ ๋ฐ์ด๋ฌ์ค ๋จ๋ฐฑ์ง ๋์์ธ์์ ์์ ์๋ AI ์ฐ๊ตฌ์์ ์์ฉ ๊ตฌํ ์ฌ๋ก๋ฅผ ๋ณด์ฌ์ค๋๋ค.
๋ฐ๋ก /๋นํ
081์์ AI Scientist์ ์คํ์ ๊ตฌํ ํ๊ณ๊ฐ ์ง์ ๋์ง๋ง, 794์์๋ ์์ด์ ํฑ ์๋์ฐ๊ตฌ ์คํ ๊ฐ๋ฅ์ฑ์ ๊ธ์ ์ ์ผ๋ก ํ๊ฐํ๋ค.