The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic Tree Search

์ €์ž: Yutaro Yamada, Robert Tjarko Lange, Cong Lu, Shengran Hu, Chris Lu | ๋‚ ์งœ: 2025.04 | DOI: N/A 📄 PDF


Essence

Figure 1

Figure 1 | The AI Scientist-v2 Workflow. The workflow consists of several phases covering

The AI Scientist-v2๋Š” agentic tree search๋ฅผ ํ™œ์šฉํ•œ ์ž๋™ ๊ณผํ•™ ๋ฐœ๊ฒฌ ์‹œ์Šคํ…œ์œผ๋กœ, ์ธ๊ฐ„ ์ž‘์„ฑ ์ฝ”๋“œ ํ…œํ”Œ๋ฆฟ ์˜์กด์„ฑ์„ ์ œ๊ฑฐํ•˜๊ณ  VLM ๊ธฐ๋ฐ˜ ํ”ผ๋“œ๋ฐฑ์„ ํ†ตํ•ฉํ•˜์—ฌ ์™„์ „ํžˆ AI๊ฐ€ ์ƒ์„ฑํ•œ ๋…ผ๋ฌธ์ด ์‹ค์ œ peer review๋ฅผ ํ†ต๊ณผํ•œ ์ฒซ ์‚ฌ๋ก€๋ฅผ ๋‹ฌ์„ฑํ–ˆ๋‹ค.

Motivation

Achievement

Figure 1

Figure 1 | The AI Scientist-v2 Workflow. The workflow consists of several phases covering

The AI Scientist-v2 ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ: ์ธ๊ฐ„ ํ…œํ”Œ๋ฆฟ ์˜์กด์„ฑ ์ œ๊ฑฐ ๋ฐ tree-based ์‹คํ—˜ ์‹คํ–‰์œผ๋กœ ์ž์œจ์„ฑ ํ–ฅ์ƒ | ์ฒซ AI ์ƒ์„ฑ peer-reviewed ๋…ผ๋ฌธ: ICLR 2025 workshop์— ์ œ์ถœํ•œ 3ํŽธ ์ค‘ 1ํŽธ์ด ํ‰๊ท  reviewer ์ ์ˆ˜ 6.33์œผ๋กœ ์ˆ˜์šฉ ๊ธฐ์ค€์„ ์ดˆ๊ณผํ•˜์—ฌ peer review ํ†ต๊ณผ ๋‹ฌ์„ฑ | VLM ๊ธฐ๋ฐ˜ ํ”ผ๋“œ๋ฐฑ ๋ฉ”์ปค๋‹ˆ์ฆ˜: figure์™€ caption์˜ ์งˆ, ๋ช…ํ™•์„ฑ, ํ…์ŠคํŠธ ํ•ด์„ ์ผ๊ด€์„ฑ ๊ฐœ์„  | ์˜คํ”ˆ์†Œ์Šค ๊ณต๊ฐœ: ์™„์ „ํ•œ ์ฝ”๋“œ ๋ฐ workshop ์‹คํ—˜ ๋ฐ์ดํ„ฐ ๊ณต๊ฐœ๋กœ ํ–ฅํ›„ ์—ฐ๊ตฌ ์ด‰์ง„

How

Figure 1

Figure 1 | The AI Scientist-v2 Workflow. The workflow consists of several phases covering

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 4/5 Significance: 5/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: The AI Scientist-v2๋Š” agentic tree search์™€ VLM ํ”ผ๋“œ๋ฐฑ์„ ํ†ตํ•ด ์ž๋™ํ™”๋œ ๊ณผํ•™ ๋ฐœ๊ฒฌ์˜ ์ž์œจ์„ฑ๊ณผ ๊นŠ์ด๋ฅผ ์œ ์˜๋ฏธํ•˜๊ฒŒ ํ–ฅ์ƒ์‹œ์ผฐ์œผ๋ฉฐ, AI ์ƒ์„ฑ ๋…ผ๋ฌธ์ด ์‹ค์ œ peer review๋ฅผ ํ†ต๊ณผํ•œ ์ฒซ ์‚ฌ๋ก€๋กœ์„œ ๊ณผํ•™ ์—ฐ๊ตฌ์˜ AI ์ž๋™ํ™” ๊ฐ€๋Šฅ์„ฑ์„ ์ž…์ฆํ–ˆ๋‹ค. ๋‹ค๋งŒ workshop ์ˆ˜์ค€์˜ ์ œํ•œ, ๋‚ฎ์€ ํ†ต๊ณผ์œจ(3ํŽธ ์ค‘ 1ํŽธ), ๊ทธ๋ฆฌ๊ณ  ์—ฌ์ „ํ•œ ๊ณผํ•™์  ์—„๊ฒฉ์„ฑ ๋ถ€์กฑ์ด conference ์ˆ˜์ค€์˜ ์˜ํ–ฅ๋ ฅ์œผ๋กœ์˜ ํ™•๋Œ€๋ฅผ ์ œ์•ฝํ•œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ž๋™ํ™”๋œ ์‹คํ—˜ ๊ฒฐ๊ณผ ์ถ”์ถœ ๋ฐ ๋ฆฌ๋”๋ณด๋“œ ์ƒ์„ฑ์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์„ ํ–‰ ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ž์œจ AI ๊ณผํ•™ ์—ฐ๊ตฌ ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ์˜ ๊ธฐ๋ฐ˜์ด ๋˜๋Š” ๋ฐฉ๋ฒ•๋ก  ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
AI ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๋ฐœ๊ฒฌ ์ž๋™ํ™”์˜ ์„œ๋ฒ ์ด ๋…ผ๋ฌธ์œผ๋กœ 794๋ฒˆ ๋…ผ๋ฌธ์˜ ์ „์ฒด ์—ฐ๊ตฌ ๋งฅ๋ฝ์„ ์ดํ•ดํ•˜๋Š” ๋ฐ ์ฐธ๊ณ ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
795๋ฒˆ ๋…ผ๋ฌธ์€ AI Scientist์˜ ์ดˆ์ฐฝ๊ธฐ ๋ฒ„์ „์„ ์†Œ๊ฐœํ•˜๋ฉฐ ์ž๋™ ๊ณผํ•™ ๋ฐœ๊ฒฌ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๋ฐœ์ „ ๊ณผ์ •์„ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•ด ๊ฐ™์ด ์ฝ์œผ๋ฉด ์ข‹์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Virtual lab powered by 'AI scientists'(868)๋Š” ์ž๋™ํ™”๋œ AI ์‹คํ—˜์‹ค์—์„œ agentic scientific discovery๋ฅผ ๋‹ค์–‘ํ•œ ๋ฐฉ์‹์œผ๋กœ ๊ตฌํ˜„ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
825์˜ AI ๊ณต๋™ ๊ณผํ•™์ž ์‹œ์Šคํ…œ๊ณผ 794์˜ ์ž๋™ํ™”๋œ AI ๊ณผํ•™ ๋ฐœ๊ฒฌ ์‹œ์Šคํ…œ์€ ๋น„์Šทํ•œ ๋ชฉ์ ์ด์ง€๋งŒ ์•„ํ‚คํ…์ฒ˜์™€ ์ ‘๊ทผ๋ฒ•(๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ vs. ์›Œํฌ์ƒต ์ˆ˜์ค€ ์ž๋™ํ™”)์ด ๋‹ฌ๋ผ ๋น„๊ตํ•ด ๋ณผ ๊ฐ€์น˜๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
The AI Scientist ์‹œ๋ฆฌ์ฆˆ๋Š” ์˜คํ”ˆ์—”๋””๋“œ ๊ณผํ•™ ์—ฐ๊ตฌ ์ž๋™ํ™”์˜ ์„ฑ๋Šฅ ํ‰๊ฐ€์™€ ์ง„๋‹จ์„ ํ†ตํ•ด MLRC-BENCH์™€ ๋ชฉ์ ์ด ์œ ์‚ฌํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
The AI Scientist-v2๋Š” ์™„์ „ ์ž๋™ํ™”๋œ ๊ณผํ•™ ๋ฐœ๊ฒฌ ์‹œ์Šคํ…œ์˜ ํ•œ๊ณ„์™€ ๊ฐ•์ ์„ ํ…Œ์ŠคํŠธํ•˜๋Š” ๋ฒค์น˜๋งˆํฌ๋กœ, Sakana.ai AI Scientist์˜ ๋…๋ฆฝ์  ํ‰๊ฐ€์™€ ์ƒํ˜ธ ๋ณด์™„์ ์œผ๋กœ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
The AI Scientist-v2 ๋…ผ๋ฌธ์€ AI ์—ฐ๊ตฌ์ž ์—์ด์ „ํŠธ๊ฐ€ ์‹ค์ œ ๋…ผ๋ฌธ ์ง‘ํ•„๊นŒ์ง€ ์ˆ˜ํ–‰ํ•˜๋Š” ์ „์ฒด ์ž๋™ ์—ฐ๊ตฌ ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌํ˜„ ์‚ฌ๋ก€๋กœ, AI-Researcher์™€ ์ฒด๊ณ„๋ณ„ ์„ฑ๋Šฅยทํ•œ๊ณ„๋ฅผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
The AI Scientist-v2 ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์ž๋™์  ๊ณผํ•™์  ๋ฐœ๊ฒฌ์˜ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์— ๊ฑธ์ณ ํ‰๊ฐ€ํ•˜์—ฌ, ์ธ์ง€๊ณผํ•™ ์™ธ ๋‹ค๋ฅธ ๋ถ„์•ผ์˜ ์ž๋™ํ™” ํ”„๋ ˆ์ž„์›Œํฌ์™€ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Co-Scientist(3001)๋Š” AI ๊ณผํ•™์ž ์—์ด์ „ํŠธ์˜ ๊ณผํ•™์  ๋ฐœ๊ฒฌ ์ž๋™ํ™”์— ๋Œ€ํ•œ ๋˜ ๋‹ค๋ฅธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
817์€ ํŒ€ ๊ธฐ๋ฐ˜ AI ๊ณผํ•™์ž ๊ฐœ๋…์„ ํ™•์žฅํ•˜๋ฉฐ, 794์˜ ์›Œํฌ์ƒต ๋ ˆ๋ฒจ ์ž๋™ ๋ฐœ๊ฒฌ์„ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ๊ด€์ ์—์„œ ๋ฐœ์ „์‹œํ‚ต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
The AI Scientist-v2 ๋…ผ๋ฌธ์€ ํ•œ์ธต ๋” ์ง„ํ™”๋œ ์ž๋™ํ™” ์›Œํฌ์ˆ๊ธ‰ ๊ณผํ•™ ๋…ผ๋ฌธ ์ƒ์‚ฐ ๋ฐ ํ‰๊ฐ€ ์‹œ์Šคํ…œ์œผ๋กœ, ์ดˆ๊ธฐ AI Scientist ์‹œ์Šคํ…œ์˜ ์ž ์žฌ๋ ฅ๊ณผ ํ•œ๊ณ„๋ฅผ ์‹ค์งˆ์ ์œผ๋กœ ํ™•์žฅํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
285๋ฒˆ ๋…ผ๋ฌธ์€ AI๊ฐ€ ์Šค์Šค๋กœ ์ƒˆ ์‹คํ—˜์„ ์„ค๊ณ„ยท์‹คํ–‰ํ•˜๋Š” '์˜คํ”ˆ์—”๋””๋“œ ์˜คํ† ๋ฆฌ์„œ์น˜'๋ฅผ ๋ชฉํ‘œ๋กœ, ํŠธ๋ฆฌ ๊ตฌ์กฐ ์ž๋™ ํƒ์ƒ‰์„ ์‹ค์ œ๋กœ ์–ด๋–ป๊ฒŒ ๊ตฌํ˜„ํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ํ™•์žฅ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
794๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ๊ฐ€ ์‹ค์ œ ์›Œํฌ์ˆ ์ˆ˜์ค€์˜ ๋ฌผ๋ฆฌํ•™ ๋…ผ๋ฌธ์„ ์™„์„ฑํ•˜๋Š” ์‚ฌ๋ก€๋ฅผ ๋‹ค๋ฃจ์–ด, 922๋ฒˆ ํ•™๊ณ„ AI ๋Œ€ํ•™์›์ƒ ํ™œ์šฉ์˜ ์‹ค์งˆ์  ๊ฒฐ๊ณผ์™€ ๋ณด์™„๋œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
794๋ฒˆ ๋…ผ๋ฌธ์€ ๋” ํฐ ๊ทœ๋ชจ์˜ AI Scientist ์‹œ์Šคํ…œ ๊ด€์ ์—์„œ 671์—์„œ ํ‰๊ฐ€ํ•œ ์ฝ”๋“œ ๊ตฌํ˜„ ๋Šฅ๋ ฅ์„ ์‹ค์ œ ์ž๋™ ๊ณผํ•™์—ฐ๊ตฌ์— ์–ด๋–ป๊ฒŒ ์ ์šฉํ•˜๋Š”์ง€ ๋ณด์—ฌ์ค€๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ดˆ๊ธฐ ๋ฒ„์ „ AI Scientist ๋…ผ๋ฌธ์€ LLM์„ ์ „์ฃผ๊ธฐ ๊ณผํ•™ ์—ฐ๊ตฌ์— ์ ์šฉํ•œ ์‹ค์ œ ์ž๋™ํ™” ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•˜์—ฌ, ์„œ๋ฒ ์ด์˜ ๋‚ด์šฉ๊ณผ ์‹ค์ œ ๊ตฌํ˜„ ์˜ˆ์‹œ๋ฅผ ์—ฐ๊ณ„ํ•ด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
835๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์—์ด์ „ํŠธ ์ „์ฒด ๋™ํ–ฅ์„ ์„œ๋ฒ ์ดํ•˜์—ฌ, 794๋ฒˆ ๋…ผ๋ฌธ์—์„œ ์ œ์•ˆํ•œ AI Scientist์™€ ์œ ์‚ฌ ์‹œ์Šคํ…œ์˜ ๋ฐœ์ „ ์–‘์ƒ์„ ๊ฒ€ํ† ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
794์˜ AI Scientist v2 ๋…ผ๋ฌธ์€ 090์ฒ˜๋Ÿผ AI ์—ฐ๊ตฌ์—์ด์ „ํŠธ ๋ฒค์น˜๋งˆํ‚น์— ์‹ค์  ์ค‘์‹ฌ ํ‰๊ฐ€๋ฅผ ๋”ํ•˜๋ฉฐ, ์ž๋™ ์—ฐ๊ตฌ ์‹œ์Šคํ…œ ํ‰๊ฐ€์˜ ์‹ค์ œ ํ™•์žฅ ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
The AI Scientist-v2 ๋…ผ๋ฌธ์€ AI ์›์ฒœ๋ชจ๋ธ์„ ํ™œ์šฉํ•ด ์ž๋™ ๋…ผ๋ฌธ ์ƒ์„ฑ ๋“ฑ ์‹ค์ œ ๊ณผํ•™ ๋ฐœ๊ฒฌ์„ ์‹คํ˜„ํ•œ ์‚ฌ๋ก€ ์—ฐ๊ตฌ๋กœ Gemini ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๊ฐ€์†ํ™” ๋…ผ๋ฌธ๊ณผ ์ง์ ‘ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
The AI Scientist-v2 ๋…ผ๋ฌธ์€ AI ์—ฐ๊ตฌ์ž์˜ ์ƒ์œ„๊ถŒ ๋…ผ๋ฌธ ์ƒ์„ฑ ๋“ฑ ์—”๋“œ-ํˆฌ-์—”๋“œ ๊ณผํ•™ ์ž๋™ํ™”์˜ ์ง„ํ™”๋œ ์‹ค์ฆ ์‚ฌ๋ก€๋ฅผ ๋ณด์™„ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Workshop ์ˆ˜์ค€์—์„œ ์ „์ž๋™ํ™”๋œ AI ๊ณผํ•™์ž ์‹œ์Šคํ…œ์„ ํƒ๊ตฌํ•˜๋ฉฐ, Towards a Medical AI Scientist์˜ ์˜๋ฃŒํŠนํ™” ๋ชจ๋ธ์„ ๋”์šฑ ์ผ๋ฐ˜ํ™”ํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AI ๊ธฐ๋ฐ˜ ์‹ค์‹œ๊ฐ„ ์‹คํ—˜ ๊ธฐํš๊ณผ ์ž๋™ ๋ฐ์ดํ„ฐ ๋ถ„์„(432)์€ AI Scientist-v2์— ์˜ํ•œ ์™„์ „ ์ž๋™ํ™” ๊ณผํ•™ ์‹คํ—˜์˜ ์‹ค์ œ์  ์‘์šฉ ์‚ฌ๋ก€๋ฅผ ๋ณด๊ฐ•ํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
794๋ฒˆ ๋…ผ๋ฌธ์ด AI Scientist-v2๋ผ๋Š” ์‹ค์ œ ์ž๋™ ๊ณผํ•™ ๋ฐœ๊ฒฌ ์‹œ์Šคํ…œ์„ ๊ตฌํ˜„ํ•œ ์‚ฌ๋ก€์ด๋ฏ€๋กœ, 835๋ฒˆ ์„œ๋ฒ ์ด์˜ ์ ์šฉ ์˜ˆ์‹œ๋กœ ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
805๋ฒˆ ๋…ผ๋ฌธ์€ ์‹ค์ œ ๋ฐ”์ด๋Ÿฌ์Šค ๋‹จ๋ฐฑ์งˆ ๋””์ž์ธ์—์„œ ์™„์ „ ์ž๋™ AI ์—ฐ๊ตฌ์ž์˜ ์‘์šฉ ๊ตฌํ˜„ ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
081์—์„œ AI Scientist์˜ ์‹คํ—˜์  ๊ตฌํ˜„ ํ•œ๊ณ„๊ฐ€ ์ง€์ ๋˜์ง€๋งŒ, 794์—์„œ๋Š” ์—์ด์ „ํ‹ฑ ์ž๋™์—ฐ๊ตฌ ์‹คํ˜„ ๊ฐ€๋Šฅ์„ฑ์„ ๊ธ์ •์ ์œผ๋กœ ํ‰๊ฐ€ํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •