Towards end-to-end automation of AI research

์ €์ž: Chris Lu, Cong Lu, Robert Tjarko Lange, Yutaro Yamada, Shengran Hu, Jakob Foerster, David Ha, Jeff Clune | ๋‚ ์งœ: 2026-03 | DOI: 10.1038/s41586-026-10265-5 📄 PDF


Essence

Figure 1

Figure 1: The AI Scientist์˜ ์›Œํฌํ”Œ๋กœ์šฐ. ์ž๋™ํ™”๋œ ์•„์ด๋””์–ด ์ƒ์„ฑ, ํŠธ๋ฆฌ ๊ธฐ๋ฐ˜ ์‹คํ—˜, ์›๊ณ  ์ž‘์„ฑ ๋ฐ ๋ฆฌ๋ทฐ์˜ ์„œ๋กœ ๋‹ค๋ฅธ ๋‹จ๊ณ„๋“ค๋กœ ๊ตฌ์„ฑ๋˜๋ฉฐ, ๊ธฐ์ดˆ ๋ชจ๋ธ์˜ ๊ฐœ์„ ์— ๋”ฐ๋ผ ๋…ผ๋ฌธ ํ’ˆ์งˆ์ด ์ง€์†์ ์œผ๋กœ ํ–ฅ์ƒ๋œ๋‹ค.

๋ณธ ๋…ผ๋ฌธ์€ The AI Scientist ์‹œ์Šคํ…œ์„ ์ œ์‹œํ•˜๋ฉฐ, ์ด๋Š” ์•„์ด๋””์–ด ์ฐฝ์ถœ๋ถ€ํ„ฐ ๋™๋ฃŒ ๊ฒ€ํ† ๊นŒ์ง€ ๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์ „์ฒด ์ˆ˜๋ช…์ฃผ๊ธฐ๋ฅผ ์ž๋™ํ™”ํ•˜๋Š” ์ตœ์ดˆ์˜ ์—”๋“œ-ํˆฌ-์—”๋“œ ํŒŒ์ดํ”„๋ผ์ธ์ด๋‹ค. ์ด ์‹œ์Šคํ…œ์ด ์ƒ์„ฑํ•œ ๋…ผ๋ฌธ์ด ์ƒ์œ„๊ถŒ ๋จธ์‹ ๋Ÿฌ๋‹ ์ปจํผ๋Ÿฐ์Šค ์›Œํฌ์ˆ์˜ ๋™๋ฃŒ ๊ฒ€ํ†  ๊ณผ์ •์„ ํ†ต๊ณผํ–ˆ์œผ๋ฉฐ, ์ด๋Š” AI์˜ ๊ณผํ•™ ๊ธฐ์—ฌ ์—ญ๋Ÿ‰์ด ์ƒ๋‹นํžˆ ์„ฑ์ˆ™ํ–ˆ์Œ์„ ์ž…์ฆํ•œ๋‹ค.

Motivation

Achievement

Figure 1b-c

Figure 1b-c: (b) ์‹œ๊ฐ„์— ๋”ฐ๋ฅธ ๋ชจ๋ธ ๊ฐœ์„ ์— ๋”ฐ๋ผ AI Scientist ๋…ผ๋ฌธ์˜ ํ’ˆ์งˆ์ด ์ง€์†์ ์œผ๋กœ ์ƒํ–ฅํ•˜๋ฉฐ, (c) ์ž๋™ํ™”๋œ ๊ฒ€ํ† ์ž์˜ ์„ฑ๋Šฅ์ด ์ธ๊ฐ„ ๊ฒ€ํ† ์ž์™€ ๋™๋“ฑํ•œ ์ˆ˜์ค€์ž„์„ ๋ณด์—ฌ์ฃผ๋Š” ๊ท ํ˜•์ •ํ™•๋„(Balanced Accuracy) ๋น„๊ต.

  1. ์—”๋“œ-ํˆฌ-์—”๋“œ ์ž๋™ํ™” ๋‹ฌ์„ฑ: The AI Scientist๋Š” ์•„์ด๋””์–ด ์ƒ์„ฑ, ๋ฌธํ—Œ ๊ฒ€์ƒ‰, ์‹คํ—˜ ๊ณ„ํš, ์ฝ”๋“œ ์ž‘์„ฑ ๋ฐ ์‹คํ–‰, ๊ฒฐ๊ณผ ์‹œ๊ฐํ™”, ๋…ผ๋ฌธ ์ž‘์„ฑ, ๋™๋ฃŒ ๊ฒ€ํ† ๊นŒ์ง€ ๋ชจ๋“  ๋‹จ๊ณ„๋ฅผ ์ž๋™์œผ๋กœ ์ˆ˜ํ–‰.
  2. ์‹ค์ œ ํ”ผ์–ด ๋ฆฌ๋ทฐ ํ†ต๊ณผ: ์ƒ์„ฑ๋œ 3๊ฐœ ๋…ผ๋ฌธ ์ค‘ 1๊ฐœ๊ฐ€ ICLR ์›Œํฌ์ˆ์˜ ๋™๋ฃŒ ๊ฒ€ํ† ์—์„œ ์ธ์ •๋ฐ›์•„, ์ˆ˜์šฉ ๊ธฐ์ค€์„ ์ดˆ๊ณผํ•˜๋Š” ์ ์ˆ˜ ๋‹ฌ์„ฑ (์›Œํฌ์ˆ ์ˆ˜์šฉ๋ฅ  70%).
  3. ์ž๋™ํ™”๋œ ๊ฒ€ํ† ์ž์˜ ์‹ ๋ขฐ์„ฑ: ๊ฐœ๋ฐœ๋œ Automated Reviewer๋Š” ์ธ๊ฐ„ ๊ฒ€ํ† ์ž์™€ ๋™๋“ฑํ•œ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ (๊ท ํ˜•์ •ํ™•๋„ ์•ฝ 66-69%, F1 ์Šค์ฝ”์–ด ๋น„๊ต์—์„œ ์ธ๊ฐ„ ๊ฒ€ํ† ์ž์™€ ํ†ต๊ณ„์  ์œ ์˜์ฐจ ์—†์Œ).
  4. ํ™•์žฅ์„ฑ๊ณผ ๊ฐœ์„  ๊ฐ€๋Šฅ์„ฑ: ๋” ๊ฐ•๋ ฅํ•œ ๋ชจ๋ธ๊ณผ ๋” ๋งŽ์€ ์ถ”๋ก  ์‹œ๊ฐ„ ๊ณ„์‚ฐ์„ ์‚ฌ์šฉํ• ์ˆ˜๋ก ๋…ผ๋ฌธ ํ’ˆ์งˆ์ด ํ–ฅ์ƒ๋˜๋ฉฐ (Rยฒ=0.517, P<0.00001), ๊ธฐ์ดˆ ๋ชจ๋ธ์˜ ๊ฐœ์„ ์— ๋”ฐ๋ผ ์ง€์†์  ์„ฑ๋Šฅ ํ–ฅ์ƒ์ด ์˜ˆ์ƒ๋จ.

How

Figure 1a

Figure 1a: The AI Scientist์˜ 4๊ฐ€์ง€ ์ฃผ์š” ๋‹จ๊ณ„ - ์•„์ด๋””์–ด ์ƒ์„ฑ, ์‹คํ—˜ ์ˆ˜ํ–‰, ๋…ผ๋ฌธ ์ž‘์„ฑ, AI ๊ฒ€ํ† .

๋‹จ๊ณ„ 1: ์•„์ด๋””์–ด ์ƒ์„ฑ (Ideation)

๋‹จ๊ณ„ 2: ์‹คํ—˜ ์ˆ˜ํ–‰ (Experimentation)

๋‹จ๊ณ„ 3: ๋…ผ๋ฌธ ์ž‘์„ฑ (Write-up)

๋‹จ๊ณ„ 4: ์ž๋™ ๊ฒ€ํ†  (AI Review)

Originality

Limitation & Further Study

Evaluation

Novelty: 5/5 Technical Soundness: 4.5/5 Significance: 5/5 Clarity: 4/5 Overall: 4.5/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์™„์ „ํ•œ ์ž๋™ํ™”๋ผ๋Š” ์˜ค๋žซ๋™์•ˆ์˜ AI ์—ฐ๊ตฌ ๋ชฉํ‘œ๋ฅผ ์ฒ˜์Œ์œผ๋กœ ์‹คํ˜„ํ•˜๊ณ , ์‹ค์ œ ํ•™์ˆ  ํ‰๊ฐ€ ์‹œ์Šคํ…œ์„ ํ†ตํ•ด ๊ฒ€์ฆํ•จ์œผ๋กœ์จ ๋†’์€ ์ž„ํŒฉํŠธ๋ฅผ ์ž…์ฆํ–ˆ๋‹ค. ์ž๋™ํ™”๋œ ๊ฒ€ํ† ์ž์˜ ์ธ๊ฐ„ ์ˆ˜์ค€ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ๋„ ์ฃผ๋ชฉํ•  ๋งŒํ•˜๋‹ค. ๋‹ค๋งŒ ํ‰๊ฐ€ ๋Œ€์ƒ์ด ๋จธ์‹ ๋Ÿฌ๋‹ ๋ถ„์•ผ์˜ ์ปดํ“จํ„ฐ ๊ธฐ๋ฐ˜ ์‹คํ—˜์œผ๋กœ ์ œํ•œ๋˜์—ˆ์œผ๋ฉฐ, ๊ณผํ•™ ๋ฌธํ—Œ์— ๋ฏธ์น  ์ž ์žฌ์  ๋ถ€์ž‘์šฉ(๋…ธ์ด์ฆˆ, ํ”ผ์–ด ๋ฆฌ๋ทฐ ์‹œ์Šคํ…œ ๊ณผ๋ถ€ํ•˜)์— ๋Œ€ํ•œ ๋Œ€๋น„์ฑ… ๋ถ€์žฌ๋Š” ํ•œ๊ณ„์ ์ด๋‹ค. ๊ธฐ์ดˆ ๋ชจ๋ธ์˜ ์ง€์†์  ๊ฐœ์„ ์— ๋”ฐ๋ฅธ ์‹œ์Šคํ…œ์˜ ํ–ฅ์ƒ ๊ฐ€๋Šฅ์„ฑ์€ ๋งค์šฐ ๋†’๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM ๋ฐ ์ž์œจ ์—์ด์ „ํŠธ ๋ฒค์น˜๋งˆํฌ ์ฒด๊ณ„์  ๋ฆฌ๋ทฐ๊ฐ€ AI Scientist ์‹œ์Šคํ…œ์˜ ์ „์ฒด ์ž๋™ํ™” ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌํ˜„์— ๊ธฐ๋ฐ˜์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Automating the practice of science ๋…ผ๋ฌธ์€ ๊ณผํ•™ ์ž๋™ํ™”์˜ ๊ทผ๋ณธ์  ๊ฐ€๋Šฅ์„ฑ๊ณผ ๊ณผ์ œ๋ฅผ ๋…ผ์˜ํ•˜์—ฌ AI Scientist ์—ฐ๊ตฌ์˜ ์ฒ ํ•™/์ด๋ก  ๊ธฐ๋ฐ˜์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Towards end-to-end automation of AI research ๋…ผ๋ฌธ์€ AI ์—ฐ๊ตฌ ์ž๋™ํ™”์˜ ์ „์ฒด์ ์ธ ์ฒญ์‚ฌ์ง„์„ ์ œ์‹œํ•˜์—ฌ, AI-Researcher์˜ ์‹œ์Šคํ…œ ์„ค๊ณ„์— ์ด๋ก ์  ๊ฐ€์ด๋“œ๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณ ๊ธ‰ LLM์˜ ๊ณผํ•™์  ์ถ”๋ก  ๋Šฅ๋ ฅ์˜ ๊ธฐ๋ฐ˜์ด ๋˜๋Š” ๋ชจ๋ธ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI Scientist v2๋Š” ์—ฐ๊ตฌ ์ž๋™ํ™”์˜ ํ˜„์‹ค์  ์–ด๋ ค์›€, ์ตœ์ ํ™”๋œ ํŒŒ์ดํ”„๋ผ์ธยท์›Œํฌํ”Œ๋กœ์šฐ ๊ตฌํ˜„ ๋“ฑ, end-to-end ์ž๋™ํ™”์˜ ๋˜ ๋‹ค๋ฅธ ์„ฑ๊ณต ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ์—ฐ๊ตฌ ์ „๊ณผ์ •์˜ ์ž๋™ํ™” ํ”„๋ ˆ์ž„์›Œํฌ ๋…ผ์˜ ์†์—์„œ LLM ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ML ์—ฐ๊ตฌ ์ž๋™ํ™”์˜ ์ฐจ๋ณ„์ ์„ ํ™•์‹คํžˆ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ž๋™ํ™”๋œ ๊ณผํ•™ ์—ฐ๊ตฌ์˜ ๊ธฐํšŒ์™€ ํ•œ๊ณ„๋ฅผ ํƒ์ƒ‰ํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ์—ฐ๊ตฌ ํ™˜๊ฒฝ ์™„์ „ ์ž๋™ํ™”๋ฅผ ์ง€ํ–ฅํ•˜๋Š” ์ ‘๊ทผ๋ฒ•์œผ๋กœ, ์™„์ „ ์ž๋™ํ™”์™€ ์ธ๊ฐ„-AI ํŒ€ ๊ณต๋™์—ฐ๊ตฌ์˜ ์žฅ๋‹จ์  ๋ฐ ์ƒํ˜ธ๋ณด์™„ ๋ฐฉ์•ˆ์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Œ.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ์ž์œจ ๊ณผํ•™ ์—ฐ๊ตฌ ์‹œ์Šคํ…œ์˜ ๋Šฅ๋ ฅ๊ณผ ํ•œ๊ณ„๋ฅผ ํ‰๊ฐ€ํ•˜๋Š” ์œ ์‚ฌํ•œ ์ฃผ์ œ์˜ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ์ž๋™ ๊ณผํ•™ ๋ฐœ๊ฒฌ ๋˜๋Š” ๋ฒ•์น™ ์ถ”์ถœ ์‹œ์Šคํ…œ์œผ๋กœ ์œ ์‚ฌํ•œ ์ ‘๊ทผ๋ฒ•์„ ๊ณต์œ ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
828๋ฒˆ ๋…ผ๋ฌธ์€ ์ „์ž๋™ AI ์—ฐ๊ตฌ ํ”„๋ ˆ์ž„์›Œํฌ์— ๋Œ€ํ•œ ๋‹ค๋ฅธ ์ ‘๊ทผ์œผ๋กœ, DOLPHIN๊ณผ ์œ ์‚ฌํ•œ ์˜คํ”ˆ์—”๋””๋“œ ๊ณผํ•™ ์ž๋™ํ™” ์‹œ์Šคํ…œ์„ ์†Œ๊ฐœํ•˜์—ฌ ๋น„๊ตํ•  ๋งŒํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ์„ค๊ณ„ ๋˜๋Š” ์—”์ง€๋‹ˆ์–ด๋ง ์ตœ์ ํ™” ์ž๋™ํ™” ์‹œ์Šคํ…œ์œผ๋กœ ์œ ์‚ฌํ•œ ๋ชฉํ‘œ๋ฅผ ์ถ”๊ตฌํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Towards end-to-end automation of AI research ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์—ฐ๊ตฌ ์—์ด์ „ํŠธ๋ฅผ ์‹ค์ œ ์—ฐ๊ตฌ ์ž๋™ํ™”์— ์ ์šฉํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, ๋ณธ ์„œ๋ฒ ์ด์˜ ์„ค๊ณ„์™€ ๋น„๊ตํ•  ๋งŒํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
828๋ฒˆ ๋…ผ๋ฌธ์€ AI ์—ฐ๊ตฌ ๊ณผ์ •์˜ ์™„์ „ ์ž๋™ํ™”๋ฅผ ์‹œ๋„ํ•œ ์‹ค์ œ ์ ์šฉ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, 353๋ฒˆ์˜ LLM ์ž์œจํ™” ๋‹จ๊ณ„ ์ด๋ก ๊ณผ ๋Œ€์กฐ์ ์œผ๋กœ ๋น„๊ต๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Towards end-to-end automation of AI research ๋…ผ๋ฌธ์€ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ํ™˜๊ฒฝ์—์„œ ์‹คํ—˜ ๋ฐ˜๋ณต๊ณผ ์—ฐ๊ตฌ ์ž๋™ํ™”์˜ ๋˜ ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜๋ฏ€๋กœ ํ•จ๊ป˜ ๋น„๊ตํ•  ๋งŒํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ž์œจ AI ๊ณผํ•™์ž ์‹œ์Šคํ…œ์˜ ์œ ์‚ฌํ•œ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ์ ‘๊ทผํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ์—ฐ๊ตฌ ์ž๋™ํ™”์—์„œ SOTA ์žฌํ˜„, ๊ฐœ์„  ๋“ฑ ์ž๋™ ์‹คํ—˜ ์‹œ์Šคํ…œ ๊ตฌํ˜„ ์‹œ ๋‹ค์–‘ํ•œ multi-agent ๊ตฌ์กฐ์™€ ํ”Œ๋กœ์šฐ ์ž๋™ํ™” ์ ‘๊ทผ๋ฒ•์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Towards end-to-end automation of AI research ๋…ผ๋ฌธ์€ ์‹ค์ œ ์—ฐ๊ตฌ ์‹คํ—˜ ์ž๋™ํ™”๋ฅผ ์œ„ํ•œ ์‹œ์Šคํ…œ์  ์‹ค์ฒœ ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•˜์—ฌ, ํฌ๊ด„์  ๊ณผํ•™ AI ์‹œ์Šคํ…œ์˜ ์‹คํ˜„ ๊ฐ€๋Šฅ์„ฑ์„ ๋…ผ์˜ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI Scientist ์‹œ์Šคํ…œ์€ ์ž์œจ AI ์—์ด์ „ํŠธ ์—ฐ๊ตฌ์˜ ์—”๋“œ-ํˆฌ-์—”๋“œ ์ž๋™ํ™” ์ ์šฉ ์‚ฌ๋ก€๋กœ ๋ณธ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ์˜ ์‹ค์งˆ์  ํ™•์žฅ์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Towards end-to-end automation of AI research ๋…ผ๋ฌธ์€ MLGym์ฒ˜๋Ÿผ AI ์—ฐ๊ตฌ ํ™˜๊ฒฝ ์ž๋™ํ™”๋ฅผ ๋”์šฑ ๋„“์€ ๋ฒ”์œ„๋กœ ํ™•์žฅํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Towards end-to-end automation of AI research ๋…ผ๋ฌธ์€ ์‹ค์งˆ์ ์ธ AI ์—ฐ๊ตฌ ์™„์ „ ์ž๋™ํ™” ๊ตฌ์กฐ์™€ ๊ตฌํ˜„ ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ฃผ๋ฉฐ, Exp-bench์˜ ํ‰๊ฐ€ ๊ฒฐ๊ณผ๋ฅผ ํ˜„์‹คํ™”ํ•˜๋Š” ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
828์€ AI ์—ฐ๊ตฌ์˜ End-to-End ์ž๋™ํ™”๋กœ ํ™•์žฅํ•˜๋Š” ๋ฐฉ์•ˆ์„ ์ œ์‹œํ•˜์—ฌ, 145์˜ ์ž๋™ ์‹คํ—˜ ์žฌํ˜„์„ ๋” ํฌ๊ด„์ ์ธ ์—ฐ๊ตฌ ์ž๋™ํ™”๋กœ ๋ฐœ์ „์‹œํ‚จ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ž๋™ํ™”๋œ AI ์—ฐ๊ตฌ ์‹œ์Šคํ…œ ๊ตฌ์ถ•์— ๊ด€ํ•œ ์ตœ์‹  ๋™ํ–ฅ ๋ฐ ์ „์ฒด ๊ณผ์ • ์ž๋™ํ™” ๋ฌธ์ œ๋ฅผ ๋ถ„์„ํ•ด, MLR-Bench ์‹œ์Šคํ…œ์˜ ์ƒ์šฉํ™”ยทํ™•์žฅ ๊ฐ€๋Šฅ์„ฑ ํ‰๊ฐ€์— ๋„์›€์„ ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI ์—ฐ๊ตฌ ์ „๋ฐ˜์˜ ์—”๋“œ-ํˆฌ-์—”๋“œ ์ž๋™ํ™” ๋ฒค์น˜๋งˆํ‚น ์‚ฌ๋ก€๋“ค์„ ํ†ตํ•ด EAIRA์˜ ์‹คํ—˜์„ฑ๊ณผ ๋น„๊ต ๊ฐ€๋Šฅํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
The AI Scientist-v2 ๋…ผ๋ฌธ์€ AI ์—ฐ๊ตฌ์ž์˜ ์ƒ์œ„๊ถŒ ๋…ผ๋ฌธ ์ƒ์„ฑ ๋“ฑ ์—”๋“œ-ํˆฌ-์—”๋“œ ๊ณผํ•™ ์ž๋™ํ™”์˜ ์ง„ํ™”๋œ ์‹ค์ฆ ์‚ฌ๋ก€๋ฅผ ๋ณด์™„ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
From Automation to Autonomy ๋…ผ๋ฌธ์€ ์ž๋™ํ™”-์ž์œจํ™” ์ „ํ™˜์˜ ์ตœ์‹  ๋™ํ–ฅ ๋ฐ ์‹ค์ œ ์—ฐ๊ตฌ ์‘์šฉ์„ ๋น„๊ต์ ์œผ๋กœ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
828์€ AI์—ฐ๊ตฌ์˜ ์—”๋“œ ํˆฌ ์—”๋“œ ์ž๋™ํ™” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜์—ฌ 059์˜ ๊ตฌํ˜„์‚ฌ๋ก€์— ํ•œ์ธต ๋ฒ”์šฉ์  ์‹œ์‚ฌ์ ์„ ๋”ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
828์€ LLM์˜ ๋„๊ตฌ ์‚ฌ์šฉ ๋Šฅ๋ ฅ์ด๋‚˜ ๊ณผํ•™์  ์ถ”๋ก ์„ ํ™•์žฅํ•˜์—ฌ ToolUniverse ์ƒํƒœ๊ณ„์˜ ํ™œ์šฉ ๋ฒ”์œ„๋ฅผ ๋ณด์™„ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Towards end-to-end automation of AI research ๋…ผ๋ฌธ์€ ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ๊ณผํ•™์—ฐ๊ตฌ ์ž๋™ํ™”์˜ ํ•œ๊ณ„์™€ ํ–ฅํ›„ ๋ฐฉํ–ฅ์„ฑ์„ ๋…ผ์˜ํ•˜์—ฌ Cocoa์˜ ํ˜‘์—… ํ”„๋ ˆ์ž„์›Œํฌ์™€ ์—ฐ๊ด€์„ฑ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI ๊ณผํ•™์ž ์‹œ์Šคํ…œ์˜ ํŠน์ • ์ธก๋ฉด์„ ํ™•์žฅํ•˜๊ฑฐ๋‚˜ ์‘์šฉํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Towards end-to-end automation of AI research ๋…ผ๋ฌธ์€ ์‹ค์ œ ์—ฐ๊ตฌ ์ž๋™ํ™” ์ „์ฒด์  ๊ด€์ ์—์„œ AI ์—์ด์ „ํŠธ ํ‰๊ฐ€ ๊ธฐ์ค€ ํ™•์žฅ์„ ๋…ผ์˜ํ•˜์—ฌ ResearchGym์˜ ๋ชฉ์ ๊ณผ ์—ฐ์žฅ์„ฑ์„ ๊ฐ€์ง„๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Towards end-to-end automation of AI research ๋…ผ๋ฌธ์€ AI ์—ฐ๊ตฌ ์ „ ๊ณผ์ •์„ ์ž๋™ํ™”ํ•˜๋Š” ๊ตฌ์ฒด์  ์‹œ์Šคํ…œ ์ˆ˜์ค€ ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
828 ๋…ผ๋ฌธ์€ AI ์—ฐ๊ตฌ์˜ ์—”๋“œ-ํˆฌ-์—”๋“œ ์ž๋™ํ™”๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, 021์˜ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์ง€์‹ ์ถ”์ถœ์˜ ์‹ค์ œ ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ํƒ์ƒ‰ํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
710 ๋…ผ๋ฌธ์€ ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ๋ถ„์•ผ์—์„œ ์ž๋™ ํด๋ ˆ์ž„ ์ƒ์„ฑ ๋ฐ ๊ฒ€์ฆ ์‹œ์Šคํ…œ์„ ์ ์šฉํ•ด ์‹ค์ œ ์—ฐ๊ตฌ ์ž๋™ํ™” ํŒŒ์ดํ”„๋ผ์ธ์˜ ์‹คํšจ์„ฑ ๊ฒ€์ฆ ์‚ฌ๋ก€๋ฅผ ๋ณด์™„ํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AAAR-1.0์€ AI์˜ ์—ฐ๊ตฌ ์–ด์‹œ์Šคํ„ดํŠธ๋กœ์„œ์˜ ๊ฐ€๋Šฅ์„ฑ ํ‰๊ฐ€๋ฅผ ๋‹ค๋ฃจ์–ด, The AI Scientist์˜ ์—”๋“œ-ํˆฌ-์—”๋“œ ๊ณผํ•™ ์ž๋™ํ™” ์ ์šฉ์˜ ํ‰๊ฐ€ ์ง€์ ์ด ๋œ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
AI ๊ธฐ๋ฐ˜ ์‹คํ—˜ ์„ค๊ณ„ ๋ฐ ์ž๋™ํ™” ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์‹ค์ œ ์‹คํ—˜ ์ˆ˜ํ–‰ ๋Šฅ๋ ฅ๊ณผ ํ•œ๊ณ„๋ฅผ ๋น„๊ต ๋ถ„์„ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•ด์ค๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
AI Scientist์˜ ๋Šฅ๋ ฅ์„ ๊ธ์ •์ ์œผ๋กœ ํ‰๊ฐ€ํ•˜๋Š” ์ž…์žฅ์œผ๋กœ, AI ๊ณผํ•™ ์—ฐ๊ตฌ ๊ตฌํ˜„ ๋Šฅ๋ ฅ ๋ถ€์กฑ์„ ๋น„ํŒํ•˜๋Š” ๋ณธ ๋…ผ๋ฌธ๊ณผ ๋Œ€๋น„๋˜๋Š” ๊ด€์ ์„ ์ œ์‹œํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •