The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery

์ €์ž: Chris Lu, Cong Lu, Robert Tjarko Lange, Jakob Foerster, Jeff Clune, David Ha | ๋‚ ์งœ: 2024 | DOI: 10.48550/ARXIV.2408.06292 📄 PDF


Essence

Figure 1

Figure 1: The AI Scientist์˜ ๊ฐœ๋…๋„ - ์•„์ด๋””์–ด ์ƒ์„ฑ๋ถ€ํ„ฐ ๋…ผ๋ฌธ ์ž‘์„ฑ ๋ฐ ์ž๋™ ๋ฆฌ๋ทฐ๊นŒ์ง€์˜ ์ „์ฒด ํŒŒ์ดํ”„๋ผ์ธ

๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋Š” ์™„์ „ ์ž๋™ํ™”๋œ ๊ณผํ•™ ์—ฐ๊ตฌ ์ˆ˜ํ–‰ ์‹œ์Šคํ…œ์œผ๋กœ, ์•„์ด๋””์–ด ์ƒ์„ฑ์—์„œ ์‹คํ—˜ ์ˆ˜ํ–‰, ๋…ผ๋ฌธ ์ž‘์„ฑ, ๋™๋ฃŒ ๊ฒ€ํ† ๊นŒ์ง€ ์ „์ฒด ๊ณผํ•™ ์—ฐ๊ตฌ ํ”„๋กœ์„ธ์Šค๋ฅผ ์ž๋™์œผ๋กœ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋‹ค. ํ•œ ํŽธ์˜ ๋…ผ๋ฌธ ์ƒ์„ฑ์— 15๋‹ฌ๋Ÿฌ ๋ฏธ๋งŒ์˜ ๋น„์šฉ์ด ์†Œ์š”๋˜๋ฉฐ, ์ž๋™ ๋ฆฌ๋ทฐ ์‹œ์Šคํ…œ์ด ์ธ๊ฐ„ ์ˆ˜์ค€์— ๊ฐ€๊นŒ์šด ์„ฑ๋Šฅ์œผ๋กœ ๋…ผ๋ฌธ ํ’ˆ์งˆ์„ ํ‰๊ฐ€ํ•œ๋‹ค.

Motivation

Achievement

Figure 2

Figure 2: ICLR 2022 OpenReview ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•œ ์ž๋™ ๋ฆฌ๋ทฐ ์‹œ์Šคํ…œ์˜ ์„ฑ๋Šฅ ํ‰๊ฐ€

  1. ์™„์ „ ์ž๋™ํ™” ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌํ˜„: ์•„์ด๋””์–ด ์ƒ์„ฑโ†’์‹คํ—˜ ์„ค๊ณ„โ†’์ฝ”๋“œ ์ž‘์„ฑโ†’์‹คํ—˜ ์‹คํ–‰โ†’๋…ผ๋ฌธ ์ž‘์„ฑโ†’์ž๋™ ๋ฆฌ๋ทฐ๊นŒ์ง€ ์ธ๊ฐ„ ๊ฐœ์ž… ์—†์ด ์ „์ฒด ํ”„๋กœ์„ธ์Šค๋ฅผ ์ž๋™ํ™”
  2. ๊ณ ํ’ˆ์งˆ ์ž๋™ ๋ฆฌ๋ทฐ ์‹œ์Šคํ…œ: ICLR 2022 ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ํ‰๊ฐ€์—์„œ 65% vs 66% ๊ท ํ˜•์žกํžŒ ์ •ํ™•๋„(balanced accuracy)๋กœ ์ธ๊ฐ„ ๋ฆฌ๋ทฐ์–ด์™€ ์œ ์‚ฌํ•œ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ
  3. ๋น„์šฉ ํšจ์œจ์„ฑ: ๋…ผ๋ฌธ 1ํŽธ๋‹น $15 ๋ฏธ๋งŒ์˜ ์ €๋น„์šฉ์œผ๋กœ ์ˆ˜๋ฐฑ ํŽธ์˜ ์ค‘๊ฐ„ ํ’ˆ์งˆ ๋…ผ๋ฌธ์„ ์ผ์ฃผ์ผ ๋‚ด์— ์ƒ์„ฑ ๊ฐ€๋Šฅ
  4. ์‹ค์ œ ๋…ผ๋ฌธ ์ƒ์„ฑ: ํ™•์‚ฐ ๋ชจ๋ธ(diffusion modeling), ์–ธ์–ด๋ชจ๋ธ(language modeling), ๊ทธ๋กœํ‚น(grokking) ๋“ฑ 3๊ฐœ ๋ถ„์•ผ์—์„œ ์‹ค์ œ ํ•™ํšŒ ์ˆ˜์šฉ ๊ธฐ์ค€์„ ์ดˆ๊ณผํ•˜๋Š” ๋…ผ๋ฌธ ์ƒ์„ฑ ๋‹ฌ์„ฑ

How

Figure 3

Figure 3: AI Scientist๊ฐ€ ์ž๋™์œผ๋กœ ์ƒ์„ฑํ•œ "Adaptive Dual-Scale Denoising" ๋…ผ๋ฌธ์˜ ๋ฏธ๋ฆฌ๋ณด๊ธฐ

3๋‹จ๊ณ„ ์ฃผ์š” ํ”„๋กœ์„ธ์Šค:

1๋‹จ๊ณ„: ์•„์ด๋””์–ด ์ƒ์„ฑ (Idea Generation)

2๋‹จ๊ณ„: ์‹คํ—˜ ์ˆ˜ํ–‰ (Experimental Iteration)

3๋‹จ๊ณ„: ๋…ผ๋ฌธ ์ž‘์„ฑ (Paper Write-up)

4๋‹จ๊ณ„: ์ž๋™ ๋ฆฌ๋ทฐ ๋ฐ ํ‰๊ฐ€

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์˜ ๋Šฅ๋ ฅ์„ ๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์™„์ „ ์ž๋™ํ™”๋กœ ํ™•์žฅํ•œ ํš๊ธฐ์  ์‹œ๋„๋กœ, ์ €๋น„์šฉ ๊ณ ์†๋„์˜ ์ž๋™ ์—ฐ๊ตฌ ์ˆ˜ํ–‰ ๊ฐ€๋Šฅ์„ฑ์„ ์ž…์ฆํ•˜์˜€๋‹ค. ๋‹ค๋งŒ, ์ƒ์„ฑ ๋…ผ๋ฌธ์˜ ์‹ค์ œ ํ•™์ˆ ์  ๊ฐ€์น˜, ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ์œผ๋กœ์˜ ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ, ๊ณผํ•™ ์ถœํŒ ์‹œ์Šคํ…œ์— ๋ฏธ์น  ์œค๋ฆฌ์  ์˜ํ–ฅ์— ๋Œ€ํ•œ ์‹ฌ์ธต ๋ถ„์„์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
795๋Š” ์˜คํ”ˆ์—”๋””๋“œ ๊ณผํ•™์  ๋ฐœ๊ฒฌ ์ž๋™ํ™” ์‹œ์Šคํ…œ์„ ๋…ผ์˜ํ•˜๋ฉฐ, 762์˜ ์ฐฝ์˜์  ์•„์ด๋””์–ด ์ œ๋„ˆ๋ ˆ์ด์…˜ ์‹œ์Šคํ…œ์˜ ์—ฐ๊ตฌ์  ๊ทผ๊ฐ„์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
AI Scientist์˜ ๊ฐœ๋…์  ๊ธฐ๋ฐ˜์ด ๋˜๋Š” 'The AI Scientist' ๋…ผ๋ฌธ์„ ํ†ตํ•ด ์ „๋ฐ˜์ ์ธ fully-automated research ๋ฐฉํ–ฅ์„ฑ์„ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
AI ๋„๊ตฌ ์ฑ„ํƒ์ด ๊ณผํ•™์ž ์ƒ์‚ฐ์„ฑ๊ณผ ํƒ์ƒ‰ ๋ฒ”์œ„์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ ๋ถ„์„์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AIGS ๋…ผ๋ฌธ์€ ai ์‹คํ—˜ ์ž๋™ํ™”์™€ ๊ณผํ•™์  ๋ฐ˜์ฆ ์ค‘์‹ฌ ์ ‘๊ทผ์œผ๋กœ, The AI Scientist์˜ ์˜คํ”ˆ์—”๋””๋“œ ๋ฐœ๊ฒฌ ํ”„๋กœ์„ธ์Šค ์ž๋™ํ™”์™€ ๋Œ€์•ˆ์  ํ•ด๋ฒ•์„ ์ œ์•ˆํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
The AI Scientist ๋…ผ๋ฌธ์€ ์™„์ „ ์ž๋™ํ™”๋œ ๊ณผํ•™ ์—ฐ๊ตฌ ํ”„๋กœ์„ธ์Šค๋ฅผ ๊ตฌํ˜„ํ•˜๋ฉฐ, Human-in-the-loop ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์ž๋™ํ™” ํ๋ฆ„๊ณผ ๋Œ€์กฐ์ ์œผ๋กœ ๋ณผ ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
795๋ฒˆ์€ ์˜คํ”ˆ์—”๋””๋“œ ๊ณผํ•™ ์ž๋™ํ™”๋ผ๋Š” ๋ชฉํ‘œ๋ฅผ ์‹ค์ œ ์‹œ์Šคํ…œ ์‚ฌ๋ก€๋กœ ๋…ผ์˜ํ•ด, 834๋ฒˆ์˜ ์ด๊ด„์  ๊ณผ์ œ ์ œ์‹œ์™€ ์ƒํ˜ธ๋ณด์™„์ ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Genesis ๋…ผ๋ฌธ์€ ์‹œ์Šคํ…œ ์ƒ๋ฌผํ•™ ์—ฐ๊ตฌ ์ž๋™ํ™”๋ผ๋Š” ์‹ค์ œ ์—ฐ๊ตฌ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ AI ๊ธฐ๋ฐ˜ ์ž๋™ ์—ฐ๊ตฌ ์ˆ˜ํ–‰ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
795 ๋…ผ๋ฌธ์€ ์˜คํ”ˆ์—”๋””๋“œ ์ž๋™ ๊ณผํ•™์ž ์‹œ์Šคํ…œ์„ ์†Œ๊ฐœํ•˜์—ฌ, 038์˜ ์—ฐ๊ตฌ ์ƒ๋ช…์ฃผ๊ธฐ ์ž๋™ํ™” ํ”„๋ ˆ์ž„์›Œํฌ์™€ ๋‹ค๋ฅธ ๊ตฌํ˜„์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์ด ๊ณผํ•™ ์—ฐ๊ตฌ ๋ฐฉ๋ฒ•๋ก ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ๋‹ค๋ฅธ ๊ด€์ ์—์„œ ๋ถ„์„ํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
The AI Scientist ๋…ผ๋ฌธ์€ ์ข…๋ฃŒํ˜• ๊ณผํ•™ ์‹คํ—˜ ์ž๋™ํ™”์˜ ์„ฑ๊ณต ์‚ฌ๋ก€์™€ ํ•œ๊ณ„๋ฅผ ์‹ค์ฆ์ ์œผ๋กœ ๋ณด์—ฌ์ฃผ์–ด, Exp-bench ๋ฐ์ดํ„ฐ์™€ ์„ฑ๋Šฅ ์ฐจ์ด๋ฅผ ๋ช…๋ฃŒํžˆ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ์ƒ์„ฑ ์—ฐ๊ตฌ ์•„์ด๋””์–ด์˜ ํ˜์‹ ์„ฑ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ๋‹ค๋ฅธ ์ž๋™ํ™” ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
795 ๋…ผ๋ฌธ์€ 248์˜ ๊ณผํ•™ ์‹คํ—˜ ์ž๋™ํ™” ์—„๋ฐ€์„ฑ ํ‰๊ฐ€์—์„œ ํ•œ๋ฐœ ๋” ๋‚˜์•„๊ฐ€ ์—ฐ๊ตฌ ์ž๋™ํ™” ์ „์ฒด ํŒŒ์ดํ”„๋ผ์ธ์— LLM agent๋ฅผ ์ ์šฉํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
795๋ฒˆ ๋…ผ๋ฌธ์€ AI Scientist์˜ ์ดˆ์ฐฝ๊ธฐ ๋ฒ„์ „์„ ์†Œ๊ฐœํ•˜๋ฉฐ ์ž๋™ ๊ณผํ•™ ๋ฐœ๊ฒฌ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๋ฐœ์ „ ๊ณผ์ •์„ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•ด ๊ฐ™์ด ์ฝ์œผ๋ฉด ์ข‹์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
The AI Scientist ๋…ผ๋ฌธ์€ ์™„์ „ ์ž๋™ ๊ณผํ•™ ์—ฐ๊ตฌ ์‹œ์Šคํ…œ์„ ๋‹ค๋ฃจ๊ณ  ์žˆ์–ด AI-Researcher์™€ ์ค‘์š”ํ•œ ๋น„๊ต ๋Œ€์ƒ์ด ๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๋„๊ตฌ๊ฐ€ ๊ณผํ•™ ์—ฐ๊ตฌ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ ๋ถ„์„ ๋ฐฉ๋ฒ•์œผ๋กœ ์ธก์ •ํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ ๊ณผํ•™-์ •์ฑ… ๋ณ€ํ™˜ ๋Šฅ๋ ฅ์„ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ํ‰๊ฐ€ํ•˜๋Š” ๋Œ€์•ˆ์  ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery ๋…ผ๋ฌธ์€ end-to-end ๊ณผํ•™ ์ž๋™ํ™”๋ผ๋Š” ์œ ์‚ฌ ๋ชฉํ‘œ๋ฅผ ๊ฐ–๊ณ  OmniScientist์™€ ๋‹ค๋ฅธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI์™€ ๊ณผํ•™ ์—ฐ๊ตฌ ์œตํ•ฉ์˜ ํ˜„ํ™ฉ๊ณผ ๋ฏธ๋ž˜๋ฅผ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ์„œ๋ฒ ์ด ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI Scientist v2๋Š” ์—ฐ๊ตฌ ์ž๋™ํ™”์˜ ํ˜„์‹ค์  ์–ด๋ ค์›€, ์ตœ์ ํ™”๋œ ํŒŒ์ดํ”„๋ผ์ธยท์›Œํฌํ”Œ๋กœ์šฐ ๊ตฌํ˜„ ๋“ฑ, end-to-end ์ž๋™ํ™”์˜ ๋˜ ๋‹ค๋ฅธ ์„ฑ๊ณต ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
The AI Scientist: ์ž๋™ ๊ณผํ•™๋ฐœ๊ฒฌ์˜ ๊ตฌ์ฒด์  ๊ตฌํ˜„์„ ํ†ตํ•ด Nobel Turing Challenge์˜ ๋น„์ „์„ ์‹ค์งˆ์ ์œผ๋กœ ๋ฐœ์ „์‹œํ‚ค๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
The AI Scientist ๋…ผ๋ฌธ์€ AI4Science์˜ ์ž๋™ํ™” ๋ฐ ํŒจ๋Ÿฌ๋‹ค์ž„์  ์ „ํ™˜์„ ์‹ค์ œ fully automated scientist ๊ตฌํ˜„ ์‚ฌ๋ก€๋กœ ํ™•์žฅํ•ด์„œ ๋‹ค๋ฃฌ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
CycleResearcher๋Š” ๋…ผ๋ฌธ ์ž‘์„ฑ-๋ฆฌ๋ทฐ-๊ฐœ์„ ์˜ ์ˆœํ™˜์  ์ž๋™ํ™”์™€ ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€ ์ˆ˜์ค€์˜ ๋ฆฌ๋ทฐ ์„ฑ๋Šฅ ๋น„๊ต๋ฅผ ์‹ค์ฆํ•˜์—ฌ, AI Scientist์˜ ์ž๋™ํ™”๋œ ์—ฐ๊ตฌ ์‚ฌ์ดํด์„ ๋ณด์™„์ ์œผ๋กœ ์‚ดํ•„ ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
795 ๋…ผ๋ฌธ์€ 844์˜ LLM ์œ ๋™ ์ง€๋Šฅ ํ‰๊ฐ€๋ฅผ ๋„˜์–ด, AI Scientist๋กœ์„œ์˜ LLM ์ž๋™ ๊ณผํ•™ ๋ฐœ๊ฒฌ ํ…Œ์ŠคํŠธ๋ฅผ ๋ฐœ์ „์‹œํ‚ต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
795๋Š” SOTA ์ˆ˜์ค€ ์ž๋™ ๊ณผํ•™๋ฐœ๊ฒฌ ์—์ด์ „ํŠธ ๊ฐœ๋ฐœ์„ ์ถ”๊ตฌํ•˜๋ฉด์„œ, 922์—์„œ ๋ณด์—ฌ์ค€ ์ธ๊ฐ„+AI ์กฐํ•ฉ์˜ ๊ฐ€๋Šฅ์„ฑ์„ ์ž๋™ํ™” ์ˆ˜์ค€๊นŒ์ง€ ์ด๋ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
The AI Scientist ๋…ผ๋ฌธ์€ Sparks์™€ ์œ ์‚ฌํ•˜๊ฒŒ ์™„์ „ ์ž๋™ํ™”๋œ ๊ณผํ•™์ž AI ์‹œ์Šคํ…œ์˜ ์‹คํ˜„ ๊ฐ€๋Šฅ์„ฑ์„ ๋‹ค์–‘ํ•œ ๊ณผํ•™ ๋ถ„์•ผ์—์„œ ์ถ”๊ฐ€๋กœ ์ž…์ฆํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery๋Š” LLM ๊ธฐ๋ฐ˜ AI-๊ณผํ•™์ž ์‹œ์Šคํ…œ์„ ๊ฐ•์กฐํ•˜๋ฉฐ, ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ๊ณผ ์ƒํ˜ธ์ž‘์šฉ ๋ชจ๋“ˆ ๊ฐœ๋…๊ณผ ์—ฐ๊ด€์ง€์–ด ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
The AI Scientist-v2 ๋…ผ๋ฌธ์€ ํ•œ์ธต ๋” ์ง„ํ™”๋œ ์ž๋™ํ™” ์›Œํฌ์ˆ๊ธ‰ ๊ณผํ•™ ๋…ผ๋ฌธ ์ƒ์‚ฐ ๋ฐ ํ‰๊ฐ€ ์‹œ์Šคํ…œ์œผ๋กœ, ์ดˆ๊ธฐ AI Scientist ์‹œ์Šคํ…œ์˜ ์ž ์žฌ๋ ฅ๊ณผ ํ•œ๊ณ„๋ฅผ ์‹ค์งˆ์ ์œผ๋กœ ํ™•์žฅํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI-Researcher ๋…ผ๋ฌธ๋„ ๊ณผํ•™ ์—ฐ๊ตฌ ์ „์ฒด ํŒŒ์ดํ”„๋ผ์ธ์„ ์ž๋™ํ™”ํ•˜๋Š” AI ์‹œ์Šคํ…œ์„ ๋‹ค๋ฃจ์–ด AI Scientist๊ฐ€ ์ œ์‹œํ•˜๋Š” ์˜คํ”ˆ์—”๋””๋“œ ์ž๋™ํ™”์™€ ์ผ๋งฅ์ƒํ†ตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
The AI Scientist(795)๋Š” ์™„์ „ ์ž๋™ํ™” ๊ณผํ•™ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์ง€ํ–ฅ์ ์„ ์ œ์‹œํ•˜๋ฉฐ, 436์—์„œ ๊ตฌํ˜„๋œ ์—ฐ๊ตฌ ์ „ ๊ณผ์ • ์ž๋™ํ™”์˜ ํ™•์žฅ ๋น„์ „๊ณผ ๋งž๋‹ฟ์•„ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
795๋ฒˆ ๋…ผ๋ฌธ์€ fully automated open-ended AI scientist ์‹œ์Šคํ…œ ๊ฐœ๋ฐœยท์ž„์ƒ์— ์ค‘์ ์„ ๋‘์–ด, 352๋ฒˆ์˜ Agentic Science ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์‹ค์งˆ์ ์œผ๋กœ ๊ตฌํ˜„ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
The AI Scientist-v2 ๋…ผ๋ฌธ์€ ๊ณผํ•™ ํŒจ๋Ÿฌ๋‹ค์ž„ ์ „ํ™˜์—์„œ ์‹ค์ œ fully-automated open-ended discovery system ๊ตฌํ˜„ ์‚ฌ๋ก€๋กœ ์ด์–ด์ง„๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
795๋ฒˆ์€ AI Scientist ์‹œ์Šคํ…œ์˜ ์‹ ๋ขฐ์„ฑ๊ณผ ์‹ ๋ขฐ ๋ฉ”ํŠธ๋ฆญ ์ ์šฉ, ์‹ค์ œ ๋ฐ˜๋ณต ๊ฐ€๋Šฅ์„ฑ๊ณผ ์•ˆ์ „์„ฑ ๋ฌธ์ œ๋ฅผ ์‹ฌํ™”ํ•˜์—ฌ ๋…ผ์˜ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
795๋ฒˆ ๋…ผ๋ฌธ์€ ์™„์ „ ์ž๋™ํ™”๋œ ์˜คํ”ˆ์—”๋””๋“œ ๊ณผํ•™ ์›Œํฌํ”Œ๋กœ์šฐ AI(โ€˜AI Scientistโ€™)๋ฅผ ์ œ์‹œํ•ด, 3090์˜ ํ†ตํ•ฉ biosequence ์„ค๊ณ„ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๋ฏธ๋ž˜ ๋ฐฉํ–ฅ ์ œ์‹œ์— ๋„์›€์„ ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
The AI Scientist๋Š” Fully Automated Open-Ended Scientific Discovery๋ฅผ ํ†ตํ•œ AlphaFold ๋“ฑ ์‹ค์งˆ ๊ณผํ•™ ๋ฐœ์ „ ์˜ํ–ฅ ํ‰๊ฐ€์— ๋Œ€ํ•œ ์‚ฌ๋ก€ ํ™•์žฅ์—ฐ๊ตฌ๋กœ, 3130์˜ ์‹ค์ฆ๋ถ„์„์„ ๋ณด์™„ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ์ž๋™ ๊ณผํ•™ ์‹คํ—˜ยท๋ฐœ๊ฒฌ์˜ ์—”๋“œํˆฌ์—”๋“œ ์ž๋™ํ™” ์‹œ์Šคํ…œ์˜ ๋ฐœ์ „ ๋ฐฉํ–ฅ์„ ๋ณด์—ฌ์คŒ.
์‘์šฉ ์‚ฌ๋ก€
Discovering symbolic differential equations with symmetry in AI Scientist ์‹œ์Šคํ…œ์—์„œ ์ƒ์„ฑ๋œ ๋…ผ๋ฌธ ๋ฐ ์•„์ด๋””์–ด๋ฅผ ์‹ค์ œ ์ˆ˜ํ•™์  ๊ณต์‹ ๋ฐœ๊ฒฌ ๋ฌธ์ œ์— ์ ์šฉํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
The AI Scientist ๋…ผ๋ฌธ์€ LLM์˜ ์‹ค์ œ ๊ธฐ์ˆ ์  ์ž๊ฐ€์„ฑ์žฅ ๋ฐ ์ง€์‹ ํ™œ์šฉ ํ•œ๊ณ„๋ฅผ ์‹คํ—˜์ ์œผ๋กœ ๋ณด์—ฌ์ฃผ๋ฉฐ, ์ž๋™ํ™” ๊ณผํ•™ ์ˆ˜ํ–‰์—์„œ expertise assessment์˜ ์‹ค์ œ์  ์˜๋ฏธ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
๋‘˜ ๋‹ค AI Scientist์˜ ํ•œ๊ณ„์™€ ๊ฐ€๋Šฅ์„ฑ์„ ๋น„ํŒ์ ์œผ๋กœ ํ‰๊ฐ€ํ•˜๋Š” ๋…ผ๋ฌธ์œผ๋กœ, ๊ฐ์ž์˜ ์‹คํ—˜์  ๋ถ„์„์— ๊ธฐ๋ฐ˜ํ•ด ์„œ๋กœ์˜ ๊ฒฐ๋ก ์„ ํ™•์ธยท๋ณด์™„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
Towards a Science of AI Agent Reliability๋Š” ์ž๋™ํ™” ๊ณผํ•™ ์‹œ์Šคํ…œ์˜ ์‹ ๋ขฐ์„ฑยทํ•œ๊ณ„๋ฅผ ์ง‘์ค‘์ ์œผ๋กœ ๋…ผ์˜ํ•˜๋ฉฐ, AI Scientist์˜ ์‹ค์šฉ์„ฑ/ํ•œ๊ณ„์™€ ๊ท ํ˜• ์žˆ๊ฒŒ ์ฝ๊ธฐ ์ข‹๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
์™„์ „ ์ž๋™ํ™”๋œ AI ๊ณผํ•™์ž ์‹œ์Šคํ…œ์˜ ์ถ”๊ตฌ์™€, ์ธ๊ฐ„์ค‘์‹ฌ ๊ฒ€์ฆ ๊ฐ•์กฐ๋ผ๋Š” ๊ด€์ ์—์„œ ์ƒ๋ฐ˜๋œ ์‹œ๊ฐ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •