Advancing the scientific method with large language models: From hypothesis to discovery

์ €์ž: Yanbo Zhang, Sumeer A. Khan, Adnan Mahmud, Huck Yang, Alexander Lavin, Michael Levin, Jeremy Frey, Jared Dunnmon, James Evans, Alan Bundy, Saso Dzeroski, Jesper Tegner, Hector Zenil | ๋‚ ์งœ: 2025 | DOI: ๋ฏธ๊ธฐ์žฌ 📄 PDF


Essence

Figure 1

LLM์˜ ๊ธฐ๋ณธ ์ž‘๋™ ์›๋ฆฌ: (A) ํ† ํฐ์˜ ์ž๋™ํšŒ๊ท€์  ์ƒ์„ฑ, (B) ํ”„๋กฌํ”„ํŠธ ๊ตฌ์กฐ, (C) LLM ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ

๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์ด ๊ณผํ•™ ์—ฐ๊ตฌ์˜ ๊ฐ ๋‹จ๊ณ„์—์„œ ์ƒ์‚ฐ์„ฑ ํ–ฅ์ƒ๊ณผ ๊ณผํ•™์  ๋ฐœ๊ฒฌ์„ ์ง€์›ํ•˜๋Š” ๋„๊ตฌ๋กœ์„œ ๋ณ€ํ™”ํ•˜๋Š” ๊ณผํ•™ ๋ฐฉ๋ฒ•๋ก ์„ ์žฌ์ •์˜ํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, ์ด๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ™œ์šฉํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ธ๊ฐ„ ๊ณผํ•™์ž์™€์˜ ํ˜‘๋ ฅ ๋ฐ ๋ช…ํ™•ํ•œ ํ‰๊ฐ€ ์ง€ํ‘œ๊ฐ€ ํ•„์ˆ˜์ ์ด๋‹ค.

Motivation

Achievement

Figure 1

LLM ํ”„๋กฌํ”„ํŒ…์˜ ์ง„ํ™”: ์ฑ—๋ด‡์—์„œ ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง๊ณผ LLM ์—์ด์ „ํŠธ๋กœ์˜ ์ „ํ™˜

  1. LLM์˜ ๋‹ค์ธต์  ์—ญํ•  ์ •๋ฆฝ: ๋‹จ์ˆœ ํ…์ŠคํŠธ ์ฒ˜๋ฆฌ ๋ณด์กฐ(์ฝ”ํŒŒ์ผ๋Ÿฟ) ์ˆ˜์ค€์—์„œ๋ถ€ํ„ฐ ๊ฐ€์„ค ์ƒ์„ฑ, ์‹คํ—˜ ์„ค๊ณ„, ์ž์œจ์  ์‹คํ—˜ ์ˆ˜ํ–‰๊นŒ์ง€ ๊ณผํ•™ ํ”„๋กœ์„ธ์Šค ์ „ ๋‹จ๊ณ„๋ฅผ ์ง€์›ํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์„ ์ฒด๊ณ„ํ™”
  2. ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง์˜ ๊ณผํ•™ํ™”: Chain-of-Thought(CoT), Retrieval-Augmented Generation(RAG), ์ž๋™ ํ”„๋กฌํ”„ํŠธ ์„ค๊ณ„(DSPy, TextGrad) ๋“ฑ LLM ์„ฑ๋Šฅ ์ตœ์ ํ™” ๊ธฐ๋ฒ•์˜ ์ข…ํ•ฉ์  ์ •๋ฆฌ
  3. LLM ์—์ด์ „ํŠธ ํŒจ๋Ÿฌ๋‹ค์ž„์˜ ์ œ์‹œ: ๋‹จ์ˆœ ํ”„๋กฌํ”„ํŠธ๋ฅผ ๋„˜์–ด ์™ธ๋ถ€ ๋„๊ตฌ ํ†ตํ•ฉ, ํ™˜๊ฒฝ ๊ด€์ฐฐ, ์ž์œจ์  ์˜์‚ฌ๊ฒฐ์ •์ด ๊ฐ€๋Šฅํ•œ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์œผ๋กœ์˜ ์ง„ํ™” ๋ฐฉํ–ฅ ์ œ์‹œ
  4. ๊ณผํ•™์  ์ ์šฉ ์‚ฌ๋ก€์˜ ์‹ค์ฆ: ๋…ผ๋ฌธ ์ž‘์„ฑ, ์ฝ”๋“œ ์ƒ์„ฑ, ๋ฌธํ—Œ ๋ถ„์„ ๋“ฑ ์‹ค์ œ ๊ณผํ•™ ํ˜„์žฅ์—์„œ์˜ ์ƒ์‚ฐ์„ฑ ํ–ฅ์ƒ ์‚ฌ๋ก€ ์ œ์‹œ

How

Figure 1

LLM์˜ ์ž‘๋™ ๋ฉ”์ปค๋‹ˆ์ฆ˜๊ณผ ๊ณผํ•™์  ํ™œ์šฉ ์•„ํ‚คํ…์ฒ˜

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ LLM์ด ๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์ƒ์‚ฐ์„ฑ ๋„๊ตฌ์—์„œ ์ฐฝ์˜์  ์—”์ง„์œผ๋กœ ์ง„ํ™”ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฐ€๋Šฅ์„ฑ์„ ์ œ์‹œํ•˜๋Š” ์ค‘์š”ํ•œ ๊ด€์ ์„ ์ œ๊ณตํ•˜์ง€๋งŒ, ํ˜„์‹ค์  ํ•œ๊ณ„(ํ• ๋ฃจ์‹œ๋„ค์ด์…˜, ๊ธฐ์ดˆ ๊ณผํ•™ ๊ธฐ์—ฌ๋„ ์ œํ•œ)์— ๋Œ€ํ•œ ๊ตฌ์ฒด์  ํ•ด๊ฒฐ์ฑ… ์ œ์‹œ์™€ ์‹ค์ฆ์  ๊ฒ€์ฆ์ด ๋ณด๊ฐ•๋˜์–ด์•ผ ํ•  ๊ฒƒ์œผ๋กœ ๋ณด์ธ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ๋„๊ตฌ์˜ ํ™œ์šฉ๋ฒ•์„ ์ œ์‹œํ•œ ๊ฐ€์ด๋“œ๋กœ์„œ, LLM ํ™œ์šฉ์— ๋Œ€ํ•œ ์‹ค์งˆ์  ์ „๋žต ์ˆ˜๋ฆฝ์— ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์ด ๊ณผํ•™ ์—ฐ๊ตฌ ๋ฐฉ๋ฒ•๋ก ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ๋‹ค๋ฅธ ๊ด€์ ์—์„œ ๋ถ„์„ํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM๊ณผ ๊ณผํ•™์ž์˜ ํ˜‘๋ ฅ์„ ํ†ตํ•œ ์—ฐ๊ตฌ ๊ฐ€์†ํ™”๋ฅผ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์œผ๋กœ ๋‹ค๋ฃจ๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์—ฐ๊ตฌ ์ž๋™ํ™”๋ฅผ ๋‹ค๋ฅธ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ๊ตฌํ˜„ํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋ฐฉ๋ฒ•๋ก ์˜ ๋ณ€ํ™”์—์„œ ์ธ๊ฐ„-AI ์ง€์‹์ฐฝ์ถœ์˜ ๊ณต์ง„ํ™”์  ์ ‘๊ทผ์„ ๋‹ด์•„, ํ˜‘๋ ฅ ํŒจ๋Ÿฌ๋‹ค์ž„ ํ™•์žฅ์˜ ๋Œ€์•ˆ์  ๊ด€์ ์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ์ƒ์„ฑ ๊ณผํ•™ ์•„์ด๋””์–ด์˜ ์ฐฝ์˜์„ฑ ๋ฐ ์ฐธ์‹ ์„ฑ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋Œ€์•ˆ์  ์ ‘๊ทผ๋ฒ•์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ•™์ˆ  ์ถœํŒ ๊ณผ์ •์—์„œ LLM ํ™œ์šฉ์˜ ์˜ํ–ฅ๊ณผ ์œ„ํ—˜์„ฑ์„ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ์—ฐ๊ตฌ์—์„œ LLM ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ์ƒ์„ฑ ๋ฐ ํ˜์‹ ์„ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI๋ฅผ ํ™œ์šฉํ•œ ๊ณผํ•™์  ๋ฐœ๊ฒฌ ๋ฐ ์—ฐ๊ตฌ ์ƒ์‚ฐ์„ฑ ํ–ฅ์ƒ์„ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ๋‹ค๋ฃจ๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ์—ฐ๊ตฌ์—์„œ์˜ AI ํ™œ์šฉ ๋ฐฉ๋ฒ•๋ก ์„ ๋‹ค๋ฅธ ๊ฐ๋„์—์„œ ๊ฒ€ํ† ํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๋„๊ตฌ๊ฐ€ ๊ณผํ•™ ์—ฐ๊ตฌ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ๋‹ค๋ฅธ ์‹ค์ฆ์  ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ๋ถ„์„ํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ ๊ณผํ•™์  ๋ฐœ๊ฒฌ ์ž๋™ํ™” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ์ฐฝ์˜์„ฑ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ๋Œ€์•ˆ์  ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
โ€˜AI ๊ณต๋™๊ณผํ•™์žโ€™๋ผ๋Š” ๊ฐœ๋…์„ ๋”์šฑ ๊ตฌ์ฒด์ ์œผ๋กœ ๊ตฌํ˜„ํ•œ ๋…ผ๋ฌธ์œผ๋กœ, ๋ณ€ํ™”ํ•˜๋Š” ๊ณผํ•™ ๋ฐฉ๋ฒ•๋ก ์˜ ๋ฏธ๋ž˜์ƒ์„ ํ•จ๊ป˜ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
038๋ฒˆ ๋…ผ๋ฌธ์€ ๊ณผํ•™์  ์—ฐ๊ตฌ ์ „์ฃผ๊ธฐ ์ž๋™ํ™” ํ”„๋ ˆ์ž„์›Œํฌ(Auto Research)๋ฅผ ์ œ์•ˆํ•˜์—ฌ, 056๋ฒˆ์ด ๋…ผ์˜ํ•œ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋ฐฉ๋ฒ•๋ก ์˜ ๋ณ€ํ™”์ƒ์— ๊ตฌ์ฒด์  ์„ค๊ณ„๋ฅผ ๋ง๋ถ™์ธ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋Œ€๊ทœ๋ชจ ๋ฌผ๋ฆฌํ•™ AI์™€ ์–ธ์–ด ๋ชจ๋ธ์˜ ๊ณผํ•™ ๋ฐฉ๋ฒ•๋ก  ๋ณ€ํ™”๋ฅผ ๋…ผ์˜ํ•˜๋ฉฐ, ๋‘ ๋…ผ๋ฌธ ๋ชจ๋‘ ์ธ๊ฐ„-AI ํ˜‘๋ ฅ์˜ ๊ตฌ์กฐ์  ๋ณ€ํ™”๋ฅผ ํ•ต์‹ฌ ์ฃผ์ œ๋กœ ๋‹ค๋ฃฌ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜์˜ ์—์ด์ „ํ‹ฑ AI๊ฐ€ ๊ณผํ•™์  ๋ฐฉ๋ฒ•๋ก  ๊ฐ ๋‹จ๊ณ„๋ฅผ ์ž๋™ํ™”ํ•˜๋Š” ๊ตฌ์ฒด์  ํ˜„ํ™ฉ ๋ฐ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ •๋ฆฌํ•˜๊ณ  ์žˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๊ฐ€์„ค ๋„์ถœ ๋Šฅ๋ ฅ์ด ์‹ค์ œ ๊ณผํ•™์  ์ƒ์‚ฐ๊ณผ์ •์—์„œ ์–ด๋–ป๊ฒŒ ํ™œ์šฉ๋˜๋Š”์ง€ LLM ์ƒ์‚ฐ์„ฑ ํ–ฅ์ƒ ๋งฅ๋ฝ์œผ๋กœ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
LLM์ด ์‹ค์ œ ๊ณผํ•™์  ์ƒ์‚ฐ์„ฑ ํ–ฅ์ƒ์— ์–ด๋–ป๊ฒŒ ์“ฐ์ด๋Š”์ง€ ์‚ฌ๋ก€์  ์‹œ๊ฐ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋ฐฉ๋ฒ•๋ก ์˜ ๊ธ์ •์  ํ˜์‹ ์„ ๊ฐ•์กฐํ•˜๋Š” ๋…ผ๋ฌธ์œผ๋กœ, ์ƒ์‚ฐ์„ฑ-๋‹ค์–‘์„ฑ ๊ฐ„ ๊ท ํ˜•์— ๋Œ€ํ•œ ๋…ผ์˜์— ๋„์›€์„ ์ค€๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •