Sparks of science: Hypothesis generation using structured paper data

์ €์ž: C. O'Neill, Tirthankar Ghosal, R. Raileanu, Mike Walmsley, Thang Bui, Kevin Schawinski, Ioana Ciuca | ๋‚ ์งœ: 2025 | DOI: ๋ฏธ๊ณต๊ฐœ 📄 PDF


Essence

Figure 1

HypoGen ํŒŒ์ดํ”„๋ผ์ธ: ๋…ผ๋ฌธ ์ดˆ๋ก์—์„œ Bit-Flip-Spark ๊ตฌ์กฐ์™€ Chain-of-Reasoning์„ ์ถ”์ถœํ•˜์—ฌ ๋ชจ๋ธ ํŒŒ์ธํŠœ๋‹์— ์‚ฌ์šฉ

๋ณธ ๋…ผ๋ฌธ์€ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ(Scientific Hypothesis Generation, SHG)์„ ์กฐ๊ฑด๋ถ€ ์–ธ์–ด ๋ชจ๋ธ๋ง(conditional language modeling) ๋ฌธ์ œ๋กœ ํ”„๋ ˆ์ž„ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ์•ฝ 5,500๊ฐœ์˜ ๊ตฌ์กฐํ™”๋œ ๋ฌธ์ œ-๊ฐ€์„ค ์Œ์œผ๋กœ ๊ตฌ์„ฑ๋œ HypoGen ๋ฐ์ดํ„ฐ์…‹์„ ์†Œ๊ฐœํ•œ๋‹ค. Bit(๊ธฐ์กด ๊ฐ€์ •)-Spark(ํ•ต์‹ฌ ํ†ต์ฐฐ)-Flip(ํ˜์‹ ์  ์ œ์•ˆ) ์Šคํ‚ค๋งˆ์— ๋ช…์‹œ์  ์ถ”๋ก  ์ฒด์ธ์„ ๊ฒฐํ•ฉํ•˜์—ฌ ์ƒ์„ฑ๋œ ๊ฐ€์„ค์˜ ์‹ ์„ฑ(novelty)๊ณผ ํƒ€๋‹น์„ฑ(feasibility)์„ ํ–ฅ์ƒ์‹œํ‚จ๋‹ค.

Motivation

Achievement

Figure 2

9๊ฐ€์ง€ ์‹คํ—˜ ๊ตฌ์„ฑ์—์„œ ์ƒ์„ฑ๋œ ๊ฐ€์„ค์˜ ์งˆ์— ๋Œ€ํ•œ ๋น„๊ต ๋ถ„์„

  1. HypoGen ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•: ์ปดํ“จํ„ฐ๊ณผํ•™ ์ตœ์ƒ์œ„ ํ•™ํšŒ์—์„œ ์ถ”์ถœํ•œ ์•ฝ 5,500๊ฐœ์˜ ๊ตฌ์กฐํ™”๋œ ๋ฌธ์ œ-๊ฐ€์„ค ์Œ์œผ๋กœ ๊ตฌ์„ฑ๋œ ์ตœ์ดˆ์˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ์ดํ„ฐ์…‹ ๊ฐœ๋ฐœ. ๊ฐ ํ•ญ๋ชฉ์— ์ƒ์„ธํ•œ ์ถ”๋ก  ์ฒด์ธ(Chain-of-Reasoning)์ด ํฌํ•จ๋˜์–ด ์ธ๊ฐ„ ๊ณผํ•™์ž์˜ ์‚ฌ๊ณ  ๊ณผ์ •์„ ์ถฉ์‹คํ•˜๊ฒŒ ๋ฐ˜์˜.
  2. ์„ฑ๋Šฅ ํ–ฅ์ƒ ์ž…์ฆ: HypoGen ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ํŒŒ์ธํŠœ๋‹๋œ LLaMA ๊ธฐ๋ฐ˜ ๋ชจ๋ธ์ด ์‹ ์„ฑ์„ฑ, ํƒ€๋‹น์„ฑ, ์ „๋ฐ˜์  ํ’ˆ์งˆ ์ธก๋ฉด์—์„œ ๋ฒ ์ด์Šค๋ผ์ธ ๋ชจ๋ธ ๋Œ€๋น„ ๊ฐœ์„ ๋œ ๊ฐ€์„ค์„ ์ƒ์„ฑํ•จ์„ ์ž๋™ํ™” ๋ฉ”ํŠธ๋ฆญ๊ณผ LLM ํŒ์‚ฌ(Claude 3.7 Sonnet)์˜ ํ‰๊ฐ€๋ฅผ ํ†ตํ•ด ์ž…์ฆ.
  3. ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ ์ œ์‹œ: ์‹ ์„ฑ์„ฑ๊ณผ ํƒ€๋‹น์„ฑ์„ ์ค‘์‹ฌ์œผ๋กœ ํ•œ ๊ตฌ์กฐํ™”๋œ ํ‰๊ฐ€ ์ฒด๊ณ„ ์ˆ˜๋ฆฝ์œผ๋กœ, ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์˜ ์งˆ์„ ์ฒด๊ณ„์ ์œผ๋กœ ์ธก์ •ํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ์ดˆ ๋งˆ๋ จ.

How

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ฌธ์ œ๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ์ ‘๊ทผํ•˜๊ธฐ ์œ„ํ•ด ์ฒซ ๋Œ€๊ทœ๋ชจ ๊ตฌ์กฐํ™” ๋ฐ์ดํ„ฐ์…‹์„ ์ œ์‹œํ•˜๊ณ , Chain-of-Reasoning์„ ๋ช…์‹œ์ ์œผ๋กœ ํ†ตํ•ฉํ•œ ์ ์—์„œ ๋†’์€ ์ฐฝ์˜์„ฑ์„ ๋ณด์ธ๋‹ค. ๋‹ค๋งŒ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก ์˜ ์—„๋ฐ€์„ฑ ๊ฐ•ํ™”, ๋‹ค๋ถ„์•ผ ํ™•์žฅ, ์‹ค์ œ ๊ณผํ•™์ž ๊ฒ€์ฆ์„ ํ†ตํ•œ ๊ฒ€์ฆ์ด ์™„์„ฑ๋„๋ฅผ ์œ„ํ•ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ ํƒ์ƒ‰์—์„œ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•๋ก ์„ ์ ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419๋Š” LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ์„ ๋„“์€ ์‹œ๊ฐ์—์„œ ๋ถ„์„ํ•˜์—ฌ, 763์˜ ๋ฐ์ดํ„ฐ์…‹ ์„ค๊ณ„์™€ ํ‰๊ฐ€์˜ ๋ถ„์„ ํ‹€์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
417 ๋…ผ๋ฌธ์€ ๊ณผํ•™์  ๊ฐ€์„ค ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ์ฒด๊ณ„์  ๋ฒค์น˜๋งˆํฌ๋ฅผ ๊ตฌ์ถ•ํ•ด 763์˜ HypoGen ๋ฐ์ดํ„ฐ์…‹ ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ ํ”„๋ ˆ์ž„ ์„ค๊ณ„์— ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
763์€ ๊ฐ€์„ค ์ƒ์„ฑ์šฉ ๊ตฌ์กฐํ™” ๋ฐ์ดํ„ฐ์…‹๊ณผ ๋ชจ๋ธ์„ ์ œ์•ˆํ•˜๋ฉฐ, 820์—์„œ ๋ฒค์น˜๋งˆํฌ๋กœ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ตฌ์กฐํ™”๋œ ๋…ผ๋ฆฌ์  ํŒจํ„ด์„ ํ™œ์šฉํ•œ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์„ ๋‹ค๋ฃจ์–ด, AstroAgents์˜ ์•„์ด๋””์–ด ์ƒ์„ฑ ๋ฐ ๋น„ํŒ์  ํ‰๊ฐ€ ํ”„๋กœ์„ธ์Šค์— ์ฃผ์š” ๊ทผ๊ฑฐ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ตฌ์กฐํ™”๋œ ๋…ผ๋ฌธ ์ •๋ณด๋ฅผ ํ™œ์šฉํ•œ LLM ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ๋ฐ ์•„์ด๋””์–ด ์ƒ์„ฑ ์—ฐ๊ตฌ์˜ ์ „๋ฐ˜์  ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
763๋ฒˆ ๋…ผ๋ฌธ์€ LLM์„ ํ†ตํ•œ ๊ตฌ์กฐํ™”๋œ ๋…ผ๋ฌธ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์‹คํ—˜ยทํ‰๊ฐ€ํ•˜์—ฌ, 476๋ฒˆ์˜ Agent K ์‚ฌ๋ก€์™€ ์„ฑ๊ณผ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Sparks of science ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜์˜ ๊ตฌ์กฐํ™”๋œ ๋…ผ๋ฌธ ์ •๋ณด ํ™œ์šฉ์„ ํ†ตํ•œ ๊ฐ€์„ค ์ƒ์„ฑ์˜ ๋˜๋‹ค๋ฅธ ์‹ค์ œ ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
831์€ ์ง€๊ตฌ๊ณผํ•™ ์˜์—ญ์—์„œ ์ž๋™ ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ ๊ฒ€์ฆ์„ ๋ชจ์ƒ‰ํ•˜์—ฌ, 763์˜ ์ƒ๋ช…๊ณผํ•™ ์‚ฌ๋ก€์™€ AI ๊ธฐ๋ฐ˜ ๊ณผํ•™ํƒ๊ตฌ ์ฒด๊ณ„๋ฅผ ๋ถ„์•ผ์ ์œผ๋กœ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
763 ๋…ผ๋ฌธ์€ ์ƒ์˜ํ•™ ๋…ผ๋ฌธ ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์„ ๋ชฉํ‘œ๋กœ ํ•˜๋ฉฐ, ์ฃผ์žฅ ๊ฒ€์ฆ๊ณผ ๊ฐ€์„ค ์ƒ์„ฑ ๋ชจ๋‘์—์„œ LLM์˜ ์‘์šฉ์„ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
719 ๋…ผ๋ฌธ์€ GPT-4๋กœ ๊ณผํ•™์  ์น˜๋ฃŒ ์•„์ด๋””์–ด ์ƒ์„ฑ ๋ฐ ์‹คํ—˜์‹ค ๊ฒ€์ฆ์„ ํ†ตํ•ด LLM์˜ ๊ฐ€์„ค ์ƒ์„ฑ ๋Šฅ๋ ฅ ํ‰๊ฐ€์— ์ฃผ๋ ฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Sparks of science ๋…ผ๋ฌธ์€ ์—์ด์ „ํŠธ ํ™•์žฅ๋ณด๋‹ค๋Š” ๊ตฌ์กฐ์  ํŒจํ„ด ๊ธฐ๋ฐ˜ ์ฐฝ์˜์„ฑ ์ฆ์ง„์— ์ดˆ์ ์„ ๋งž์ถ”์–ด ์ƒํ˜ธ๋ณด์™„๋œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
820์€ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๊ฐ€์„ค ์‹ ๋ขฐ์„ฑ ํ‰๊ฐ€ ๋ฒค์น˜๋งˆํฌ๋ฅผ ์ œ์‹œ, 763์—์„œ ์ƒ์„ฑ๋œ ๊ฐ€์„ค๊ณผ์˜ ์ •ํ•ฉ๋„๋ฅผ ์ •๋Ÿ‰์ ์œผ๋กœ ์ธก์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
763์€ 725์˜ ์•„์ด๋””์–ด ์ƒ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฌ์กฐ์  ๋…ผ๋ฌธ ์ •๋ณด ํ™œ์šฉํ•œ ๊ฐ€์„ค ์ œ์‹œ์— ์ดˆ์ ์„ ๋งž์ถ”์–ด ํ™•์žฅ์  ๊ด€๊ณ„๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
310 ๋…ผ๋ฌธ์€ ๋ผ์ดํ”„์‚ฌ์ด์–ธ์Šค(centered)์˜ AI Discovery ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํ†ตํ•ด, 763์—์„œ ์ œ์•ˆํ•œ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์˜ ์‹คํ—˜์  ์‘์šฉ์„ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๊ตฌ์กฐํ™”๋œ ํŽ˜์ดํผ ํŒŒ์‹ฑ ๋ฐ ๊ฐ€์„ค ์ƒ์„ฑ์— MCTS, LLM ์ƒํ˜ธ์ž‘์šฉ์„ ์‹ค์ œ๋กœ ์ ์šฉํ•ด ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ƒ์„ฑ ์‹ค์šฉ์„ฑ ํ‰๊ฐ€์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
763์€ AI ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณต, 698์˜ ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ๋Œ€๊ทœ๋ชจ ์‹ค์ฆ ์‹คํ—˜ ์ž๋™ํ™”๋ฅผ ์‹ค์ œ ๊ณผํ•™์  ๋ฌธ์ œ ์ •์˜์— ์ ์šฉํ•˜๋Š” ๋งฅ๋ฝ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •