PaperRobot: Incremental Draft Generation of Scientific Ideas

์ €์ž: Qingyun Wang, Lifu Huang, Zhiying Jiang, Kevin Knight, Heng Ji, Mohit Bansal, Yi Luan | ๋‚ ์งœ: 2019 | DOI: 10.18653/v1/P19-1191 📄 PDF


Essence

Figure 1

PaperRobot์˜ ๋‹จ๊ณ„๋ณ„ ๋…ผ๋ฌธ ์ž‘์„ฑ ๊ณผ์ •: ๊ธฐ์กด ๋…ผ๋ฌธ ์ฝ๊ธฐ โ†’ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ตฌ์„ฑ โ†’ ์ƒˆ๋กœ์šด ์•„์ด๋””์–ด ์˜ˆ์ธก โ†’ ์ƒˆ๋กœ์šด ๋…ผ๋ฌธ ์ž‘์„ฑ

PaperRobot์€ ๊ธฐ์กด ์ƒ์˜ํ•™ ๋…ผ๋ฌธ์—์„œ ์ง€์‹ ๊ทธ๋ž˜ํ”„๋ฅผ ์ž๋™์œผ๋กœ ๊ตฌ์ถ•ํ•˜๊ณ , ๋งํฌ ์˜ˆ์ธก์„ ํ†ตํ•ด ์ƒˆ๋กœ์šด ๊ณผํ•™์  ์•„์ด๋””์–ด๋ฅผ ์ƒ์„ฑํ•œ ํ›„, ๋ฉ”๋ชจ๋ฆฌ-์–ดํ…์…˜ ๋„คํŠธ์›Œํฌ๋กœ ์ œ๋ชฉ, ์ดˆ๋ก, ๊ฒฐ๋ก ์„ ์ˆœ์ฐจ์ ์œผ๋กœ ์ž‘์„ฑํ•˜๋Š” ์ž๋™ ์—ฐ๊ตฌ ๋ณด์กฐ ์‹œ์Šคํ…œ์ด๋‹ค.

Motivation

Achievement

Figure 2

PaperRobot์˜ ์ „์ฒด ์•„ํ‚คํ…์ฒ˜: ์ง€์‹ ์ถ”์ถœ โ†’ ๋งํฌ ์˜ˆ์ธก โ†’ ๋ฉ”๋ชจ๋ฆฌ-์–ดํ…์…˜ ๊ธฐ๋ฐ˜ ํ…์ŠคํŠธ ์ƒ์„ฑ

  1. Turing ํ…Œ์ŠคํŠธ ์„ฑ๊ณผ: ์ƒ์˜ํ•™ ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€์— ์˜ํ•œ ํ‰๊ฐ€์—์„œ ์‹œ์Šคํ…œ ์ƒ์„ฑ ์ดˆ๋ก์ด ์ธ๊ฐ„ ์ž‘์„ฑ ์ดˆ๋ก๋ณด๋‹ค 30% ์„ ํ˜ธ๋˜๊ณ , ๊ฒฐ๋ก ๊ณผ ํ–ฅํ›„ ์—ฐ๊ตฌ๊ฐ€ 24%, ์ƒˆ๋กœ์šด ์ œ๋ชฉ์ด 12% ์„ ํ˜ธ๋จ.
  2. ์ตœ์†Œํ•œ์˜ ํŽธ์ง‘์œผ๋กœ ์‚ฌ์šฉ ๊ฐ€๋Šฅ: ๋Œ€๋ถ€๋ถ„์˜ ์ƒ์„ฑ๋œ ์ดˆ๋ก์€ ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€์˜ ์ตœ์†Œํ•œ์˜ ์ˆ˜์ •๋งŒ์œผ๋กœ ์ •๋ณด์ ์ด๊ณ  ์ผ๊ด€๋œ ๋…ผ๋ฌธ์œผ๋กœ ๋ณ€ํ™˜ ๊ฐ€๋Šฅ.
  3. ํฌ๊ด„์  ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ตฌ์„ฑ: CTD(Comparative Toxicogenomics Database) ๊ธฐ๋ฐ˜์œผ๋กœ ์งˆ๋ณ‘(Disease), ํ™”ํ•™๋ฌผ์งˆ(Chemical), ์œ ์ „์ž(Gene) ๋“ฑ 3๊ฐ€์ง€ ์—”ํ‹ฐํ‹ฐ ์œ ํ˜•๊ณผ 133๊ฐœ ๊ด€๊ณ„ ์„œ๋ธŒํƒ€์ž…์„ ์ถ”์ถœํ•˜์—ฌ ํ’๋ถ€ํ•œ ๋ฐฐ๊ฒฝ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ตฌ์ถ•.

How

Figure 3

์ง€์‹ ์ถ”์ถœ ๋ฐ ๋งํฌ ์˜ˆ์ธก ์˜ˆ์‹œ: Calcium๊ณผ Zinc์˜ ๋งฅ๋ฝ ์ •๋ณด์™€ ๊ทธ๋ž˜ํ”„ ๊ตฌ์กฐ ์œ ์‚ฌ์„ฑ์„ ์ด์šฉํ•œ ์ƒˆ๋กœ์šด ์ด์›ƒ ์˜ˆ์ธก

1. ๋ฐฐ๊ฒฝ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ์ถ”์ถœ (Background Knowledge Extraction)

2. ๋งํฌ ์˜ˆ์ธก (Link Prediction)

3. ์ƒˆ๋กœ์šด ๋…ผ๋ฌธ ์ž‘์„ฑ (Writing New Paper)

Originality

Limitation & Further Study

Evaluation

์ดํ‰: PaperRobot์€ ์ƒ์˜ํ•™ ๋…ผ๋ฌธ ์ž๋™ ์ƒ์„ฑ์ด๋ผ๋Š” ์‹ค์ œ์  ๋ฌธ์ œ์— ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ ‘๊ทผ(๊ทธ๋ž˜ํ”„+ํ…์ŠคํŠธ)์„ ์ ์šฉํ•œ ์˜์š•์ ์ธ ์—ฐ๊ตฌ์ด๋ฉฐ, Turing ํ…Œ์ŠคํŠธ์—์„œ ์ธ๊ฐ„๊ณผ ๊ฒฝ์Ÿํ•  ์ˆ˜ ์žˆ๋Š” ์ˆ˜์ค€์˜ ์„ฑ๊ณผ๋ฅผ ๋ณด์˜€๋‹ค. ๋‹ค๋งŒ ์ƒ์„ฑ๋œ ํ…์ŠคํŠธ์˜ ๊ณผํ•™์  ์ •ํ™•์„ฑ ๊ฒ€์ฆ๊ณผ ์‹ค์ œ ํ™œ์šฉ๋„์— ๋Œ€ํ•œ ์‹ฌ์ธต ๋ถ„์„์ด ๋ณด์™„๋œ๋‹ค๋ฉด ํ•™์ˆ  ์ถœํŒ ์ƒํƒœ๊ณ„์— ์‹ค์งˆ์  ๊ธฐ์—ฌ๋ฅผ ํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
PaperRobot์€ ์—์ด์ „ํŠธํ˜• ๊ณผํ•™ ์•„์ด๋””์–ด ์ƒ์„ฑ ์‹œ์Šคํ…œ์˜ ์ฃผ์š” ์ดˆ๊ธฐ ์‚ฌ๋ก€๋กœ, ์ดํ›„ ๊ณผํ•™ LLM ๋ณด์กฐ ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ์˜ ์ด๋ก ์  ๊ทผ๊ฐ„์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Hypothesis Generation with Large Language Models ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ์•„์ด๋””์–ด ์ƒ์„ฑ ๊ธฐ๋ฒ•์„ ์ด๋ก ์ ์œผ๋กœ ๋ถ„์„ํ•˜์—ฌ PaperRobot์˜ ๊ทผ๊ฐ„์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
PaperRobot ๋…ผ๋ฌธ์€ L-CiteEval์˜ ์ธ์šฉ ์ •ํ™•๋„ ๋ฐ ์ž๋™ ํ‰๊ฐ€ ๋ฒค์น˜๋งˆํฌ ์„ค๊ณ„์— ์ด๋ก ์  ๊ทผ๊ฐ„์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
603์˜ PaperRobot์€ ๋…ผ๋ฌธ ์•„์ด๋””์–ด ์ƒ์„ฑ, ๋ฌธํ—Œ ๊ฒ€ํ† , ๋ถ„์„ ๋“ฑ 110์˜ ๋ฐ์ดํ„ฐ-๊ฐ€์„ค-๋ฌธํ—Œ ์ž๋™ ํŒŒ์ดํ”„๋ผ์ธ๊ณผ ์—ฐ๊ณ„๋˜๋Š” ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
603์˜ PaperRobot์€ ์ž๋™ ์•„์ด๋””์–ด ์ƒ์„ฑ, ๊ฐ€์„ค ์ƒ์„ฑ, ๋ฐ˜๋ณต์  ๋…ผ์˜ ๋“ฑ 149์˜ multi-agent ๊ฐ€์„ค ์ƒ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์ด๋ก ์  ๋ฐ”ํƒ•์ด ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
603 ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋‹จ๊ณ„์  ๊ณผํ•™ ๋…ผ๋ฌธ ์ดˆ์•ˆ ์ƒ์„ฑ์„ ์ œ๊ณตํ•ด 729์˜ ํ˜์‹ ์  ์•„์ด๋””์–ด ์ƒ์„ฑ ๋ฐ ๋…ผ๋ฌธ ์ œ์•ˆ ์‹œ์Šคํ…œ๊ณผ ๋Œ€์•ˆ์  ์—ฐ๊ด€์„ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
603 ๋…ผ๋ฌธ์€ AI๊ฐ€ ์ ์ง„์ ์œผ๋กœ ๋…ผ๋ฌธ ์ดˆ์•ˆ์„ ์ƒ์„ฑยท์ˆ˜์ •ํ•˜๋Š” ๊ณผ์ •์„ ๋‹ค๋ค„, 194์˜ ์ฒด์ธ ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ์ง„ํ™”์™€ ๋Œ€๋น„๋˜๋Š” bottom-up ์ƒ์„ฑ ๋ฐฉ์‹์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Scicueval์€ ๊ณผํ•™ ๋…ผ๋ฌธ ์š”์•ฝ ๋ฐ ์•„์ด๋””์–ด ๋„์ถœ ์ž๋™ํ™”์˜ ๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ•์„ ํ‰๊ฐ€ํ•˜์—ฌ, PaperRobot์˜ ์ž๋™ ์ดˆ์•ˆ ์ž‘์„ฑ ๋ฐฉ์‹๊ณผ ์„ฑ๊ณผ๋ฅผ ๋น„๊ตํ•˜๋Š” ์ฐธ๊ณ ์ž๋ฃŒ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
SurveyX๋Š” LLM ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ๋ถ„๋ฅ˜ยท์ž๋™ํ™” ์„œ๋ฒ ์ด ๋ถ„์•ผ๋กœ, PaperRobot์˜ ์ง€์‹๊ทธ๋ž˜ํ”„ ยท ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ์„ ํ™•์žฅยท์ ์šฉํ•˜๋Š” ์‚ฌ๋ก€๊ฐ€ ๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
603์€ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ดˆ์•ˆ ์ž๋™์ƒ์„ฑ ์‹œ์Šคํ…œ์œผ๋กœ, 1088๊ณผ ๊ฐ™์ด ๋…ผ๋ฌธ ๋ฐ์ดํ„ฐ ์ž๋™ ์ฒ˜๋ฆฌ๋ฅผ ๋ชฉํ‘œ๋กœ ํ•˜์ง€๋งŒ ํ˜์‹  ์ง€์ ์ด ๋‹ค๋ฅด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์—์ด์ „ํŠธ๊ฐ€ ๋…ผ๋ฌธ-ํŠนํ—ˆ ๋“ฑ research discovery๋ฅผ ์ž๋™ํ™”ํ•˜๋Š” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํ†ตํ•ด, PaperRobot๊ณผ ์ตœ์‹  agentic ์ ‘๊ทผ๋ฒ• ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ธ๊ฐ„-LLM ํ˜‘์—…์œผ๋กœ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ž๋™ํ™” ๋ฐ ํ‰๊ฐ€ ์‹œ์Šคํ…œ์˜ ์‚ฌ๋ก€๋กœ, PaperRobot์˜ ์•„์ด๋””์–ด ์ƒ์„ฑ ํ”Œ๋กœ์šฐ์™€ ์‹ค์งˆ์  ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Chain of Ideas ๋…ผ๋ฌธ์€ ์ƒˆ๋กœ์šด ๊ณผํ•™ ์•„์ด๋””์–ด ์ƒ์„ฑ ๋ฐ ์ง„ํ™” ๊ณผ์ •์˜ ๋ชจ๋ธ๋ง์— ์ดˆ์ ์„ ๋งž์ถ”์–ด, PaperRobot์˜ ์•„์ด๋””์–ด ์ƒ์„ฑ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์‹ฌํ™”์‹œํ‚ต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Can LLMs Generate Novel Research Ideas ๋…ผ๋ฌธ์€ LLM์ด ์‹ค์ œ๋กœ ์–ผ๋งˆ๋‚˜ ์ฐธ์‹ ํ•˜๊ณ  ๋…์ฐฝ์  ์•„์ด๋””์–ด๋ฅผ ์ƒ์„ฑ ๊ฐ€๋Šฅํ•œ์ง€ ์ธ๊ฐ„ ํ‰๊ฐ€๋ฅผ ํ† ๋Œ€๋กœ ํ™•์žฅ ์—ฐ๊ตฌ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
371๋ฒˆ ๋…ผ๋ฌธ์€ PaperRobot์ด ๋‹ค๋ฃฌ ์ž๋™ ๋…ผ๋ฌธ ์ƒ์„ฑ๊ณผ ์œ ์‚ฌํ•˜๊ฒŒ, LLM ๊ธฐ๋ฐ˜์˜ ์œ ์ „์ž ์ •๋ณด ๋ถ„์„์„ ์ž๋™ํ™”ํ•˜๋Š” ์ƒˆ๋กœ์šด ์‘์šฉ ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •