SciPIP: An LLM-based Scientific Paper Idea Proposer

์ €์ž: Wenxiao Wang, Lihui Gu, Liye Zhang, Yunxiang Luo, Yi Dai, Chen Shen, Liang Xie, Binbin Lin, Xiaofei He, Jieping Ye | ๋‚ ์งœ: 2024 | DOI: N/A 📄 PDF


Essence

Figure 1

๋ฌธํ—Œ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๊ตฌ์ถ• ํŒŒ์ดํ”„๋ผ์ธ. PDF ํŒŒ์„œ๋กœ ๋…ผ๋ฌธ ์„น์…˜์„ ์ถ”์ถœํ•˜๊ณ  LLM์œผ๋กœ ์š”์•ฝํ•œ ํ›„ ์ž„๋ฒ ๋”ฉ์œผ๋กœ ์ธ์ฝ”๋”ฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์— ์ €์žฅ

LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋…ผ๋ฌธ ์•„์ด๋””์–ด ์ƒ์„ฑ ์‹œ์Šคํ…œ์œผ๋กœ, ์˜๋ฏธ๋ก ์ (semantic) ๋ฌธํ—Œ ๊ฒ€์ƒ‰๊ณผ ์ด์ค‘ ๊ฒฝ๋กœ(dual-path) ์•„์ด๋””์–ด ์ƒ์„ฑ์„ ํ†ตํ•ด ๋”์šฑ ์ฐธ์‹ ํ•˜๊ณ  ์‹คํ˜„ ๊ฐ€๋Šฅํ•œ ์—ฐ๊ตฌ ์•„์ด๋””์–ด๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ๊ธฐ์กด์˜ ํ‚ค์›Œ๋“œ ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ณ  ์ „์ฒด ๋…ผ๋ฌธ ๋‚ด์šฉ์„ ํ™œ์šฉํ•œ ํ†ตํ•ฉ์  ์•„์ด๋””์–ด ์ƒ์„ฑ์„ ํ•ต์‹ฌ์œผ๋กœ ํ•œ๋‹ค.

Motivation

Achievement

Figure 3

SciPIP์˜ ์•„์ด๋””์–ด ์ œ์•ˆ ํŒŒ์ดํ”„๋ผ์ธ. ๊ฒ€์ƒ‰๋œ ๋ฌธํ—Œ๊ณผ LLM์˜ ๋‚ด๋ถ€ ์ง€์‹์„ ์ด์ค‘ ๊ฒฝ๋กœ๋กœ ํ†ตํ•ฉ

  1. ํฌ๊ด„์  ๋ฌธํ—Œ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๊ตฌ์ถ•:
    • AI ๋ถ„์•ผ ์ƒ์œ„ ํ•™์ˆ ์ง€ ๋…ผ๋ฌธ 78,571ํŽธ ์ˆ˜์ง‘
    • ๊ฐ ๋…ผ๋ฌธ์„ ๊ตฌ์กฐํ™”๋œ 5์ค‘์Œ์œผ๋กœ ์žฌ์š”์•ฝํ•˜๊ณ  ํ‚ค์›Œ๋“œ-๋…ผ๋ฌธ ๊ทธ๋ž˜ํ”„ ๊ตฌ์„ฑ
    • ์ปค๋ฎค๋‹ˆํ‹ฐ๋ฅผ ์œ„ํ•œ ๊ณต์œ  ์ž์‚ฐ์œผ๋กœ ํ™œ์šฉ ๊ฐ€๋Šฅ
  2. ๋‹ค์ค‘ ์ž…๋„ ๊ฒ€์ƒ‰ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํšจ๊ณผ์„ฑ:
    • SKC(Semantic, Keyword, Co-occurrence) ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰์œผ๋กœ ๋‹จ์ˆœ ์˜๋ฏธ ๊ฒ€์ƒ‰๋ณด๋‹ค ๋” ํฌ๊ด„์ ์ธ ๊ด€๋ จ ๋ฌธํ—Œ ๋ฐœ๊ตด
    • NLP ๋ฐ ์ปดํ“จํ„ฐ ๋น„์ „(CV) ๋„๋ฉ”์ธ์—์„œ ๊ธฐ์กด ๋ฐฉ์‹ ๋Œ€๋น„ ํ˜„์ €ํžˆ ์šฐ์ˆ˜ํ•œ ๊ฒ€์ƒ‰ ํ’ˆ์งˆ ๋‹ฌ์„ฑ
  3. ์ƒ์„ฑ๋œ ์•„์ด๋””์–ด ํ’ˆ์งˆ ํ–ฅ์ƒ:
    • ์ฐธ์‹ ์„ฑ(novelty), ์‹คํ˜„ ๊ฐ€๋Šฅ์„ฑ(feasibility), ๋ช…ํ™•์„ฑ(clarity), ๊ด€๋ จ์„ฑ(relevance) ๋“ฑ ๋ชจ๋“  ํ‰๊ฐ€ ์ง€ํ‘œ์—์„œ AI Scientist ๋“ฑ ๊ธฐ์กด ๋ฐฉ์‹ ๋Œ€๋น„ ์šฐ์ˆ˜
    • ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€ ํ‰๊ฐ€ ๊ธฐ๋ฐ˜์œผ๋กœ ์ •๋Ÿ‰์  ์šฐ์›”์„ฑ ์ž…์ฆ

How

Figure 2

SKC ๊ธฐ๋ฐ˜ ๋ฌธํ—Œ ๊ฒ€์ƒ‰ ๋ฐ ๋ฌธํ—Œ ํด๋Ÿฌ์Šคํ„ฐ๋ง ํŒŒ์ดํ”„๋ผ์ธ. ์‚ฌ์šฉ์ž ์ฟผ๋ฆฌ์—์„œ ํ‚ค์›Œ๋“œ๋ฅผ ์ถ”์ถœํ•˜๊ณ  ์˜๋ฏธ๋ก ์ , ํ‚ค์›Œ๋“œ ๊ธฐ๋ฐ˜, ๊ณต๋™ ๋ฐœ์ƒ ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰์„ ์ˆ˜ํ–‰

๋ฌธํ—Œ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๊ตฌ์ถ•

๋‹ค์ค‘ ์ž…๋„ ๋ฌธํ—Œ ๊ฒ€์ƒ‰

์ด์ค‘ ๊ฒฝ๋กœ ์•„์ด๋””์–ด ์ƒ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ

Originality

Limitation & Further Study

Evaluation

์ดํ‰: SciPIP๋Š” LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์•„์ด๋””์–ด ์ƒ์„ฑ์ด๋ผ๋Š” ์ค‘์š”ํ•œ ๋ฌธ์ œ๋ฅผ ๋‹ค์ธต์ ์œผ๋กœ ๊ฐœ์„ ํ•œ ์‹ค์šฉ์ ์ธ ์‹œ์Šคํ…œ์œผ๋กœ, ๊ตฌ์กฐํ™”๋œ ๋ฌธํ—Œ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์™€ ๋‹ค์ค‘ ์ž…๋„ ๊ฒ€์ƒ‰, ์ด์ค‘ ๊ฒฝ๋กœ ์ƒ์„ฑ์ด๋ผ๋Š” ์„ธ ๊ฐ€์ง€ ํ˜์‹ ์„ ํ†ตํ•ด ๊ธฐ์กด ๋ฐฉ์‹ ๋Œ€๋น„ ๋ˆˆ์— ๋„๋Š” ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค. ํŠนํžˆ ๊ณต๊ฐœ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ์ œ๊ณต๊ณผ ์ฒด๊ณ„์ ์ธ ํ‰๊ฐ€๋Š” ๊ฐ•์ ์ด๋‚˜, LLM ์˜์กด์„ฑ, ํ‰๊ฐ€์˜ ์ฃผ๊ด€์„ฑ, ์‹ค์ œ ์—ฐ๊ตฌ ์˜ํ–ฅ ์ธก์ • ๋ฏธํก์ด ํ•œ๊ณ„๋กœ ๋‚จ์•„์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
518 ๋…ผ๋ฌธ์€ ์—ฌ๋Ÿฌ LLM์„ ํ™œ์šฉํ•œ ์ง‘๋‹จ์  ๊ณผํ•™ ์•„์ด๋””์–ด ์ฐฝ์ถœ์„ ๋‹ค๋ฃจ์–ด 729์˜ ์‹คํ˜„ ๊ฐ€๋Šฅ์„ฑ ๋†’์€ ์•„์ด๋””์–ด ์ƒ์„ฑ์„ ์œ„ํ•œ ๋ฐฐ๊ฒฝ์ง€์‹์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Liveideabench(494)๋Š” LLM์˜ ๊ณผํ•™์  ์ฐฝ์˜์„ฑยท์•„์ด๋””์–ด ์ƒ์„ฑ ๋Šฅ๋ ฅ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ๋ฒค์น˜๋งˆํฌ๋กœ, 729์˜ ํ•ต์‹ฌ ํ‰๊ฐ€ ์ง€์ ์— ์ง์ ‘์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
SciMON ๋…ผ๋ฌธ์—์„œ ์ž๋™ ๋ฌธํ—Œ ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ์ƒ์„ฑ ๊ฐœ๋…์ด SciPIP์˜ ํ•ต์‹ฌ ๊ตฌ์กฐ๋กœ ์ด์–ด์ง„๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
425 ๋…ผ๋ฌธ์€ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ƒ์„ฑ์— ๊ด€ํ•œ ์‹ค์ฆ์  ๋ถ„์„์„ ์ œ๊ณตํ•˜์—ฌ 729์˜ ์•„์ด๋””์–ด ์ƒ์„ฑ ํ‰๊ฐ€์™€ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
603 ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋‹จ๊ณ„์  ๊ณผํ•™ ๋…ผ๋ฌธ ์ดˆ์•ˆ ์ƒ์„ฑ์„ ์ œ๊ณตํ•ด 729์˜ ํ˜์‹ ์  ์•„์ด๋””์–ด ์ƒ์„ฑ ๋ฐ ๋…ผ๋ฌธ ์ œ์•ˆ ์‹œ์Šคํ…œ๊ณผ ๋Œ€์•ˆ์  ์—ฐ๊ด€์„ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ ๋…ผ๋ฌธ ์•„์ด๋””์–ด ์ž๋™ ์ œ์•ˆ ์‹œ์Šคํ…œ์œผ๋กœ, ๊ฐ€์„ค ์ƒ์„ฑ ์ž๋™ํ™”์˜ ๋‹ค์–‘ํ•œ ์‹ค์ œ ๊ตฌํ˜„์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Learning to generate research idea... ๋…ผ๋ฌธ์€ ์ปจํŠธ๋กค ๊ฐ€๋Šฅํ•œ ์•„์ด๋””์–ด ์ƒ์„ฑ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ๋‹ค๋ฃฌ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
SciPIP์€ LLM ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ์ œ์•ˆ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, ๊ตฌ์กฐํ™”๋œ ๋…ผ๋ฌธ ์ •๋ณด๋ฅผ ํ™œ์šฉํ•œ๋‹ค๋Š” ์ ์—์„œ Scideator์™€ ์œ ์‚ฌํ•˜๋‚˜ ๊ตฌํ˜„ ๋ฐ ์ธํ„ฐํŽ˜์ด์Šค์— ์ฐจ์ด๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋…ผ๋ฌธ ์•„์ด๋””์–ด ์ƒ์„ฑ๊ณผ์ •์„ ์ž๋™ํ™”ํ•˜๋Š” ์‹œ์Šคํ…œ์œผ๋กœ Acceleron์˜ ์•„์ด๋ฐ์ด์…˜ ์ง€์› ๊ธฐ๋Šฅ๊ณผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
SciPIP๋Š” LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋…ผ๋ฌธ ์•„์ด๋””์–ด ์ œ์‹œ ๋ฐ ์งˆ์˜์‘๋‹ต์— ์ดˆ์ ์„ ๋‘์–ด, Scidqa์˜ ๋…ผ๋ฌธ ์ถ”๋ก ํ˜• QA์™€ ๋‹ค๋ฅธ ๊ด€์ ์˜ ๊ณผํ•™ ๋ฌธ์„œ ์ž๋™ํ™” ๋ฐฉ๋ฒ•๋ก ์„ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
540๋ฒˆ ๋…ผ๋ฌธ์€ ์˜๋ฏธ ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ์˜๊ฐ์„ ์œ„ํ•œ ์‹œ์Šคํ…œ์„ ๋‹ค๋ฃจ๊ณ  ์žˆ์–ด, ๊ฒ€์ƒ‰ ๋ฐ ์•„์ด๋””์–ด ์ƒ์„ฑ์˜ ๋‹ค๋ฅธ ์ ‘๊ทผ์„ ์ œ๊ณตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
SciPIP๋Š” LLM ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ƒ์„ฑ์„ ์ด์ค‘ ๊ฒฝ๋กœ, ์˜๋ฏธ๋ก ์  ๊ฒ€์ƒ‰ ๋“ฑ์œผ๋กœ ๊ณ ๋„ํ™”ํ•˜์—ฌ SciMON์˜ ๊ธฐ๋Šฅ์„ ์‹ค์งˆ์ ์œผ๋กœ ํ™•์žฅํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •