Improving research idea generation through data: An empirical investigation in social science

์ €์ž: Xiao Liu, Xinyi Dong, Xinyang Gao, Yansong Feng, Xun Pang (Beijing University) | ๋‚ ์งœ: 2025 | DOI: arXiv:2505.21396 📄 PDF


Essence

Figure 1

๋ฐ์ดํ„ฐ ์ฆ๊ฐ• LLM ์•„์ด๋””์–ด ์ƒ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ: ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ๋ฅผ ์•„์ด๋””์–ด ์ƒ์„ฑ ๋‹จ๊ณ„์—, ์ž๋™ ๊ฒ€์ฆ์„ ์„ ํƒ ๋‹จ๊ณ„์— ํ†ตํ•ฉ

๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์„ ํ™œ์šฉํ•œ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ƒ์„ฑ ์‹œ ๊ด€๋ จ ๋ฐ์ดํ„ฐ์˜ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ์™€ ์ž๋™ ๊ฒ€์ฆ์„ ํ†ตํ•ฉํ•˜๋ฉด ์•„์ด๋””์–ด์˜ ์‹คํ˜„๊ฐ€๋Šฅ์„ฑ๊ณผ ๊ฒฝํ—˜์  ํƒ€๋‹น์„ฑ์ด 20% ์ด์ƒ ํ–ฅ์ƒ๋œ๋‹ค. ๋” ๋‚˜์•„๊ฐ€ LLM์ด ์ƒ์„ฑํ•œ ์•„์ด๋””์–ด๊ฐ€ ์‹ค์ œ ์—ฐ๊ตฌ์ž๋“ค์˜ ์ž์ฒด ์•„์ด๋””์–ด ๊ฐœ๋ฐœ์„ ์˜๊ฐ ์žˆ๊ฒŒ ์ง€์›ํ•จ์„ ์‹ค์ฆ์ ์œผ๋กœ ์ž…์ฆํ–ˆ๋‹ค.

Motivation

Achievement

Figure 1

ํ‘œ์ค€ ํ”„๋ ˆ์ž„์›Œํฌ(์ค‘์•™)์— ๋น„ํ•ด ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑ ๋‹จ๊ณ„์—, ์ž๋™ ๊ฒ€์ฆ์„ ์„ ํƒ ๋‹จ๊ณ„์— ํ†ตํ•ฉํ•œ ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• ํ”„๋ ˆ์ž„์›Œํฌ

  1. ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ์˜ ํšจ๊ณผ: ClimateDataBank์˜ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ๋ฅผ ํฌํ•จํ•  ๋•Œ ์ƒ์„ฑ๋œ ์•„์ด๋””์–ด์˜ ์‹คํ˜„๊ฐ€๋Šฅ์„ฑ(feasibility)์ด 20% ํ–ฅ์ƒ, ๊ธฐ๋Œ€ ํšจ๊ณผ์„ฑ(expected effectiveness)์ด 18% ํ–ฅ์ƒ๋จ์„ ์ „๋ฌธ๊ฐ€ ํ‰๊ฐ€๋กœ ํ™•์ธ
  2. ์ž๋™ ๊ฒ€์ฆ์˜ ํšจ๊ณผ: ์ž๋™ ๊ฒ€์ฆ ํ”„๋กœ์„ธ์Šค๋ฅผ ๊ฑฐ์นœ ์•„์ด๋””์–ด ์„ ํƒ ์‹œ ์ „์ฒด ํ’ˆ์งˆ์ด 7% ํ–ฅ์ƒ๋˜์–ด, ๊ฒฝํ—˜์ ์œผ๋กœ ์ž…์ฆ๋œ ์•„์ด๋””์–ด ์„ ํƒ์— ์œ ํšจํ•จ์„ ์ž…์ฆ
  3. ์ธ๊ฐ„ ์—ฐ๊ตฌ์ž์— ๋Œ€ํ•œ ์˜๊ฐ ํšจ๊ณผ: 23๋ช…์˜ ์—ฐ๊ตฌ์ž ๋Œ€์ƒ ์ธ๊ฐ„ ์—ฐ๊ตฌ์—์„œ LLM ์ƒ์„ฑ ์•„์ด๋””์–ด์™€ ๊ฒ€์ฆ ์ •๋ณด๋ฅผ ์ œ๊ณต๋ฐ›์€ ์ฐธ์—ฌ์ž๋“ค์ด ์ธํ„ฐ๋„ท๋งŒ์œผ๋กœ ์•„์ด๋””์–ด๋ฅผ ๋„์ถœํ•œ ๋Œ€์กฐ๊ตฐ๋ณด๋‹ค ๋” ๋†’์€ ํ’ˆ์งˆ์˜ ์•„์ด๋””์–ด๋ฅผ ์ œ์•ˆํ•จ์„ ํ™•์ธ. ์ฐธ์—ฌ์ž๋“ค์€ LLM ์•„์ด๋””์–ด๋ฅผ ์‹œ์ž‘์ ์œผ๋กœ ํ™œ์šฉํ•˜์—ฌ ์‚ฌ๊ณ ์˜ ํญ์„ ๋„“ํ˜”๋‹ค๊ณ  ๋ณด๊ณ 
  4. ClimateDataBank ๊ตฌ์ถ•: ํ–ฅํ›„ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์ด๋…ํ™” ์—ฐ๊ตฌ๋ฅผ ์ง€์›ํ•˜๊ธฐ ์œ„ํ•ด 22๊ฐœ ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ๊ตฌ์„ฑ๋œ ClimateDataBank ๊ตฌ์ถ•

How

Figure 1

์ขŒ์ธก: ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ํ†ตํ•ฉ ์•„์ด๋””์–ด ์ƒ์„ฑ ๊ณผ์ • | ์šฐ์ธก: ์ž๋™ ๊ฒ€์ฆ์„ ํ†ตํ•œ ๊ฐ€์„ค ํƒ€๋‹น์„ฑ ํ™•์ธ

์•„์ด๋””์–ด ๊ตฌ์กฐ ๋ฐ ์ƒ์„ฑ (4.1์ ˆ)

๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ํ†ตํ•ฉ (4.2์ ˆ)

์ž๋™ ๊ฒ€์ฆ ํ”„๋กœ์„ธ์Šค (5์ ˆ)

ClimateDataBank ๊ตฌ์„ฑ (3์ ˆ)

ํ‰๊ฐ€ ๋ฐฉ๋ฒ•

Originality

Limitation & Further Study

ํ•œ๊ณ„

ํ›„์† ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

Evaluation

Novelty: 4.5/5 Technical Soundness: 3.5/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ์ด ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ƒ์„ฑ์— ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ฉํ•˜๋Š” ์‹ค์งˆ์  ๋ฐฉ์•ˆ์„ ์ œ์‹œํ•˜๊ณ , ํŠนํžˆ ์ธ๊ฐ„ ์—ฐ๊ตฌ๋ฅผ ํ†ตํ•ด LLM ์•„์ด๋””์–ด๊ฐ€ ์‹ค์ œ ์—ฐ๊ตฌ์ž๋“ค์—๊ฒŒ ์˜๊ฐ์„ ์ค„ ์ˆ˜ ์žˆ์Œ์„ ์ž…์ฆํ•œ ์˜๋ฏธ ์žˆ๋Š” ์ž‘์—…์ด๋‹ค. ์‚ฌํšŒ๊ณผํ•™ ํŠนํ™”, ClimateDataBank ๋ฆฌ์†Œ์Šค ๊ธฐ์—ฌ, ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ์™€ ์ž๋™ ๊ฒ€์ฆ์˜ ์ด์ค‘ ํ†ตํ•ฉ

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
132 ๋…ผ๋ฌธ์€ AI๋ฅผ ํ™œ์šฉํ•œ ์‹ฌ๋ฆฌยท์‚ฌํšŒ๊ณผํ•™ ๊ฐ€์„ค/์•„์ด๋””์–ด ์ž๋™ ์ƒ์„ฑ ์—ฐ๊ตฌ๋กœ, 425์™€ ๋ฌธ์ œ์˜์‹์ด ์œ ์‚ฌํ•˜๊ณ  ์•„์ด๋””์–ด ํ‰๊ฐ€ ๊ด€์ ์—์„œ ์ฐธ๊ณ ํ•  ๋งŒํ•˜๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
425 ๋…ผ๋ฌธ์€ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ƒ์„ฑ์— ๊ด€ํ•œ ์‹ค์ฆ์  ๋ถ„์„์„ ์ œ๊ณตํ•˜์—ฌ 729์˜ ์•„์ด๋””์–ด ์ƒ์„ฑ ํ‰๊ฐ€์™€ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์ž๋™ํ™”์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
425๋Š” ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ƒ์„ฑ ํ–ฅ์ƒ ๋ฐฉ๋ฒ•์„ ์‹ค์ฆ์ ์œผ๋กœ ๋ถ„์„ํ•ด 216์˜ ์•„์ด๋””์–ด ์žฌ์กฐํ•ฉ ๋ชฉ์ ๊ณผ ์ง๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Scientific hypothesis generation by large language models(719)์€ LLM ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ๋ฐ ๊ฐ€์„ค ์ƒ์„ฑ์˜ ์›๋ฆฌ์™€ ํ•œ๊ณ„๋ฅผ ๋…ผ์˜ํ•˜๋ฉฐ, 425์˜ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ํ–ฅ์ƒ ๊ธฐ๋ฒ•์— ์ด๋ก ์  ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™์˜ ๊ณผํ•™ ๋ถ„์•ผ์—์„œ ๋ฐ์ดํ„ฐ์™€ ์ธก์ • ๋ฐฉ๋ฒ•๋ก ์„ ๋‹ค๋ฅธ ๊ด€์ ์—์„œ ๋‹ค๋ฃฌ ์—ฐ๊ด€ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Scideator๋Š” ์ธ๊ฐ„-LLM ํ˜‘์—… ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ƒ์„ฑ ์‹œ์Šคํ…œ์„ ๋‹ค๋ฃจ์–ด, ๋ฐ์ดํ„ฐ/๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ํ™œ์šฉ ํšจ๊ณผ๋ฅผ ๋‹ค๋ฅธ ๊ด€์ ์—์„œ ์‹ค์ฆํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์—ฐ๊ตฌ ์•„์ด๋””์–ด ๊ฒ€์ฆ ๋ฐ ๋ฉ˜ํ† ๋ง์„ AI๋กœ ์ง€์›ํ•˜๋Š” ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์„ ๋‹ค๋ฃจ๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
540์€ ๊ณผํ•™ ์—ฐ๊ตฌ๋ฌธ์ œ ํ•ด๊ฒฐ์‹œ ์„ ํ–‰์—ฐ๊ตฌ ๋ฐฉ๋ฒ•๋ก  ๊ฒ€์ƒ‰์— ์ดˆ์ ์„ ๋‘” ๊ฒƒ์œผ๋กœ, 425์˜ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ์ƒ์„ฑ๊ณผ ์ƒํ˜ธ๋ณด์™„์ ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™์  ์•„์ด๋””์—์ด์…˜ ๋ฐ ๋ฐœ๊ฒฌ์„ ์œ„ํ•œ LLM ํ™œ์šฉ์„ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Learning to generate research idea ๋…ผ๋ฌธ์€ ๋™์  ์ œ์–ด ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํ†ตํ•œ ์•„์ด๋””์–ด ์ƒ์„ฑ ํ’ˆ์งˆ ํ–ฅ์ƒ์„ ์‹คํ—˜ํ•˜์—ฌ, ๋ฐ์ดํ„ฐ ํ™œ์šฉ์— ์ถ”๊ฐ€์  ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
425 ๋…ผ๋ฌธ์€ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ์ƒ์„ฑ์ด ์—ฐ๊ตฌ ํ˜์‹ ์„ฑ๊ณผ๋กœ ์ด์–ด์ง์„ ์‹ค์ฆ ๋ถ„์„ํ•˜๋ฉฐ, 132์˜ ์ž๋™ ๊ฐ€์„ค ์ƒ์„ฑ ์‹œ์Šคํ…œ์˜ ์‹ค์ œ ํšจ๊ณผ๋ฅผ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
425๋Š” ์‹ค์ œ ์—ฐ๊ตฌ์ž์˜ ์•„์ด๋””์–ด ์ƒ์„ฑ ๋ณด์กฐ ํšจ๊ณผ์™€ ๊ฒ€์ฆ ๊ณผ์ •์„ ๋‹ค๋ฃจ์–ด, 419์˜ ์ž๋™ ๊ฐ€์„ค ์ƒ์„ฑ ๊ฒฐ๊ณผ์— ์ธ๊ฐ„ ์ƒํ˜ธ์ž‘์šฉ ๋ฐ ๊ฒ€์ฆ ์ธก๋ฉด์„ ๋”ํ•ด์ค€๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
434์€ ์•„์ด๋””์–ด ์ƒ์„ฑ์— ๋…ผ๋ฌธ๊ณผ LLM์„ ๊ฒฐํ•ฉํ•˜๋Š” ์‹œ์Šคํ…œ(SciMuse)์œผ๋กœ, 425์˜ ๋ฐ์ดํ„ฐ ๋ฐ ์ž๋™ ๊ฒ€์ฆ ํ™œ์šฉ ์•„์ด๋””์–ด ์ƒ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ํ™•์žฅ ์‚ฌ๋ก€์ด๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •