Automating psychological hypothesis generation with AI: when large language models meet causal graph

์ €์ž: Song Tong, Kai Mao, Zhen Huang, Yukun Zhao, Kaiping Peng | ๋‚ ์งœ: 2024 | DOI: 10.1057/s41599-024-03407-5 📄 PDF


Essence

Figure 1

LLMCG ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๊ธฐ๋ฐ˜ํ•œ ๊ฐ€์„ค ์ƒ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ: ๋ฌธํ—Œ ๊ฒ€์ƒ‰, ์ธ๊ณผ ๊ด€๊ณ„ ์Œ ์ถ”์ถœ, ๊ฐ€์„ค ์ƒ์„ฑ์˜ ์„ธ ๋‹จ๊ณ„

๋ณธ ์—ฐ๊ตฌ๋Š” ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)๊ณผ ์ธ๊ณผ ์ง€์‹ ๊ทธ๋ž˜ํ”„(Causal Knowledge Graph)๋ฅผ ๊ฒฐํ•ฉํ•˜์—ฌ ์‹ฌ๋ฆฌํ•™ ๋ถ„์•ผ์˜ ์ž๋™ํ™”๋œ ๊ฐ€์„ค ์ƒ์„ฑ์„ ์ˆ˜ํ–‰ํ–ˆ๋‹ค. 43,312๊ฐœ ์‹ฌ๋ฆฌํ•™ ๋…ผ๋ฌธ์„ ๋ถ„์„ํ•œ ๊ฒฐ๊ณผ, LLM ๋‹จ๋…๋ณด๋‹ค ์šฐ์›”ํ•œ ์‹ ๊ทœ์„ฑ์„ ๊ฐ€์ง„ 130๊ฐœ์˜ ์›ฐ๋น™ ๊ด€๋ จ ๊ฐ€์„ค์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Œ์„ ์ž…์ฆํ–ˆ๋‹ค.

Motivation

Achievement

Figure 2

์ง‘๋‹จ ๊ฐ„ ๋น„๊ต ๋ถ„์„: (a) ์‹ ๊ทœ์„ฑ(novelty)๊ณผ (b) ์œ ์šฉ์„ฑ(usefulness) ๋ถ„ํฌ๋ฅผ ๋ณด์—ฌ์ฃผ๋Š” ๋ฐ•์Šค ํ”Œ๋กฏ

  1. ๊ฐ€์„ค ์ƒ์„ฑ์˜ ํšจ๊ณผ์„ฑ: LLMCG ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ์ƒ์„ฑํ•œ 130๊ฐœ์˜ ์›ฐ๋น™ ๊ด€๋ จ ๊ฐ€์„ค์ด ๋ฐ•์‚ฌ ๊ณผ์ •์ƒ(novice experts)์˜ ์•„์ด๋””์–ด์™€ ์œ ์‚ฌํ•œ ์ˆ˜์ค€์˜ ์‹ ๊ทœ์„ฑ์„ ๋ณด์˜€๋‹ค (t(59) = 3.34, p = 0.007). LLM ๋‹จ๋… ๋ฐฉ์‹์„ ๋ช…ํ™•ํžˆ ๋Šฅ๊ฐ€ํ–ˆ๋‹ค (t(59) = 4.32, p < 0.001).
  2. ์˜๋ฏธ๋ก ์  ์šฐ์›”์„ฑ: ์‹ฌ์ธต ์˜๋ฏธ ๋ถ„์„(deep semantic analysis) ๊ฒฐ๊ณผ, LLMCG ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๋” ๊นŠ์ด ์žˆ๋Š” ๊ฐœ๋… ํ†ตํ•ฉ๊ณผ ๊ด‘๋ฒ”์œ„ํ•œ ์˜๋ฏธ ์ŠคํŽ™ํŠธ๋Ÿผ์„ ๋ณด์œ ํ•จ์„ ์ž…์ฆํ–ˆ๋‹ค. BERT ๊ณต๊ฐ„์—์„œ์˜ ์˜๋ฏธ์  ๊ฑฐ๋ฆฌ ๋ถ„์„์œผ๋กœ ์ด๋ฅผ ์ •๋Ÿ‰์ ์œผ๋กœ ํ™•์ธํ–ˆ๋‹ค.

How

Figure 3

BERT ๊ณต๊ฐ„์—์„œ์˜ ์˜๋ฏธ ํ‘œํ˜„ t-SNE ์‹œ๊ฐํ™”: (a) ์‹ ๊ทœ์„ฑ ์ ์ˆ˜์™€ (b) ์œ ์šฉ์„ฑ ์ ์ˆ˜ ๋น„๊ต

3๋‹จ๊ณ„ LLMCG ํ”„๋ ˆ์ž„์›Œํฌ:

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ์‹ฌ๋ฆฌํ•™ ๋ถ„์•ผ์˜ ์ž๋™ ๊ฐ€์„ค ์ƒ์„ฑ์— ๋Œ€ํ•œ ์„ ๋„์  ์‹œ๋„๋กœ, LLM๊ณผ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„์˜ ์ƒ์Šนํšจ๊ณผ๋ฅผ ์‹ค์ฆ์ ์œผ๋กœ ์ž…์ฆํ–ˆ๋‹ค. ๋Œ€๊ทœ๋ชจ ๋ฌธํ—Œ ๋ถ„์„๊ณผ ์‹ ๋ขฐ์„ฑ ์žˆ๋Š” ๋น„๊ต ํ‰๊ฐ€๋Š” ๊ฐ•์ ์ด์ง€๋งŒ, ์ธ๊ณผ ์ถ”์ถœ์˜ ์ •ํ™•๋„ ๊ฒ€์ฆ๊ณผ ์ƒ์„ฑ ๊ฐ€์„ค์˜ ์‹ค์ œ ์‹คํ—˜์  ๊ฒ€์ฆ์ด ํ–ฅํ›„ ์—ฐ๊ตฌ์—์„œ ๋ณด์™„๋˜์–ด์•ผ ํ•œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Improving Scientific Hypothesis Generation with Knowledge Graph ๋…ผ๋ฌธ์€ ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์˜ ๊ธฐ์ดˆ ๋ฐ ํ•œ๊ณ„๋ฅผ ๋ถ„์„ํ•˜์—ฌ, LLM-์ธ๊ณผ๊ทธ๋ž˜ํ”„ ๊ฒฐํ•ฉ ๋ฐฉ๋ฒ•์— ์‹ฌ์ธต์  ์ฐธ๊ณ ์ž๋ฃŒ๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
132 ๋…ผ๋ฌธ์€ AI๋ฅผ ํ™œ์šฉํ•œ ์‹ฌ๋ฆฌยท์‚ฌํšŒ๊ณผํ•™ ๊ฐ€์„ค/์•„์ด๋””์–ด ์ž๋™ ์ƒ์„ฑ ์—ฐ๊ตฌ๋กœ, 425์™€ ๋ฌธ์ œ์˜์‹์ด ์œ ์‚ฌํ•˜๊ณ  ์•„์ด๋””์–ด ํ‰๊ฐ€ ๊ด€์ ์—์„œ ์ฐธ๊ณ ํ•  ๋งŒํ•˜๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
434๋Š” ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ณผํ•™ ์•„์ด๋””์–ด๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก ์„ ๋‹ค๋ฃจ์–ด, 132์—์„œ LLM+KG ์กฐํ•ฉ์˜ ๊ทผ๊ฐ„์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Research hypothesis generation over scientific knowledge graph ๋…ผ๋ฌธ์€ LLM๊ณผ ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๊ฐ€์„ค์ƒ์„ฑ ๋…ผ์˜์˜ ์ด๋ก ์  ๊ทผ๊ฐ„์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Agentic Personas ๋…ผ๋ฌธ์€ ๋‹ค์–‘ํ•œ ์ „๋ฌธ๊ฐ€์  ์ž…์žฅ๊ณผ ์ ์‘ํ˜• ์„ค๋ช…๋ฐฉ์‹์„ ๋„์ž…ํ•ด, ์‹ฌ๋ฆฌํ•™ ๊ฐ€์„ค ์ž๋™์ƒ์„ฑ์—์„œ ์ธ์‹๋ก ์  ๋‹ค์–‘์„ฑ ๋ฐ˜์˜์— ๊ธฐ์ดˆ๊ฐ€ ๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ง€์‹ ๊ทธ๋ž˜ํ”„์™€ LLM์„ ๊ฒฐํ•ฉํ•œ ๊ฐ€์„ค ์ƒ์„ฑ์˜ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๋ฐœ๊ฒฌ ๋ฐ ๊ฐ€์„ค ์ƒ์„ฑ์— ๊ด€ํ•œ ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
132๋ฒˆ ๋…ผ๋ฌธ์€ ์‹ฌ๋ฆฌ, ์‚ฌํšŒ๊ณผํ•™ ๋ถ„์•ผ์—์„œ AI ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ž๋™์ƒ์„ฑ์„ ์ถ”๊ตฌํ•˜์—ฌ, 757๋ฒˆ์ด ์ œ์•ˆํ•œ LLM ๊ธฐ๋ฐ˜ ์งˆ์  ๊ฐ€์„ค-์ •๋Ÿ‰ํ™” ํ”„๋ ˆ์ž„์›Œํฌ์™€ ๋Œ€์กฐ์  ๋ฐฉ๋ฒ•๋ก ์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ธ๊ณผ ์ถ”๋ก ๊ณผ ์ง€์‹ ๊ทธ๋ž˜ํ”„๋ฅผ ํ™œ์šฉํ•œ ๊ฐ€์„ค ์ƒ์„ฑ์˜ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์˜ ์œ ์‚ฌํ•œ ์ ‘๊ทผ ๋ฐฉ์‹์„ ๋‹ค๋ฃจ๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
132 ๋…ผ๋ฌธ์€ AI๋ฅผ ํ†ตํ•œ ์‹ฌ๋ฆฌยท๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ ๊ฒ€์ฆ์„ ๋‹ค๋ฃจ๋ฉฐ, LLM ์ง€์›์ž์˜ ์‹ค์ œ ์„ฑ๊ณผ ํ‰๊ฐ€(3162)์™€ ์œ ์‚ฌํ•œ ์‚ฌ๋ก€ ์—ฐ๊ตฌ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์‹ฌ๋ฆฌํ•™ ๋˜๋Š” ์‚ฌํšŒ๊ณผํ•™ ๋ถ„์•ผ์—์„œ์˜ AI ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์ž๋™ํ™”์™€ ๊ด€๋ จ๋œ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
425 ๋…ผ๋ฌธ์€ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ์ƒ์„ฑ์ด ์—ฐ๊ตฌ ํ˜์‹ ์„ฑ๊ณผ๋กœ ์ด์–ด์ง์„ ์‹ค์ฆ ๋ถ„์„ํ•˜๋ฉฐ, 132์˜ ์ž๋™ ๊ฐ€์„ค ์ƒ์„ฑ ์‹œ์Šคํ…œ์˜ ์‹ค์ œ ํšจ๊ณผ๋ฅผ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Automating psychological hypothesis generation ๋…ผ๋ฌธ์€ LLM๊ณผ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„ ๊ฒฐํ•ฉ์„ ํ†ตํ•ด ๋‹ค์–‘ํ•œ ์ธ์‹๋ก ์  ์ž…์žฅ์„ ๋ฐ˜์˜ํ•œ ํ˜„์‹ค ๋ถ„์•ผ ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ์†Œ๊ฐœํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
132๋Š” AI๋กœ ์‹ฌ๋ฆฌํ•™์  ๊ฐ€์„ค์ƒ์„ฑ์— ์ ์šฉ, 045์˜ ํ•™์ œ๊ฐ„ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ง€์› ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํ–‰๋™๊ณผํ•™ ์‚ฌ๋ก€๋กœ ๋ณด์—ฌ์ค€๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ์‹ฌ๋ฆฌํ•™ ๋„๋ฉ”์ธ LLM ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ ๊ฒฐ๊ณผ์˜ ์ •๋Ÿ‰์ , ๊ตฌ์กฐ์  ํ‰๊ฐ€์—๋„ ์ ์šฉ๋  ์ˆ˜ ์žˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •