Improving Scientific Hypothesis Generation with Knowledge Grounded Large Language Models

์ €์ž: Guangzhi Xiong, Eric Xie, Amir Hassan Shariatmadari, Sikun Guo, Stefan Bekiranov | ๋‚ ์งœ: 2024 | DOI: 10.48550/arXiv.2411.02382 📄 PDF


Essence

Figure 1

KG-CoI ์‹œ์Šคํ…œ์˜ ๊ฐœ์š”: KG ๊ธฐ๋ฐ˜ ๋งฅ๋ฝ ๊ฒ€์ƒ‰, KG ์ฆ๊ฐ• ์•„์ด๋””์–ด ์ฒด์ธ ์ƒ์„ฑ, KG ๊ธฐ๋ฐ˜ ํ™˜๊ฐ ๊ฐ์ง€ ๋ชจ๋“ˆ๋กœ ๊ตฌ์„ฑ

LLM์˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ์ง€์‹ ๊ทธ๋ž˜ํ”„(Knowledge Graph)์˜ ๊ตฌ์กฐํ™”๋œ ์ •๋ณด์™€ ํ†ตํ•ฉํ•˜์—ฌ ํ–ฅ์ƒ์‹œํ‚ค๊ณ , ์ƒ์„ฑ ๊ณผ์ •์˜ ํ™˜๊ฐ(hallucination)์„ ๊ฐ์ง€ ๋ฐ ์™„ํ™”ํ•˜๋Š” KG-CoI ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•œ๋‹ค.

Motivation

Achievement

Figure 2

๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ•์˜ ์„ฑ๋Šฅ ๋น„๊ต: ์ž๊ธฐ ์ผ๊ด€์„ฑ(self-consistency) ์„ค์ •์—์„œ ์‹คํ–‰ ํšŸ์ˆ˜์— ๋”ฐ๋ฅธ ์„ฑ๋Šฅ ๋ณ€ํ™”

  1. ๊ฐ€์„ค ์ƒ์„ฑ ์ •ํ™•๋„ ํ–ฅ์ƒ: KG-CoI๋Š” ๊ธฐ์กด์˜ ์ง์ ‘ ํ”„๋กฌํ”„ํŒ…(Direct prompting), ์‚ฌ๊ณ ์˜ ์—ฐ์‡„(Chain-of-Thought), RAG ๋ฐฉ์‹ ๋Œ€๋น„ ๊ฐ€์žฅ ๋†’์€ ์ •ํ™•๋„๋กœ ๊ณผํ•™์  ๊ฐ€์„ค์„ ์ƒ์„ฑํ•œ๋‹ค.
  2. ํ™˜๊ฐ ๊ฐ์†Œ ๋ฐ ์‹ ๋ขฐ์„ฑ ๊ฐœ์„ : KG ๊ธฐ๋ฐ˜ ํ™˜๊ฐ ํƒ์ง€ ๋ชจ๋“ˆ์„ ํ†ตํ•ด ์ƒ์„ฑ๋œ ์ถ”๋ก  ๋‹จ๊ณ„๋“ค์—์„œ ์‚ฌ์‹ค์  ์˜ค๋ฅ˜๋ฅผ ์‹๋ณ„ํ•˜๊ณ , ์‹œ์Šคํ…œ์˜ ์‹ ๋ขฐ์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚จ๋‹ค.
  3. ์ƒˆ๋กœ์šด ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•: ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๋‚ด์˜ ๋งํฌ๋ฅผ ๋งˆ์Šคํ‚นํ•˜์—ฌ LLM์˜ ๊ฐ€์„ค ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ์ •๋Ÿ‰์ ์œผ๋กœ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๋Š” ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์„ฑํ•˜์˜€๋‹ค.

How

Figure 1

KG-CoI๋Š” ์„ธ ๊ฐ€์ง€ ์ฃผ์š” ๋ชจ๋“ˆ๋กœ ๊ตฌ์„ฑ๋œ๋‹ค:

1. KG ๊ธฐ๋ฐ˜ ๋งฅ๋ฝ ๊ฒ€์ƒ‰ (KG-guided Context Retrieval)

2. KG ์ฆ๊ฐ• ์•„์ด๋””์–ด ์ฒด์ธ ์ƒ์„ฑ (KG-augmented Chain-of-idea Generation)

3. KG ๊ธฐ๋ฐ˜ ํ™˜๊ฐ ํƒ์ง€ (KG-supported Hallucination Detection)

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.2/5

์ดํ‰: KG-CoI๋Š” LLM์˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด ์ง€์‹ ๊ทธ๋ž˜ํ”„๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ํ†ตํ•ฉํ•œ ์ฐธ์‹ ํ•œ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜๋ฉฐ, ํŠนํžˆ ํ™˜๊ฐ ํƒ์ง€ ๋ชจ๋“ˆ๊ณผ ์ƒˆ๋กœ์šด ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ์…‹์€ ๊ณผํ•™ AI ๋ถ„์•ผ์— ์‹ค์งˆ์  ๊ธฐ์—ฌ๋ฅผ ํ•œ๋‹ค. ๋‹ค๋งŒ ์ƒ๋ฌผ์˜ํ•™ ์˜์—ญ์— ๊ตญํ•œ๋œ ํ‰๊ฐ€์™€ ๋‹ค๋ฅธ ๋„๋ฉ”์ธ์œผ๋กœ์˜ ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ ๊ฒ€์ฆ์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Hypothesis Generation with Large Language Models ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ ๊ธฐ๋ณธ ์›๋ฆฌ๋ฅผ ์ •๋ฆฌํ•˜์—ฌ KG-CoI ์‹œ์Šคํ…œ์˜ ์ด๋ก ์  ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ง€์‹ ๊ทธ๋ž˜ํ”„๋ฅผ ํ™œ์šฉํ•œ NLI ๋ฐ ๊ณผํ•™์  ์ฃผ์žฅ์˜ ํŒฉํŠธ์ฒดํฌ ๊ฐœ์„  ๋ฐฉ๋ฒ•๋ก ์ด ์ง์ ‘ ์—ฐ๊ฒฐ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Improving Scientific Hypothesis Generation with Knowledge Graph ๋…ผ๋ฌธ์€ ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์˜ ๊ธฐ์ดˆ ๋ฐ ํ•œ๊ณ„๋ฅผ ๋ถ„์„ํ•˜์—ฌ, LLM-์ธ๊ณผ๊ทธ๋ž˜ํ”„ ๊ฒฐํ•ฉ ๋ฐฉ๋ฒ•์— ์‹ฌ์ธต์  ์ฐธ๊ณ ์ž๋ฃŒ๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
426 ๋…ผ๋ฌธ์€ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๊ฐ€์„คยท๋ฐฉ๋ฒ•๋ก  ์ถ”์ฒœ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ์–ด, 540์˜ ๋ฐฉ๋ฒ•๋ก  ์ธ์ ‘ ๊ทธ๋ž˜ํ”„(MAG) ๊ฒ€์ƒ‰ ๊ณผ์ œ ์„ค์ •ยท์ž…์ฆ์— ์ „๊ฑฐ๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ ํƒ์ƒ‰์—์„œ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•๋ก ์„ ์ ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์•„์ด๋””์–ด ์ƒ์„ฑ์„ ๋‹ค๋ฃธ์œผ๋กœ์จ, KG-CoI ์‹œ์Šคํ…œ์˜ ์„ค๊ณ„ ๋…ผ๋ฆฌ์— ์ง์ ‘์ ์ธ ๊ธฐ๋ฐ˜ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ง€์‹ ๊ทธ๋ž˜ํ”„์™€ LLM์„ ์ด์šฉํ•œ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ๊ตฌ์ถ•ํ•œ ๋…ผ๋ฌธ์œผ๋กœ, KG-CoI ์‹œ์Šคํ…œ์˜ ํ•ต์‹ฌ ๊ฐœ๋…๊ณผ ๋งฅ๋ฝ์ด ํ†ตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Scientific hypothesis generation by large language models ๋…ผ๋ฌธ์€ LLM์„ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์— ํ™œ์šฉํ•˜๋Š” ๊ธฐ๋ณธ ํ•œ๊ณ„์™€ ๋ฌธ์ œ๋ฅผ ์ข…ํ•ฉ์ ์œผ๋กœ ๊ณ ์ฐฐ, KG-CoI ์‹œ์Šคํ…œ์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ํ˜•์„ฑํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
426 ๋…ผ๋ฌธ์€ ๊ณผํ•™ ์ง€์‹๊ทธ๋ž˜ํ”„์— ๊ธฐ๋ฐ˜ํ•ด ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ ์„ค๋ช… ๋ณด๊ฐ•์„ ๋‹ค๋ค„, 066์˜ ์„ค๋ช… ์ƒ์„ฑ ๊ธฐ๋ฒ•์˜ ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์•ฝํ•œ ๊ฐ๋… ๊ธฐ๋ฐ˜์˜ ์‚ฌ์‹ค ๊ฒ€์ฆ ํ”„๋ ˆ์ž„์›Œํฌ๋Š”, LLM ํ™˜๊ฐ ์™„ํ™”์™€ ๋ฐ˜๋Œ€๋˜๋Š” ๋ฌธ์ œ ์„ค์ •์—์„œ ๊ทผ๋ณธ์ ์ธ ์†”๋ฃจ์…˜ ์ฐจ์ด๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ LLM ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ ์ฆ๋ช… ๋ฐฉ๋ฒ•๊ณผ ๋น„๊ตํ•˜์—ฌ ํ˜ผํ•ฉ์  ์ ‘๊ทผ์˜ ์ฐจ๋ณ„์„ฑ์„ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
SciToolAgent ๋…ผ๋ฌธ์€ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๋„๊ตฌ ํ™œ์šฉ์„ ํ†ตํ•ด LLM์˜ ๊ฐ€์„ค ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜์—ฌ, KG-CoI ๋ฐฉ์‹๊ณผ ๋Œ€์กฐ์ ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
426์€ ์ง€์‹ ๊ธฐ๋ฐ˜ ํ•„ํ„ฐ๋ง ๋ฐ ๊ทธ๋ž˜ํ”„๋ฅผ ํ†ตํ•ด ๊ณผํ•™ ๊ฐ€์„ค ํ‰๊ฐ€์— ์ ‘๊ทผํ•˜์—ฌ 820์˜ TruthHypo ๋ฒค์น˜๋งˆํฌ์™€ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
426๋ฒˆ ๋…ผ๋ฌธ์€ ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•˜์—ฌ, 666๋ฒˆ์˜ ResearchLink์—์„œ ๊ฒฝ๋กœ ๊ธฐ๋ฐ˜ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ํŠน์„ฑ์„ ํ™œ์šฉํ•œ ๊ฒƒ๊ณผ ๋น„๊ต๋œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ง€์‹ ๊ทธ๋ž˜ํ”„์™€ LLM์„ ๊ฒฐํ•ฉํ•ด ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ ๊ฒ€์ฆ์„ ์˜์‚ฌ๊ฒฐ์ •์  ๊ด€์ ์—์„œ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ฐ€์„ค ์ƒ์„ฑ์„ ์ง€์‹๊ทธ๋ž˜ํ”„(KG)์™€ ๊ฒฐํ•ฉํ•ด ๊ฐ•ํ™”ํ•˜๋Š” ๋…ผ๋ฌธ์œผ๋กœ, 419์˜ LLM ๊ธฐ๋ฐ˜ ๋ฐ˜๋ณต์  ๊ฐ€์„ค ํƒ์ƒ‰์— ๊ตฌ์กฐ์  ์ •๋ณด ํ™œ์šฉ์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ LLM ์•„์ด๋””์–ด ์ƒ์„ฑ ๋ฐ ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐฉ๋ฒ•์„ ์‹ค์ œ ์‹คํ—˜๊ฒ€์ฆ ๋‹จ๊ณ„๋กœ ํ™•์žฅํ•˜์˜€๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
HypoChainer๋Š” LLM๊ณผ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ฒฐํ•ฉ์— ๊ธฐ๋ฐ˜ํ•œ ํ˜‘์—…์  ๊ณผํ•™ ์•„์ด๋””์–ด ์ƒ์„ฑ ์‹œ์Šคํ…œ์œผ๋กœ, KG-CoI์˜ ์ ‘๊ทผ๋ฒ•์„ ํ•œ ๋‹จ๊ณ„ ๋ฐœ์ „์‹œํ‚จ ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
โ€˜Improving Scientific Hypothesis Generation with Knowledge Graphsโ€™๋Š” ๋‚ด๋ถ€ ํ‘œํ˜„์˜ ์˜๋ฏธ๋ก ์  ๊ตฌ์กฐ ํ•™์Šต์„ ์‹ค์ œ ๊ฐ€์„ค ์ถ”๋ก ์— ์—ฐ๊ฒฐํ•˜๋Š” ์‘์šฉ ์—ฐ๊ตฌ๋กœ ํ•จ๊ป˜ ์ฐธ๊ณ ํ•  ๋งŒํ•˜๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
CiteCheck ๋…ผ๋ฌธ์€ LLM ์ƒ์„ฑ ๋‚ด์šฉ์˜ ์ธ์šฉ ๋ฐ ํ™˜๊ฐ ๊ฒ€์ฆ ๊ธฐ์ˆ ์„ ๊ณ ๋„ํ™”ํ•˜๋ฉฐ, KG ๊ธฐ๋ฐ˜ ํ™˜๊ฐ ์™„ํ™” ๋ฐฉ๋ฒ•๊ณผ ์‹ค์ œ ์ ์šฉ ์ฐจ์ด๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
LLM์˜ ๋…ผ๋ฌธ ์ธ์šฉ ํŽธํ–ฅ ๋ฌธ์ œ๋ฅผ ์ง€์‹ ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์ด ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋Š”์ง€, ์ ‘๊ทผ๋ฒ•์˜ ์ฐจ์ด๋ฅผ ๋น„๊ตํ•˜๋Š”๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •