Hypothesis Generation with Large Language Models

์ €์ž: Yangqiaoyu Zhou, Haokun Liu, Tejes Srivastava, Hongyuan Mei, Chenhao Tan | ๋‚ ์งœ: 2024 | DOI: 10.18653/v1/2024.nlp4science-1.10 📄 PDF


Essence

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์„ ์ด์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค(hypothesis)์„ ์ž๋™์œผ๋กœ ์ƒ์„ฑํ•˜๊ณ  ๊ฐœ์„ ํ•˜๋Š” HypoGeniC ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ œ์•ˆํ•œ๋‹ค. ๋‹ค์ค‘ ์Šฌ๋กฏ ๋จธ์‹ (multi-armed bandit) ์ด๋ก ์— ์˜๊ฐ์„ ๋ฐ›์•„ ํƒ์ƒ‰-ํ™œ์šฉ(exploration-exploitation) ๊ท ํ˜•์„ ์กฐ์ ˆํ•˜๋ฉฐ ๋ฐ˜๋ณต์ ์œผ๋กœ ๊ฐ€์„ค ํ’€์„ ์—…๋ฐ์ดํŠธํ•˜์—ฌ, ์†Œ์ˆ˜ ์ƒ˜ํ”Œ ํ”„๋กฌํ”„ํŒ…์„ ํฌ๊ฒŒ ๋Šฅ๊ฐ€ํ•˜๋Š” ํ•ด์„ ๊ฐ€๋Šฅํ•œ ๊ฐ€์„ค ๊ธฐ๋ฐ˜ ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ๊ตฌํ˜„ํ•œ๋‹ค.

Motivation

Achievement

Figure 1 ์„ค๋ช…: HypoGeniC์˜ update ๋‹จ๊ณ„์—์„œ ์ƒ์œ„ k๊ฐœ ๊ฐ€์„ค์„ ์ƒˆ ํ›ˆ๋ จ ์˜ˆ์ œ์— ํ‰๊ฐ€ํ•˜๊ณ , ๋ณด์ƒ์„ ์˜ˆ์ธก ์ •ํ™•์„ฑ์— ๋”ฐ๋ผ ์—…๋ฐ์ดํŠธํ•œ๋‹ค. ์ž˜๋ชป๋œ ์˜ˆ์ œ๊ฐ€ ์ž„๊ณ„๊ฐ’์„ ์ดˆ๊ณผํ•˜๋ฉด ํ‹€๋ฆฐ ์˜ˆ์ œ ์€ํ–‰์— ์ถ”๊ฐ€๋˜๊ณ , ์€ํ–‰์ด ์ตœ๋Œ€ ํฌ๊ธฐ์— ๋„๋‹ฌํ•˜๋ฉด ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ƒˆ ๊ฐ€์„ค์„ ์ƒ์„ฑํ•œ๋‹ค.
  1. ๋ถ„๋ฅ˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ: ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ์—์„œ 31.7%, ์‹ค์ œ ๋ฐ์ดํ„ฐ์—์„œ 13.9%, 3.3%, 24.9% ์ •ํ™•๋„ ๊ฐœ์„  (few-shot ๋Œ€๋น„). DECEPTIVE REVIEWS์™€ TWEET POPULARITY ์ž‘์—…์—์„œ RoBERTa, Llama-2-7B ๋“ฑ ๊ฐ๋…ํ•™์Šต(supervised learning) ๋ฐฉ์‹์„ 12.1%, 11.6% ์ดˆ๊ณผ ๋‹ฌ์„ฑ
  2. ๋ชจ๋ธ ๊ฐ„ ๊ต์ฐจ ํ˜ธํ™˜์„ฑ: GPT-3.5-turbo๋กœ ์ƒ์„ฑํ•œ ๊ฐ€์„ค์„ Mixtral ๋“ฑ ๋‹ค๋ฅธ LLM์œผ๋กœ๋„ ํšจ๊ณผ์ ์œผ๋กœ ํ™œ์šฉ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ๋ถ„ํฌ ์™ธ(out-of-distribution) ๋ฐ์ดํ„ฐ์…‹์—์„œ๋„ ๋ฏธ์„ธ์กฐ์ •๋œ RoBERTa๋ฅผ ๋Šฅ๊ฐ€
  3. ํ•ด์„ ๊ฐ€๋Šฅํ•œ ๋ฐœ๊ฒฌ: ์ƒ์„ฑ๋œ ๊ฐ€์„ค์ด ๊ธฐ์กด ๋ฌธํ—Œ์˜ ์ด๋ก ์„ ๊ฒ€์ฆํ•˜๋ฉด์„œ๋„ ์ƒˆ๋กœ์šด ํ†ต์ฐฐ ์ œ์‹œ (์˜ˆ: "๊ฐœ์ธ์  ๊ฒฝํ—˜์ด๋‚˜ ์ƒ์ผ, ๊ธฐ๋…์ผ ๋“ฑ์„ ์–ธ๊ธ‰ํ•œ ๋ฆฌ๋ทฐ๊ฐ€ ๋” ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋‹ค"๋Š” ์ƒˆ๋กœ์šด ๋ฐœ๊ฒฌ)
  4. ๊ฐ•๊ฑดํ•œ ํ•ฉ์„ฑ ์ž‘์—… ์„ฑ๋Šฅ: ๋‹จ์ผ์˜ ์•Œ๋ ค์ง„ ์œ ํšจ ๊ฐ€์„ค์ด ์žˆ๋Š” ํ•ฉ์„ฑ ์ž‘์—…์—์„œ ๊ฐ€์„ค์„ ์ •ํ™•ํžˆ ๋ณต๊ตฌ

How

```

r_i = [์ •ํ™•๋„ ํ•ญ] + ฮฑโˆš(log t / |S_i|)

```

์ฒซ ๋ฒˆ์งธ ํ•ญ์€ ๊ฐ€์„ค์˜ ํ›ˆ๋ จ ์ •ํ™•๋„, ๋‘ ๋ฒˆ์งธ ํ•ญ์€ ํƒ์ƒ‰ ๋ณด๋„ˆ์Šค๋กœ ์„ ํƒ ๋นˆ๋„๊ฐ€ ๋‚ฎ์€ ๊ฐ€์„ค์„ ์žฅ๋ ค

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ LLM์„ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์— ํ™œ์šฉํ•˜๋Š” ์ƒˆ๋กœ์šด ์‹œ๋„๋กœ, ๋‹ค์ค‘ ์Šฌ๋กฏ ๋จธ์‹  ์ด๋ก ์— ๊ธฐ๋ฐ˜ํ•œ ์ฒด๊ณ„์ ์ด๊ณ  ์‹ค์šฉ์ ์ธ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ œ์‹œํ•˜๋ฉฐ ์‹ค์ฆ์ ์œผ๋กœ ๊ฐ•๋ ฅํ•œ ๊ฒฐ๊ณผ๋ฅผ ๋„์ถœํ–ˆ๋‹ค. ํŠนํžˆ ์ƒ์„ฑ๋œ ๊ฐ€์„ค์˜ ๋ชจ๋ธ ๊ฐ„ ํ˜ธํ™˜์„ฑ๊ณผ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ์€ LLM์˜ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ์‹œ์‚ฌํ•˜๋Š” ์ค‘์š”ํ•œ ๋ฐœ๊ฒฌ์ด๋‹ค. ๋‹ค๋งŒ, ๋” ๊นŠ์€ ์ด๋ก ์  ๋ถ„์„๊ณผ ์‹ค์ œ ๊ณผํ•™ ์ปค๋ฎค๋‹ˆํ‹ฐ์™€์˜ ํ˜‘๋ ฅ์„ ํ†ตํ•œ ๊ฐ€์„ค ํ’ˆ์งˆ์˜ ๊ฒ€์ฆ์ด ์ด๋ฃจ์–ด์ง„๋‹ค๋ฉด ๋”์šฑ ์„ค๋“๋ ฅ ์žˆ๋Š” ๊ธฐ์—ฌ๊ฐ€ ๋  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Hypothesis Generation with Large Language Models ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ์•„์ด๋””์–ด ์ƒ์„ฑ ๊ธฐ๋ฒ•์„ ์ด๋ก ์ ์œผ๋กœ ๋ถ„์„ํ•˜์—ฌ PaperRobot์˜ ๊ทผ๊ฐ„์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419๋ฒˆ ๋…ผ๋ฌธ์€ LLM์„ ํ™œ์šฉํ•œ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ์ผ๋ฐ˜๋ก ์„ ๋‹ค๋ค„, 882๋ฒˆ์˜ LLM๊ณผ ์ธ์šฉ ๋ถ„์„ ์ ‘์ ์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์œผ๋กœ ์ ํ•ฉํ•˜๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419๋Š” LLM์˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ๋น„๊ต ํ‰๊ฐ€ํ•˜๋Š” ์ด๋ก ์ /๋ฒค์น˜๋งˆํฌ์  ๋ฐฐ๊ฒฝ์„ ์ œ์‹œํ•ด, 468์˜ zero-shot ๋Šฅ๋ ฅ ๋…ผ์˜๋ฅผ ์‹ฌํ™”ํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์„ ํ†ตํ•œ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๊ธฐ์ดˆ์™€ ๊ธฐ์กด ๋ฐฉ๋ฒ•๋ก ์˜ ํ•œ๊ณ„๋ฅผ ์„ค๋ช…ํ•˜์—ฌ, ๋ณธ ๋…ผ๋ฌธ์ด ์ด๋ฃฌ ๋„์•ฝ์„ ์ดํ•ดํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Hypothesis Generation with Large Language Models ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ ๊ธฐ๋ณธ ์›๋ฆฌ๋ฅผ ์ •๋ฆฌํ•˜์—ฌ KG-CoI ์‹œ์Šคํ…œ์˜ ์ด๋ก ์  ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419๋Š” LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์— ์ดˆ์ ์„ ๋งž์ถ˜ ๋…ผ๋ฌธ์œผ๋กœ, MOOSE-Chem์˜ unseen hypothesis discoverability ์ฃผ์ œ์˜ ๊ธฐ๋ฐ˜์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419๋ฒˆ ๋…ผ๋ฌธ์€ LLM์„ ํ™œ์šฉํ•œ ๊ฐ€์„ค ์ƒ์„ฑ๊ณผ์ • ์ž์ฒด๋ฅผ ๋‹ค๋ฃจ๋ฉฐ ๋Œ€์กฐํ•™์Šต ๊ธฐ๋ฐ˜ ์•ฝ๋ฌผ-์งˆ๋ณ‘ ์ƒํ˜ธ์ž‘์šฉ ๋ชจ๋ธ๋ง๊ณผ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Hypothesis Generation with Large Language Models ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๊ฐ€์„ค์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ์— ๋Œ€ํ•œ ๊ธฐ๋ฐ˜ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•˜์—ฌ, ํ†ตํ•ฉ์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ชจ๋ธ์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
669์—์„œ ์ œ์‹œ๋œ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ์˜๊ฐ/๊ฐ€์„ค์ƒ์„ฑ-์ˆœ์œ„ํ™” ํ”„๋กœ์„ธ์Šค๋Š” 419์˜ LLM ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ ์›๋ฆฌ์™€ ์ง์ ‘ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419๋Š” LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๊ฐ€์„ค ์ƒ์„ฑ์˜ ๊ทผ๊ฐ„ ๊ฐœ๋…๊ณผ ํ•œ๊ณ„๋ฅผ ์„ค๋ช…ํ•˜์—ฌ, 820์˜ ์‹ ๋ขฐ์„ฑ ํ‰๊ฐ€์™€ ๋Œ€์‘์ฑ… ์„ค์ •์˜ ๋ฐฐ๊ฒฝ์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค์ƒ์„ฑ ๋ฐ ๊ด€๋ จ ๋…ผ๋ฌธ ๊ฒ€์ƒ‰ ์ด๋ก ์„ ์ œ๊ณตํ•˜์—ฌ, 540๋ฒˆ ๋…ผ๋ฌธ์˜ ๋ฐฉ๋ฒ•๋ก  ์˜๊ฐ ๊ฒ€์ƒ‰ ์ž‘์—… ์ •์˜์— ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ๋งˆ๋ จํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419๋ฒˆ์€ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์ƒ์„ธํžˆ ๋‹ค๋ฃจ์–ด, 631๋ฒˆ์˜ ํ˜„์žฅ์‹คํ—˜(outcome) ์˜ˆ์ธก ํƒœ์Šคํฌ๊ฐ€ ์–ด๋–ค ์ „์ œ์™€ ํ•œ๊ณ„ ์œ„์— ์„ค๊ณ„๋˜๋Š”์ง€ ์ดํ•ด๋ฅผ ๋•๋Š”๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
GraphEval์˜ ๊ณผํ•™ ์•„์ด๋””์–ด ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋Š” LLM ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ์— ๊ด€ํ•œ ์ตœ์‹  ์—ฐ๊ตฌ์˜ ์ด๋ก ์  ํ† ๋Œ€ ์œ„์—์„œ ๊ตฌ์ถ•๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419๋Š” LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ์„ ๋„“์€ ์‹œ๊ฐ์—์„œ ๋ถ„์„ํ•˜์—ฌ, 763์˜ ๋ฐ์ดํ„ฐ์…‹ ์„ค๊ณ„์™€ ํ‰๊ฐ€์˜ ๋ถ„์„ ํ‹€์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419๋Š” LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐฉ๋ฒ•์„ ์ข…ํ•ฉ์ ์œผ๋กœ ๊ฒ€ํ† ํ•˜๋ฉฐ, 149์˜ ๋ฒ ์ด์ง€์•ˆยท์ •๋ณด์ด๋ก  ๊ธฐ๋ฐ˜ HypoAgents ๊ฐœ๋ฐœ์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419๋Š” ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ reasoning ํ‰๊ฐ€์˜ ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•˜์—ฌ, 837์˜ ๋„๋ฉ”์ธ ํŠนํ™” reasoning ์‹คํ—˜์˜ ๊ธฐ๋ฐ˜์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Hypothesis Generation with Large Language Models ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ์˜ ์ด๋ก  ๋ฐ ์ ‘๊ทผ๋ฐฉ์‹์„ ์ข…ํ•ฉ์ ์œผ๋กœ ๋‹ค๋ฃจ๋ฉฐ, 330์˜ ๊ฐ€์„ค ํ‰๊ฐ€ ์ž๋™ํ™” ๋…ผ๋ฆฌ์˜ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419๋Š” LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ชจ๋ธ์˜ ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•˜์—ฌ, 711์˜ SLR/์ฃผ์žฅ ๊ฒ€์ฆ ์‹œ์Šคํ…œ์— ์ด๋ก ์  ๋ฐ”ํƒ•์„ ์ค€๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419๋Š” LLM์„ ํ™œ์šฉํ•œ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ์—ฐ๊ตฌ๋กœ, 724์˜ AI4Science readiness ํ‰๊ฐ€์˜ ๊ฐœ๋…์  ๊ธฐ๋ฐ˜์„ ํ˜•์„ฑํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
A Survey on Hypothesis Generation for Scientific Discovery ๋…ผ๋ฌธ์€ LLM์„ ์ด์šฉํ•œ ํƒ์ƒ‰-ํ™œ์šฉ ๊ตฌ์กฐ์˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ์—ฐ๊ตฌ์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ž์„ธํžˆ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419๋Š” LLM์„ ํ™œ์šฉํ•œ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์˜ ๊ธฐ์ดˆ ์›๋ฆฌ๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, 666์˜ ์—ฐ๊ตฌ์— ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419 ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์˜ ๊ฐœ๋… ๋ฐ ๊ธฐ๋ฒ•์„ ์ฒด๊ณ„์ ์œผ๋กœ ์ •๋ฆฌํ•˜์—ฌ, 719์˜ ๊ฐ€์„ค ์ƒ์„ฑ ์‹ค์ฆ ์—ฐ๊ตฌ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Hypothesis Generation with Large Language Models ๋…ผ๋ฌธ์€ HypoChainer์˜ ๊ณผํ•™์  ๋ฐœ๊ฒฌ ์ง€์›์„ ์œ„ํ•œ LLM ๊ธฐ๋ฐ˜ ๊ฐ€์„ค์ƒ์„ฑ ์‹œ์Šคํ…œ์˜ ๊ทผ๊ฐ„์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
AI ๊ธฐ๋ฐ˜ ๊ณผํ•™์„ ์œ„ํ•œ ๊ฐœ๋…์  ํ† ๋Œ€์™€ ์ด๋ก ์  ๋…ผ์˜๋ฅผ ํ†ตํ•ด, 419์˜ LLMยทRAG ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ ์‹œ์Šคํ…œ์˜ ๋ฏธ๋ž˜ ๋ฐฉํ–ฅ์— ์ด๋ก ์  ํ†ต์ฐฐ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Œ€ํ˜•์–ธ์–ด๋ชจ๋ธ์„ ํ†ตํ•œ ์˜๋ฏธ๋ก ์  ๊ฐœ๋…์ง€๋„ ๊ตฌ์ถ• ๋ฐ ์‹ ๊ณผํ•™์  ๊ฐ€์„ค ์˜ˆ์ธก์˜ ์ด๋ก ์  ๋…ผ์˜๊ฐ€ ์žฌ๋ฃŒ๊ณผํ•™ ๋ฏธ๋ž˜ ์ฃผ์ œ ์˜ˆ์ธก ์‹œ์Šคํ…œ์˜ ๊ธฐ์ดˆ์™€ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ zero-shot ๊ฐ€์„ค ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ๋ถ„์„ํ•ด HypoGeniC๊ณผ ํƒ์ƒ‰ ์ „๋žต์˜ ํšจ๊ณผ ์ฐจ์ด๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Sparks of science ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜์˜ ๊ตฌ์กฐํ™”๋œ ๋…ผ๋ฌธ ์ •๋ณด ํ™œ์šฉ์„ ํ†ตํ•œ ๊ฐ€์„ค ์ƒ์„ฑ์˜ ๋˜๋‹ค๋ฅธ ์‹ค์ œ ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‘ ๋…ผ๋ฌธ ๋ชจ๋‘ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๊ฐ€์„ค ์ƒ์„ฑ์˜ ํ‰๊ฐ€์™€ ์ตœ์ ํ™”์— ๊ด€๋ จ๋˜์–ด ์žˆ์œผ๋ฉฐ, ํ‰๊ฐ€ ๋ฒค์น˜๋งˆํฌ์™€ ๋ฐฉ๋ฒ•๋ก  ์ฐจ์ด๋ฅผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ž๋™ํ™”๋œ ๊ณผํ•™์  ๋ฐœ๊ฒฌ ๋ฐ ๊ฐ€์„ค ์ƒ์„ฑ์„ ์œ„ํ•œ AI ์‹œ์Šคํ…œ์„ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
419๋Š” ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์„ ํ™œ์šฉํ•œ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ์„ ์†Œ๊ฐœํ•ด 632์˜ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ ์˜ˆ์ธก์„ ํ•œ ๋‹จ๊ณ„ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ฐ€์„ค ์ƒ์„ฑ์„ ์ง€์‹๊ทธ๋ž˜ํ”„(KG)์™€ ๊ฒฐํ•ฉํ•ด ๊ฐ•ํ™”ํ•˜๋Š” ๋…ผ๋ฌธ์œผ๋กœ, 419์˜ LLM ๊ธฐ๋ฐ˜ ๋ฐ˜๋ณต์  ๊ฐ€์„ค ํƒ์ƒ‰์— ๊ตฌ์กฐ์  ์ •๋ณด ํ™œ์šฉ์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
425๋Š” ์‹ค์ œ ์—ฐ๊ตฌ์ž์˜ ์•„์ด๋””์–ด ์ƒ์„ฑ ๋ณด์กฐ ํšจ๊ณผ์™€ ๊ฒ€์ฆ ๊ณผ์ •์„ ๋‹ค๋ฃจ์–ด, 419์˜ ์ž๋™ ๊ฐ€์„ค ์ƒ์„ฑ ๊ฒฐ๊ณผ์— ์ธ๊ฐ„ ์ƒํ˜ธ์ž‘์šฉ ๋ฐ ๊ฒ€์ฆ ์ธก๋ฉด์„ ๋”ํ•ด์ค€๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์—์„œ RAG(๊ฒ€์ƒ‰-์ฆ๊ฐ•์ƒ์„ฑ) ๊ธฐ๋ฐ˜ ๋ฐ˜๋ณต์  ๊ฐ€์„ค ์—…๋ฐ์ดํŠธ๋ผ๋Š” ์•„์ด๋””์–ด๊ฐ€ HiPerRAG์˜ ๋Œ€์šฉ๋Ÿ‰ ๊ณผํ•™๋…ผ๋ฌธ ์ฒ˜๋ฆฌ ๋ฐ ์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ QA์™€ ์‹œ๋„ˆ์ง€๋ฅผ ์ด๋ฃน๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ณผํ•™ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ ๋…ผ๋ฌธ์€ HypoGeniC์˜ ํƒ์ƒ‰-ํ™œ์šฉ ๊ธฐ๋ฐ˜ ์ž๋™ ๊ฐ€์„ค ์ƒ์„ฑ์˜ ๊ตฌ์กฐ์  ํ™•์žฅ ์˜ˆ์‹œ๋ฅผ ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM์„ ํ™œ์šฉํ•œ ์ƒ๋ฌผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ ๋ฐ์ดํ„ฐ ํ•ด์„ ์ž๋™ํ™” ์‚ฌ๋ก€๋กœ, ์ฐจ์„ธ๋Œ€ ๋‹จ์ผ์„ธํฌ ๋ถ„์„์— LLM ์ ์šฉ์˜ ํ™•์žฅ ๋ฐฉํ–ฅ์„ฑ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์„ ํ™œ์šฉํ•œ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ์‚ฌ๋ก€๋กœ, LLM์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ ๊ฒ€ํ† ์™€ ์—ฐ๊ณ„ํ•ด ์‹ค์ œ ํ™œ์šฉ ๋ฐฉ์‹์„ ๋ณด์—ฌ์ค€๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •