Leveraging LLMs in Scholarly Knowledge Graph Question Answering

์ €์ž: Tilahun Abedissa Taffa, Ricardo Usbeck | ๋‚ ์งœ: 2023-11-16 | DOI: ๋ฏธ๊ณต๊ฐœ 📄 PDF


Essence

Figure 2

ํ•™์ˆ  KGQA ๋ชจ๋ธ์˜ ์ „์ฒด ํŒŒ์ดํ”„๋ผ์ธ

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์„ ํ™œ์šฉํ•˜์—ฌ ํ•™์ˆ  ์ง€์‹ ๊ทธ๋ž˜ํ”„์— ๋Œ€ํ•œ ์ž์—ฐ์–ด ์งˆ๋ฌธ์„ SPARQL ์ฟผ๋ฆฌ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” few-shot ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜๋ฉฐ, SciQA ๋ฒค์น˜๋งˆํฌ์—์„œ F1 ์Šค์ฝ”์–ด 0.99๋ฅผ ๋‹ฌ์„ฑํ–ˆ๋‹ค.

Motivation

Achievement

Figure 1

ChatGPT 3.5์˜ zero-shot SPARQL ์ƒ์„ฑ: Wikidata(์ขŒ)์—์„œ๋Š” ์„ฑ๊ณต, ORKG(์šฐ)์—์„œ๋Š” ์‹คํŒจ

  1. ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ: SciQA ๋ฒค์น˜๋งˆํฌ์—์„œ F1 ์Šค์ฝ”์–ด 0.99(top-3 few-shot) ๋‹ฌ์„ฑ, Scholarly-QALD-23 ์ฑŒ๋ฆฐ์ง€์—์„œ 2์œ„ ๋žญํฌ
  2. Few-shot ์ตœ์ ํ™”: 1-shot(F1=0.96) โ†’ 3-shot(F1=0.99) โ†’ 5-shot(F1=0.989)์˜ ๊ฒฐ๊ณผ๋ฅผ ํ†ตํ•ด ๊ณผ๋„ํ•œ ์˜ˆ์ œ์˜ ๋ถ€์ •์  ์˜ํ–ฅ์„ ์‹ค์ฆ์ ์œผ๋กœ ์ž…์ฆ

How

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ LLM์˜ few-shot ๋Šฅ๋ ฅ์„ ํ•™์ˆ  KGQA์— ํšจ๊ณผ์ ์œผ๋กœ ์ ์šฉํ•˜์—ฌ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ์œผ๋‚˜, ํ…œํ”Œ๋ฆฟ ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ์…‹์˜ ํŠน์ˆ˜์„ฑ๊ณผ ์ œํ•œ๋œ ๋„๋ฉ”์ธ์œผ๋กœ ์ธํ•ด ์‹ค์ œ ํ•™์ˆ  ๊ฒ€์ƒ‰ ์‹œ์Šคํ…œ์œผ๋กœ์˜ ๋ฐฐํฌ ๊ฐ€๋Šฅ์„ฑ์—๋Š” ์ถ”๊ฐ€ ๊ฒ€์ฆ์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
SciBERT ๋“ฑ ๊ณผํ•™ ๋ถ„์•ผ ํŠนํ™” ์–ธ์–ด ๋ชจ๋ธ์˜ ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ๋กœ, ํ•™์ˆ  ์ง€์‹ ๊ทธ๋ž˜ํ”„ ์งˆ์˜ ์‘๋‹ต ์ „๋ฐ˜์— ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ํ•™์ˆ  ์งˆ์˜์‘๋‹ต์—์„œ LLM์˜ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๋ฐ ์ฝ”๋“œ ๋ณ€ํ™˜ ์‘์šฉ์˜ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
333์€ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์‚ฌ์‹ค ๊ฒ€์ฆ์„ ๋‹ค๋ฃจ์–ด, 488์˜ LLM-๊ธฐ๋ฐ˜ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ์งˆ์˜ ์‘๋‹ต๊ณผ ๋ชฉํ‘œ ์˜์—ญ์ด ๊ฒน์น˜์ง€๋งŒ ๋ฐฉ๋ฒ•๋ก ์ด ๋‹ค๋ฆ…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
406(HLM-Cite)์€ LLM๊ณผ ๊ธฐ์กด ์›Œํฌํ”Œ๋กœ์šฐ ๊ฒฐํ•ฉ์„ ํ†ตํ•œ ํ•™์ˆ  ์งˆ์˜์‘๋‹ต ์ž๋™ํ™”์˜ ๋˜ ๋‹ค๋ฅธ ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
715๋Š” ๊ณผํ•™์  ์‹ฌ์ธต ์ฝ๊ธฐ ์งˆ์˜์‘๋‹ต ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ, 488์˜ SciQA์™€ ๋‹ฌ๋ฆฌ ์ž์—ฐ์–ด ์งˆ์˜ ์‘๋‹ต์˜ ๋‚œ์ด๋„๋ฅผ ๋ณ„๋„๋กœ ์‹คํ—˜ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ํ•™์ˆ  ์ง€์‹ ๊ทธ๋ž˜ํ”„ ์งˆ์˜์‘๋‹ต ๋ฐฉ๋ฒ• ์—ฐ๊ตฌ๋กœ, LLM์ด ์ง€์‹ ๊ฒ€์ฆ์— ์–ด๋–ป๊ฒŒ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋Š”์ง€ ๋Œ€์•ˆ ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์˜๋ฃŒ ์ง€์‹ ๊ทธ๋ž˜ํ”„๊ฐ€ ์•„๋‹Œ ์ž„์ƒ ๋ฐ์ดํ„ฐ์…‹ ๊ธฐ๋ฐ˜ ์ถ”๋ก  QA๋กœ, ์„œ๋กœ ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฐฉ์‹์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์˜ํ•™ ๋ฐ ์ƒ๋ช…๊ณผํ•™ ๊ด€๋ จ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ์งˆ์˜์‘๋‹ต์— LLM ๊ธฐ๋ฐ˜ ๋ฐฉ์‹์„ ์ ์šฉํ•˜์—ฌ, MedBioLM์˜ ์ ‘๊ทผ๋ฒ•๊ณผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋Š” ๋Œ€์•ˆ์  ์†”๋ฃจ์…˜์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฒกํ„ฐ ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰๊ณผ LLM์„ ํ™œ์šฉํ•œ ์ •๋ณด ๊ฒ€์ƒ‰ ์‹œ์Šคํ…œ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Leveraging LLMs in Scholarly Knowledge Graph Question Answering ๋…ผ๋ฌธ์€ ๋…ผ๋ฌธ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๋ฌธํ—Œ๊ฐ„ ์˜๋ฏธ ์ถ”์ถœ๊ณผ ์ง€์‹๊ทธ๋ž˜ํ”„ ํ™œ์šฉ์„ ํ™•์žฅํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ณผํ•™ ๊ณ„์—์„œ ์˜๋ฏธ ๋„คํŠธ์›Œํฌ ๋ฐ ์ฃผ์ œ ๋ถ„์„ ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ์ž ์œ„์น˜ ์ถ”์ • ํ”„๋ ˆ์ž„์›Œํฌ์™€, LLM ๊ธฐ๋ฐ˜ ํ•™์ˆ  ์ง€์‹ ๊ทธ๋ž˜ํ”„ QA์˜ ์ƒํ˜ธ ํ™œ์šฉ ๋ฐฉ์•ˆ์„ ์‹œ์‚ฌํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ž„์ƒ ๋ฐ ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ์ •๋ณด ์ถ”์ถœ์—์„œ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์งˆ์˜์‘๋‹ต์„ LLM์œผ๋กœ ๊ตฌํ˜„ํ•˜๋Š” ํ™•์žฅ ์—ฐ๊ตฌ์ด๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
ํ•™์ˆ  ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ QA ์‹œ์Šคํ…œ์˜ ์ž๋™ํ™” ๊ฐœ๋ฐœ์ผ€์ด์Šค๋กœ, ๋…ผ๋ฌธ์˜ ์ง€์‹๊ทธ๋ž˜ํ”„ ํ™œ์šฉ ์‹ค์ „ํšจ๊ณผ๋ฅผ ๋น„๊ต ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
488์€ ์ž„์ƒ ๋„๋ฉ”์ธ์˜ ์ง€์‹๊ทธ๋ž˜ํ”„ QA ์˜์—ญ์—์„œ LLMs์˜ ํ™œ์šฉ๋„๋ฅผ ์‹ค์ œ ์ง„๋‹จ ๋ฌธ์ œ์— ์ ์šฉํ•˜์—ฌ, ClinicalGPT๊ฐ€ ์‹œ๋„ํ•œ ์˜ํ•™์  ์งˆ์˜์‘๋‹ต์˜ ์‹คํšจ์„ฑ์„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AI ๋…ผ๋ฌธ์—์„œ ๊ฐœ๋… ๋…ธ๋“œ ๋„คํŠธ์›Œํฌ์™€ ์˜๋ฏธ ๊ธฐ๋ฐ˜ ์งˆ์˜์‘๋‹ต ์‹œ์Šคํ…œ์ด ์กฐํ™”๋กญ๊ฒŒ ์—ฐ๊ฒฐ๋˜๋Š” ์‹ค์ œ์  ์˜ˆ์‹œ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
488๋ฒˆ์€ ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ LLM ์งˆ์˜์‘๋‹ต ์‘์šฉ์„ ๋‹ค๋ฃจ์–ด, 666๋ฒˆ์˜ ์—ฐ๊ตฌ ๊ฐ€์„ค ์ƒ์„ฑ ๋ฉ”์ปค๋‹ˆ์ฆ˜์˜ ์‹ค์ œ ํ™œ์šฉ ์‚ฌ๋ก€๋กœ ์—ฐ๊ฒฐ๋œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •