Claimver: Explainable claim-level verification and evidence attribution of text through knowledge graphs

์ €์ž: Preetam Prabhu Srikar Dammu, Himanshu Naidu, Mouly Dewan, Youngmin Kim, Tanya Roosta, Aman Chadha, Chirag Shah | ๋‚ ์งœ: 2024 | DOI: N/A 📄 PDF


Essence

Figure 1

ClaimVer์˜ ์ฃผ์žฅ ๊ฒ€์ฆ ๋ฐ ์ฆ๊ฑฐ ๊ท€์† ์‹œ์—ฐ. ์ž๋™ ์ƒ‰์ƒ ์ฝ”๋”ฉ(ํ™ฉ์ƒ‰: ์™ธ์‚ฝ, ์ ์ƒ‰: ๋ชจ์ˆœ)๊ณผ ์œ„ํ‚ค๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์ฆ๊ฑฐ ์ œ์‹œ

๋ณธ ๋…ผ๋ฌธ์€ ์ง€์‹ ๊ทธ๋ž˜ํ”„(Knowledge Graph, KG)๋ฅผ ํ™œ์šฉํ•˜์—ฌ ํ…์ŠคํŠธ์˜ ๊ฐ ์ฃผ์žฅ(claim)์„ ์„ธ๋ถ„ํ™”๋œ ์ˆ˜์ค€์—์„œ ๊ฒ€์ฆํ•˜๊ณ , ๊ฐ ๊ฒ€์ฆ ๊ฒฐ๊ณผ์— ๋Œ€ํ•œ ๋ช…ํ™•ํ•œ ์ฆ๊ฑฐ์™€ ์„ค๋ช…์„ ์ œ๊ณตํ•˜๋Š” ClaimVer ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ๋‹จ์ˆœํ•œ ์ด์ง„ ํŒ์ • ๋Œ€์‹  ์ฃผ์žฅ ๋‹จ์œ„์˜ ์„ธ๋ฐ€ํ•œ ๋ถ„์„์„ ํ†ตํ•ด ์‚ฌ์šฉ์ž์˜ ์‹ ๋ขฐ๋„๋ฅผ ํ–ฅ์ƒ์‹œํ‚จ๋‹ค.

Motivation

Achievement

Figure 2

ClaimVer ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์ „์ฒด ์ฒ˜๋ฆฌ ํ๋ฆ„. ์ „์ฒ˜๋ฆฌ ๋‹จ๊ณ„์—์„œ NER, ๊ณต์ฐธ ํ•ด๊ฒฐ, KG ์—”ํ‹ฐํ‹ฐ ๋งํ‚น์„ ๊ฑฐ์ณ ๊ด€๋ จ ์‚ผ์ค‘ํ•ญ(triplet) ๊ฒ€์ƒ‰ ๋ฐ ๋ฏธ์„ธ์กฐ์ •๋œ LLM์„ ํ†ตํ•œ ๊ฒ€์ฆ ์ˆ˜ํ–‰

  1. ์ฃผ์žฅ ๋‹จ์œ„ ์„ธ๋ถ„ํ™” ๊ฒ€์ฆ: ๋‹จ์ผ ํ…์ŠคํŠธ๋ฅผ ๋‹ค์ˆ˜์˜ ๋…๋ฆฝ์  ์ฃผ์žฅ์œผ๋กœ ๋ถ„ํ•ดํ•˜์—ฌ ๊ฐ๊ฐ์„ ๊ฒ€์ฆํ•˜๋ฏ€๋กœ, ์ผ๋ถ€ ์ฃผ์žฅ์ด ๊ฑฐ์ง“์ด๋”๋ผ๋„ ๋‚˜๋จธ์ง€ ์ฃผ์žฅ์˜ ๊ฒ€์ฆ ๊ฒฐ๊ณผ๋ฅผ ์ฐจ๋ณ„ํ™”ํ•˜์—ฌ ์ œ์‹œ ๊ฐ€๋Šฅ.
  2. KG ๊ธฐ๋ฐ˜ ๋‹ค์ค‘ ์ฐธ์กฐ ํ†ตํ•ฉ: ๋‹จ์ผ ์ฐธ์กฐ ๋ฌธํ—Œ๊ณผ์˜ ์ผ๋Œ€์ผ ๋งคํ•‘ ๋ฐฉ์‹์„ ๋ฒ—์–ด๋‚˜ ์ง€์‹ ๊ทธ๋ž˜ํ”„๋ผ๋Š” ํ†ตํ•ฉ๋œ ์ •๋ณด ์ €์žฅ์†Œ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์—ฌ๋Ÿฌ ์ถœ์ฒ˜์—์„œ ์ˆ˜์ง‘๋œ ์ •๋ณด๋ฅผ ์ข…ํ•ฉ์ ์œผ๋กœ ๊ฒ€์ฆ.
  3. ์„ค๋ช…๊ฐ€๋Šฅํ•œ ๊ฒ€์ฆ ๊ฒฐ๊ณผ: ๊ฐ ์ฃผ์žฅ์— ๋Œ€ํ•ด (1) ์˜ˆ์ธก(Attributable/Extrapolatory/Contradictory), (2) ๊ด€๋ จ ์‚ผ์ค‘ํ•ญ, (3) ์„ค๋ช…(rationale), (4) ๊ท€์† ์ ์ˆ˜(Knowledge Attribution Score, KAS)๋ฅผ ํ•จ๊ป˜ ์ œ์‹œ.
  4. ์œ„ํ‚ค๋ฐ์ดํ„ฐ ์—”ํ‹ฐํ‹ฐ ์—ฐ๊ฒฐ: ๊ฒ€์ฆ ๊ฒฐ๊ณผ์™€ ํ•จ๊ป˜ ๊ด€๋ จ ์œ„ํ‚ค ์—”ํ‹ฐํ‹ฐ์˜ ID์™€ ์„ค๋ช…์„ ์‹œ๊ฐ์ ์œผ๋กœ ํ‘œ์‹œํ•˜์—ฌ ์‚ฌ์šฉ์ž๊ฐ€ ๊ฒ€์ฆ์˜ ๊ทผ๊ฑฐ๋ฅผ ์ง์ ‘ ํ™•์ธ ๊ฐ€๋Šฅ.

How

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ClaimVer๋Š” ์‚ฌ์šฉ์ž ์ค‘์‹ฌ์˜ ์„ค๋ช…๊ฐ€๋Šฅํ•œ ์‚ฌ์‹ค ๊ฒ€์ฆ์ด๋ผ๋Š” ์ค‘์š”ํ•œ ๋ฌธ์ œ์— ์ ‘๊ทผํ•œ ์‹ค์šฉ์  ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, ์ฃผ์žฅ ๋‹จ์œ„ ๊ฒ€์ฆ๊ณผ KG ๊ธฐ๋ฐ˜ ์ฆ๊ฑฐ ์ œ์‹œ ๋ฐฉ์‹์ด ์‹ ์„ ํ•˜๋‹ค. ๋‹ค๋งŒ ์ •๋Ÿ‰์  ํ‰๊ฐ€ ๊ฒฐ๊ณผ์˜ ๋ถ€์žฌ์™€ ๊ธฐ์ˆ ์  ์„ธ๋ถ€์‚ฌํ•ญ์˜ ๋ถ€์กฑ์œผ๋กœ ์ธํ•ด ์žฌํ˜„์„ฑ๊ณผ ์‹ ๋ขฐ์„ฑ ๊ฒ€์ฆ์ด ํ•„์š”ํ•˜๋ฉฐ, ์‹ค์ œ ์‹œ์Šคํ…œ ์„ฑ๋Šฅ๊ณผ ์‚ฌ์šฉ์ž ์‹ ๋ขฐ๋„ ํ–ฅ์ƒ์˜ ์‹ค์ฆ์  ์ฆ๊ฑฐ๊ฐ€ ์ œ์‹œ๋˜์–ด์•ผ ์™„์„ฑ๋„ ์žˆ๋Š” ์—ฐ๊ตฌ๋กœ ํ‰๊ฐ€๋  ์ˆ˜ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์ฆ๊ฑฐ ์ถ”๋ก  ๋ฐ ํŒฉํŠธ์ฒดํ‚น์˜ ๋Œ€ํ‘œ์  ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, ClaimVer์˜ ๋…ผ๋ฆฌ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์„ค๋ช…๊ฐ€๋Šฅํ•œ ํด๋ ˆ์ž„ ๊ฒ€์ฆ ๋ฐ ์ฆ๊ฑฐ ์ถ”์ถœ์— ๊ด€ํ•œ ์ฒด๊ณ„์  ๋ฐฉ๋ฒ•๋ก ์„ ์ œ๊ณตํ•ด ๋„๋ฉ”์ธ ๊ฐ„ ์ผ๋ฐ˜ํ™” ํƒ๊ตฌ์˜ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์‚ฌ์‹ค ๊ฒ€์ฆ ๋ฒค์น˜๋งˆํฌ ์„ค๊ณ„์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
CLAIMVER๋Š” ๊ณผํ•™์  ์ฃผ์žฅ ๊ฒ€์ฆ์„ ์œ„ํ•œ ํ•ด์„๊ฐ€๋Šฅํ•œ ๊ทผ๊ฑฐ-์ถ”๋ก  ์ฒด๊ณ„๋กœ NSF-SCIFY์˜ ๋ฐ์ดํ„ฐ์„ธํŠธ ํ™œ์šฉ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์ž์—ฐ์–ด ์ถ”๋ก  ๋ฐ ํŒฉํŠธ์ฒดํ‚น์— ์ดˆ์ ์„ ๋งž์ถ˜ ClaimVer๊ณผ ๋‹ค๋ฅด๊ฒŒ ์ธ๋„๋„ค์‹œ์•„์–ด COVID-19 ๋„๋ฉ”์ธ ํŠนํ™”์— ์ง‘์ค‘ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Claimver๋„ ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜์˜ ์ž๋™ ์ฃผ์žฅ ๊ฒ€์ฆ ์‹œ์Šคํ…œ์œผ๋กœ, 448์˜ LLM ๊ธฐ๋ฐ˜ KG ์™„์„ฑ ๊ฒ€์ฆ ํ”„๋ ˆ์ž„์›Œํฌ์™€ ์ ‘๊ทผ๋ฒ•์˜ ์ฐจ์ด๊ฐ€ ๋น„๊ต๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
221์€ ์ฒด๊ณ„์ ์ด๊ณ  ์„ค๋ช… ๊ฐ€๋Šฅํ•œ ์ฃผ์žฅ ๊ฒ€์ฆ์„ ์œ„ํ•ด ์ฆ๊ฑฐยท์„ค๋ช…์„ ์ œ๊ณตํ•˜๋Š” ์ ‘๊ทผ๋ฒ•์„ ์ œ์•ˆ, 185์˜ ์†Œํ”„ํŠธ๋ผ๋ฒจ ๊ธฐ๋ฐ˜ ์„ฑ๊ฒฉ ํƒ์ง€์™€ ์œ ์‚ฌํ•˜๊ฒŒ ์„ค๋ช…๋ ฅ ๊ฐ•ํ™” ์ธก๋ฉด์—์„œ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Claimver ๋…ผ๋ฌธ์€ ์„ค๋ช… ๊ฐ€๋Šฅํ•œ ์ฆ๊ฑฐ ํƒ์ง€์™€ ์ฃผ์žฅ ๊ฒ€์ฆ ์ž๋™ํ™” ๋ฐฉ์‹์„ ๋‹ค๋ฃจ๊ธฐ ๋•Œ๋ฌธ์—, BEAR-FACT ์ฝ”ํผ์Šค ๊ธฐ๋ฐ˜ ๋ถ„์„๊ณผ ์ƒํ˜ธ ๋ณด์™„์ ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ง€์‹๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์ฃผ์žฅ์„ ์„ธ๋ถ„ํ™”ยท๊ฒ€์ฆํ•˜๋Š” ClaimVer ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํ†ตํ•ด, ํšจ์œจ์  ์‚ฌ์‹ค ๊ฒ€์ฆ ๋ฐฉ๋ฒ•๋ก ์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋Œ€ํ˜• ์–ธ์–ด๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์ƒ์˜ํ•™ ํด๋ ˆ์ž„ ๊ฒ€์ฆ ์—ฐ๊ตฌ๋กœ, ์ฆ๊ฑฐ์„ธ๋ถ„ํ™” ์ค‘์‹ฌ์˜ ClaimVer์™€ ์ ‘๊ทผ๋ฒ•์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
221๋ฒˆ ๋…ผ๋ฌธ์˜ ์ฃผ์žฅ ๋‹จ์œ„ ๊ฒ€์ฆ ํ‰๊ฐ€ ๋ฌธ์ œ๋Š” 810๋ฒˆ ๋…ผ๋ฌธ์ด ์ œ์•ˆํ•˜๋Š” LLM ํ‰๊ฐ€์˜ ํ•ต์‹ฌ์—ญ๋Ÿ‰ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ์ข€ ๋” ๋„“์€ ํ‰๊ฐ€ ์ฒด๊ณ„๋กœ ํ™•์žฅ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
221์€ ๊ณผํ•™ ์ฃผ์žฅ ๊ฒ€์ฆ์—์„œ ํ•ด์„ค๊ฐ€๋Šฅ(Explainable) ๊ทผ๊ฑฐ ์ถ”์ถœ์„ ๋”ํ•ด, 183์˜ LLM ๊ธฐ๋ฐ˜ ์˜ค๋ณด ํƒ์ง€ ์•„ํ‚คํ…์ฒ˜์™€ ๊ฒฐํ•ฉํ•ด ๋ณผ ๋งŒํ•ฉ๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
541 ๋…ผ๋ฌธ์€ ์นด์šดํ„ฐ์—๋น„๋˜์Šค ๋ถ€์กฑ์ด ํŒฉํŠธ์ฒดํ‚น ์‹ ๋ขฐ์„ฑ์— ๋ผ์น˜๋Š” ํ•œ๊ณ„์ ์„ ์ง€์ ํ•˜์—ฌ, 221์˜ ์„ธ๋ฐ€ ๊ฒ€์ฆ ๋ฐฉ์‹์˜ ํšจ๊ณผ์— ๋น„ํŒ์  ์‹œ๊ฐ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •