KGValidator: A framework for automatic validation of knowledge graph construction

์ €์ž: Jack Boylan, Shashank Mangla, Dominic Thorn, Demian Gholipour Ghalandari, Parsa Ghaffari, Chris Hokamp (Quantexa) | ๋‚ ์งœ: 2024 | DOI: arXiv:2404.15923 📄 PDF


Essence

Figure 1

์ง€์‹ ๊ทธ๋ž˜ํ”„ ํŠธ๋ฆฌํ”Œ ๊ฒ€์ฆ์„ ์œ„ํ•œ ํ”„๋ ˆ์ž„์›Œํฌ: ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ(์›น, Wikidata, ๋ฌธ์„œ)์™€ LLM์„ ํ™œ์šฉํ•˜์—ฌ ๊ฒ€์ฆ๋˜์ง€ ์•Š์€ ํŠธ๋ฆฌํ”Œ์„ ๊ฒ€์ฆ๋œ ํŠธ๋ฆฌํ”Œ๋กœ ๋ณ€ํ™˜

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์„ ํ™œ์šฉํ•˜์—ฌ ์ง€์‹ ๊ทธ๋ž˜ํ”„(Knowledge Graph, KG) ์™„์„ฑ ๋ชจ๋ธ์„ ์ž๋™์œผ๋กœ ๊ฒ€์ฆํ•˜๋Š” ํ”„๋ ˆ์ž„์›Œํฌ์ธ KGValidator๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ๊ธฐ์กด์˜ ์ธ๊ฐ„ ์ฃผ์„์— ์˜์กดํ•˜๋Š” ๊ฒ€์ฆ ๋ฐฉ์‹์„ LLM ๊ธฐ๋ฐ˜์˜ ์ƒ์„ฑ ์—์ด์ „ํŠธ๋กœ ๋Œ€์ฒดํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ค€๋‹ค.

Motivation

Achievement

  1. ํ”„๋ ˆ์ž„์›Œํฌ ๊ฐœ๋ฐœ: Instructor ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ, Pydantic ํด๋ž˜์Šค, ํ•จ์ˆ˜ ํ˜ธ์ถœ์„ ํ™œ์šฉํ•˜์—ฌ LLM์ด ์˜ฌ๋ฐ”๋ฅธ ๊ฒ€์ฆ ์ง€์นจ์„ ๋”ฐ๋ฅด๊ณ  ์ •ํ™•ํ•œ ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ๋ฅผ ์ถœ๋ ฅํ•˜๋„๋ก ์ œ์–ด
  2. ์œ ์—ฐํ•œ ์ง€์‹ ์†Œ์Šค ํ†ตํ•ฉ: LLM์˜ ๋‚ด์žฌ ์ง€์‹, ์‚ฌ์šฉ์ž ์ œ๊ณต ํ…์ŠคํŠธ ๋ฌธ์„œ, ์™ธ๋ถ€ ์ง€์‹ ์†Œ์Šค(Wikidata, ์ธํ„ฐ๋„ท ๊ฒ€์ƒ‰)๋ฅผ ๋ชจ๋‘ ์ง€์›ํ•˜๋ฉฐ ๊ธˆ ์ฐธ์กฐ ๋ถˆํ•„์š”
  3. ๋ฒค์น˜๋งˆํฌ ํ‰๊ฐ€: ์ธ๊ธฐ ์žˆ๋Š” KG ์™„์„ฑ ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ์…‹์— ๋Œ€ํ•œ ํ”„๋ ˆ์ž„์›Œํฌ ํšจ๊ณผ์„ฑ ๊ฒ€์ฆ
  4. ๋ฌธ๋งฅ ๊ฐ•ํ™” ๋ถ„์„: ์ถ”๊ฐ€ ๋ฌธ๋งฅ ์ œ๊ณต์ด ์ตœ์ฒจ๋‹จ LLM์˜ ํ‰๊ฐ€ ๋Šฅ๋ ฅ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ ์กฐ์‚ฌ

How

Figure 3

๊ฐœ๋ฐฉ ์ •๋ณด ์ถ”์ถœ(OpenIE)์˜ ์˜ˆ์‹œ: ๊ณ ์ •๋˜์ง€ ์•Š์€ ์ถœ๋ ฅ ์Šคํ‚ค๋งˆ์—์„œ ํ…์ŠคํŠธ๋กœ๋ถ€ํ„ฐ ์—”ํ‹ฐํ‹ฐ์™€ ์†์„ฑ์„ ์ถ”์ถœ

๊ฒ€์ฆ ํŒŒ์ดํ”„๋ผ์ธ:

๊ตฌ์กฐ์ /์˜๋ฏธ์  ๊ฒ€์ฆ:

Originality

Limitation & Further Study

Evaluation

์ดํ‰: KGValidator๋Š” LLM์„ ํ™œ์šฉํ•œ KG ๊ฒ€์ฆ ์ž๋™ํ™”๋ผ๋Š” ์‹ค์šฉ์  ๋ฌธ์ œ ํ•ด๊ฒฐ ๋ฐฉ์•ˆ์„ ์ œ์‹œํ•˜์ง€๋งŒ, ์ •๋Ÿ‰์  ํ‰๊ฐ€ ๊ฒฐ๊ณผ์™€ ๊ตฌํ˜„ ๊ณต๊ฐœ ์ œ์•ฝ์œผ๋กœ ์ธํ•ด ํ•™์ˆ ์  ๊ธฐ์—ฌ๋„๋Š” ์ค‘๊ฐ„ ์ˆ˜์ค€์ด๋‹ค. ์‚ฐ์—… ์ ์šฉ ๊ฐ€์น˜๋Š” ๋†’์œผ๋‚˜ ์žฌํ˜„์„ฑ๊ณผ ๊ธฐ์ˆ ์  ์—„๋ฐ€์„ฑ ์ธก๋ฉด์—์„œ ๊ฐœ์„ ์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Fact-checking complex claims with program-guided reasoning ๋…ผ๋ฌธ์€ ์ž๋™ ์ฆ๊ฑฐ ๊ฒ€์ฆ ํ๋ฆ„ ๋ฐ ์‚ฌ์‹ค ๊ฒ€์ฆ์— ์žˆ์–ด 448์ด ์ทจํ•œ LLM ๊ธฐ๋ฐ˜ ๊ฒ€์‚ฌ ์Šคํƒ€์ผ์˜ ์ด๋ก ยท๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ๊ตฌ์ถ•ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
005 ๋…ผ๋ฌธ์€ ๋กฑ ์ปจํ…์ŠคํŠธ LLM์˜ ์–ธ์–ด ๋ชจ๋ธ๋ง ๊ธฐ๋ฐ˜ ์ •๋ณด๋ฅผ ์‹ฌ์ธต ๋ถ„์„ํ•˜์—ฌ KGValidator๊ฐ€ ํ™œ์šฉํ•˜๋Š” LLM์˜ ์žฅ๋‹จ์  ์ดํ•ด์— ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
333 ๋…ผ๋ฌธ์€ ๋ณตํ•ฉ์ ์ธ ์ฃผ์žฅ ๊ฒ€์ฆ์„ ์œ„ํ•ด ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์ถ”๋ก  ๋ฐฉ์‹์„ ํ™œ์šฉํ•˜์ง€๋งŒ, KGValidator์™€ ๋‹ฌ๋ฆฌ LLM ๊ธฐ๋ฐ˜ ์ƒ์„ฑํ˜• ์—์ด์ „ํŠธ๋ฅผ ์‚ฌ์šฉํ•˜์ง€ ์•Š๋Š” ์ ์—์„œ ๋‹ค๋ฅธ ์ ‘๊ทผ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ํ•™์ˆ  ์ง€์‹ ๊ทธ๋ž˜ํ”„ ์งˆ์˜์‘๋‹ต ๋ฐฉ๋ฒ• ์—ฐ๊ตฌ๋กœ, LLM์ด ์ง€์‹ ๊ฒ€์ฆ์— ์–ด๋–ป๊ฒŒ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋Š”์ง€ ๋Œ€์•ˆ ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Claimver๋„ ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜์˜ ์ž๋™ ์ฃผ์žฅ ๊ฒ€์ฆ ์‹œ์Šคํ…œ์œผ๋กœ, 448์˜ LLM ๊ธฐ๋ฐ˜ KG ์™„์„ฑ ๊ฒ€์ฆ ํ”„๋ ˆ์ž„์›Œํฌ์™€ ์ ‘๊ทผ๋ฒ•์˜ ์ฐจ์ด๊ฐ€ ๋น„๊ต๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
448(KGValidator)์€ ์ž๋™ํ™”๋œ ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ฒ€์ฆยท์‚ฌ์‹ค์„ฑ ์ ๊ฒ€ ์ ˆ์ฐจ๋ฅผ ์„ค๊ณ„ํ•ด, 500์˜ ๊ณผํ•™์  ์ฃผ์žฅ ๋ฐ ์ฆ๊ฑฐ ํƒ์ƒ‰/๋ฐ˜๋ฐ• ์ฒด๊ณ„์˜ ๋˜๋‹ค๋ฅธ ๊ฒ€์ฆ ์ธํ”„๋ผ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
448๋ฒˆ์€ AI ์—์ด์ „ํŠธ๊ฐ€ ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์ •๋ณด ๊ฒ€์ฆยท์œ ํšจ์„ฑ ํ‰๊ฐ€๋ฅผ ๋‹ค๋ฃจ์–ด 613๋ฒˆ์˜ PGraphRAG ์‹œ์Šคํ…œ๊ณผ ๋‹ค๋ฅธ ๊ด€์ ์—์„œ ๊ทธ๋ž˜ํ”„ ํ™œ์šฉ๋ฒ•์„ ๋ณด์—ฌ์ค€๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
448 ๋…ผ๋ฌธ์˜ LLM ๊ธฐ๋ฐ˜ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ฒ€์ฆ์€ 810๋ฒˆ ๋…ผ๋ฌธ์—์„œ ๊ฐ•์กฐํ•˜๋Š” LLM ์‹ ๋ขฐ์„ฑ ๋ฐ ์•ˆ์ „์„ฑ ํ•ต์‹ฌ ์—ญ๋Ÿ‰ ํ‰๊ฐ€ ์ฒด๊ณ„์˜ ์ผ๋ถ€๋กœ ํ™•์žฅ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
KGValidator๋Š” LLM์„ ํ™œ์šฉํ•œ ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ฒ€์ฆ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ์จ, 057์˜ ๋ถ€๋ถ„์ž๋™ ํŒฉํŠธ์ฒดํ‚น์„ ์ž๋™ํ™”๋œ KG ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ๋‹จ๊ณ„ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ง€์‹๊ทธ๋ž˜ํ”„์˜ ์ž๋™ ๊ฒ€์ฆ/ํ†ตํ•ฉ์„ ๋ชฉํ‘œ๋กœ ํ•˜๋Š” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํ†ตํ•ด Graphusion์˜ ์ „์—ญ์  ๊ด€์  KG ๊ตฌ์ถ• ๋ฐฉ๋ฒ•์ด ์–ด๋–ป๊ฒŒ ์ ์šฉ๋  ์ˆ˜ ์žˆ๋Š”์ง€ ์•ˆ๋‚ดํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
KGValidator ๋…ผ๋ฌธ์€ ๊ณผํ•™ ๋ฌธํ—Œ ๊ธฐ๋ฐ˜ ๋ชจ๋ธ ๋ฐ ์ •๋ณด์˜ ์‹ ๋ขฐ์„ฑ ์ž๋™ ๊ฒ€์ฆ ๊ธฐ๋ฒ•์„ ๊ฐœ๋ฐœํ•ด ๊ตฌ์„ฑ ๋ชจ๋ธ ์ถ”์ถœ ์ž๋™ํ™”์— ๋Œ€ํ•œ ํ’ˆ์งˆ ํ‰๊ฐ€์™€ ๋ณด์™„์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
541 ๋…ผ๋ฌธ์€ NLP ๊ธฐ๋ฐ˜ ํŒฉํŠธ์ฒดํ‚น์˜ ํ•œ๊ณ„(๋ฐ˜์ฆ ๊ทผ๊ฑฐ ๋ถ€์žฌ)๋ฅผ ๋น„ํŒํ•˜๋ฉฐ, KGValidator์˜ LLM ๊ธฐ๋ฐ˜ ๊ฒ€์ฆ์ด ์‹ค์งˆ์  ์‹ ๋ขฐ์„ฑ์„ ํ™•๋ณดํ•˜๋Š”์ง€ ์žฌ๊ณ ํ•ด๋ณผ ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •