Enhancing natural language inference performance with knowledge graph for covid-19 automated fact-checking in indonesian language

์ €์ž: Arief Purnama Muharram, Ayu Purwarianti | ๋‚ ์งœ: 2024 | DOI: [๋ฏธ์ œ๊ณต] 📄 PDF


Essence

์ธ๋„๋„ค์‹œ์•„์–ด COVID-19 ์ž๋™ ํŒฉํŠธ์ฒดํ‚น ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์œ„ํ•ด ์ง€์‹ ๊ทธ๋ž˜ํ”„(Knowledge Graph)๋ฅผ ์™ธ๋ถ€ ์ง€์‹์œผ๋กœ ํ™œ์šฉํ•˜์—ฌ ์ž์—ฐ์–ด ์ถ”๋ก (Natural Language Inference, NLI)์„ ๊ฐœ์„ ํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค. ์„ธ ๊ฐœ ๋ชจ๋“ˆ(NLI ๋ชจ๋“ˆ, ํŒฉํŠธ ๋ชจ๋“ˆ, ๋ถ„๋ฅ˜๊ธฐ ๋ชจ๋“ˆ)๋กœ ๊ตฌ์„ฑ๋œ ์•„ํ‚คํ…์ฒ˜๋ฅผ ํ†ตํ•ด ์ตœ๋Œ€ 0.8616์˜ ์ •ํ™•๋„๋ฅผ ๋‹ฌ์„ฑํ–ˆ๋‹ค.

Motivation

Achievement

Figure 2 ์ œ์•ˆ๋œ ๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜

๊ทธ๋ฆผ 2: ์„ธ ๊ฐœ ๋ชจ๋“ˆ(NLI, ํŒฉํŠธ, ๋ถ„๋ฅ˜๊ธฐ)๋กœ ๊ตฌ์„ฑ๋œ ์ œ์•ˆ ๋ชจ๋ธ

  1. ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•: 18,750๊ฐœ์˜ ์ „์ œ-๊ฐ€์„ค ๋ฌธ์žฅ ์Œ์œผ๋กœ ๊ตฌ์„ฑ๋œ ์ธ๋„๋„ค์‹œ์•„์–ด COVID-19 ํŒฉํŠธ์ฒดํ‚น ๋ฐ์ดํ„ฐ์…‹ ์ƒ์„ฑ (์—”ํ…Œ์ผ๋จผํŠธ, ๋ชจ์ˆœ, ์ค‘๋ฆฝ 3๊ฐœ ๋ ˆ์ด๋ธ”)
  2. ๋ชจ๋ธ ์„ฑ๋Šฅ: ์ง€์‹ ๊ทธ๋ž˜ํ”„ ํ†ตํ•ฉ์„ ํ†ตํ•ด ์ตœ๋Œ€ 0.8616์˜ ์ •ํ™•๋„ ๋‹ฌ์„ฑ, NLI ์„ฑ๋Šฅ์„ ์œ ์˜๋ฏธํ•˜๊ฒŒ ๊ฐœ์„ 
  3. ๋‹ค์ค‘ ์–ธ์–ด๋ชจ๋ธ ํ‰๊ฐ€: ๋‹จ์ผ์–ธ์–ด(monolingual) ๋ฐ ๋‹ค์ค‘์–ธ์–ด(multilingual) ์‚ฌ์ „ํ•™์Šต ์–ธ์–ด๋ชจ๋ธ์— ๋Œ€ํ•œ ์‹คํ—˜ ์ˆ˜ํ–‰์œผ๋กœ ์ œ์•ˆ ์•„ํ‚คํ…์ฒ˜์˜ ์ผ๋ฐ˜์„ฑ ๊ฒ€์ฆ

How

Figure 3 ํŒฉํŠธ ๋ฌธ์žฅ ๋ฐ ํŒฉํŠธ ๋‹จ๋ฝ ์ฒ˜๋ฆฌ ์›Œํฌํ”Œ๋กœ์šฐ

๊ทธ๋ฆผ 3: ์ง€์‹ ๊ทธ๋ž˜ํ”„ ํŠธ๋ฆฌํ”Œ๋ ›์—์„œ ํŒฉํŠธ ๋ฌธ์žฅ์œผ๋กœ์˜ ๋ณ€ํ™˜ ํ”„๋กœ์„ธ์Šค

Originality

Limitation & Further Study

Evaluation

Novelty: 3.5/5 Technical Soundness: 3.5/5 Significance: 4/5 Clarity: 4/5 Overall: 3.75/5

์ดํ‰: ์ €์ž์› ์–ธ์–ด ๊ธฐ๋ฐ˜ COVID-19 ํŒฉํŠธ์ฒดํ‚น์— ์ง€์‹ ๊ทธ๋ž˜ํ”„๋ฅผ ํ™œ์šฉํ•œ ์‹ค์šฉ์  ์—ฐ๊ตฌ๋กœ, ์‚ฌํšŒ์  ๊ฐ€์น˜๋Š” ๋†’์œผ๋‚˜ ๊ธฐ์ˆ ์  ํ˜์‹ ์„ฑ์€ ์ œํ•œ์ ์ด๋‹ค. ๋‹จ์ˆœํ•œ ๊ฒ€์ƒ‰ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๊ฐœ์„ ๊ณผ ๋” ์ •๊ตํ•œ ์ง€์‹ ํ†ตํ•ฉ ๋ฐฉ์‹์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ํŒฉํŠธ ๊ฒ€์ฆ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, ์™ธ๋ถ€์ง€์‹ ํ†ตํ•ฉ ๊ตฌ์กฐ์— ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ง€์‹ ๊ทธ๋ž˜ํ”„๋ฅผ ํ™œ์šฉํ•œ NLI ๋ฐ ๊ณผํ•™์  ์ฃผ์žฅ์˜ ํŒฉํŠธ์ฒดํฌ ๊ฐœ์„  ๋ฐฉ๋ฒ•๋ก ์ด ์ง์ ‘ ์—ฐ๊ฒฐ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
413์˜ ์ธ๊ฐ„-AI ํŒ€ ํ˜‘์—… ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ 317์˜ ๋ฐฐ๊ฒฝ์ง€์‹์„ ํ™œ์šฉํ•˜์—ฌ ๊ณผํ•™์  ๋ฌธ์žฅ ๋‚ด์ถ”๋Ÿด ์ธํผ๋Ÿฐ์Šค ์„ฑ๋Šฅ์„ ๋†’์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ด€๋ จ ๋‹ค๋ฅธ ๊ด€์ ์˜ ์กฐ์‚ฌ ๋˜๋Š” ๋ฐฉ๋ฒ•๋ก ์„ ๋‹ค๋ฃจ๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Fact-checking complex claims with program-guided reasoning์€ ๋ณต์žก ์ฃผ์žฅ์— ๋Œ€ํ•ด ํ”„๋กœ๊ทธ๋žจ์  ์ถ”๋ก ์„ ์ ‘๋ชฉํ•œ ๋Œ€์•ˆ ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์ž์—ฐ์–ด ์ถ”๋ก  ๋ฐ ํŒฉํŠธ์ฒดํ‚น์— ์ดˆ์ ์„ ๋งž์ถ˜ ClaimVer๊ณผ ๋‹ค๋ฅด๊ฒŒ ์ธ๋„๋„ค์‹œ์•„์–ด COVID-19 ๋„๋ฉ”์ธ ํŠนํ™”์— ์ง‘์ค‘ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋ฌธํ—Œ ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ ํŒฉํŠธ์ฒดํฌ๋ฅผ ๋‹ค์–‘ํ•œ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•์œผ๋กœ ๊ตฌํ˜„ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
317๋ฒˆ ๋…ผ๋ฌธ์€ NLI ์„ฑ๋Šฅ์„ ์™ธ๋ถ€ ์ง€์‹ ๊ทธ๋ž˜ํ”„๋กœ ๋†’์ด๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•˜์—ฌ, LLM์˜ ๋ฐ์ดํ„ฐ ๋ผ๋ฒจ๋ง ๋ฐ ํŒ๋ณ„๋ ฅ ๊ฐœ์„ ์„ ๋‹ค๋ฃฌ 905๋ฒˆ ๋…ผ๋ฌธ์˜ ํ›„์† ์—ฐ๊ตฌ๋กœ ์—ฐ๊ฒฐ๋œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
685๋ฒˆ ๋…ผ๋ฌธ์€ ํŒฉํŠธ(์‚ฌ์‹ค) ๊ฒ€์ถœ ๊ธฐ๋ฐ˜์˜ ๊ฐ•๊ฑดํ•œ ๊ฒ€์ฆ ๋ฐฉ์‹์„ ํƒ๊ตฌํ•˜์—ฌ, 317๋ฒˆ ๋…ผ๋ฌธ์˜ NLI ๊ฐœ์„ ์— ์‹ค๋ฌด์ ์œผ๋กœ ์ ์šฉ๋  ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ์˜์—ญ์—์„œ LLM ํ™œ์šฉ ํŒฉํŠธ์ฒดํ‚น ํ”„๋ ˆ์ž„์›Œํฌ ํ™•์žฅ ๋ฐ ๋‹ค์–‘ํ•œ ์™ธ๋ถ€ ์ง€์‹ ํ™œ์šฉ๋ฒ•์„ ๋‹ค๋ฃฌ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •