Automated justification production for claim veracity in fact checking: A survey on architectures and approaches

์ €์ž: Islam Eldifrawi, Shengrui Wang, Amine Trabelsi | ๋‚ ์งœ: 2024 | DOI: N/A 📄 PDF


Essence

Figure 1

์ผ๋ฐ˜์ ์ธ ์ž๋™ ํŒฉํŠธ์ฒดํ‚น(AFC) ํŒŒ์ดํ”„๋ผ์ธ: ์ฃผ์žฅ ๊ฒ€์ฆ์„ฑ ํƒ์ง€ โ†’ ์ฆ๊ฑฐ ๊ฒ€์ƒ‰ ๋ฐ ์„ ํƒ โ†’ ์ง„์œ„ ํŒ์ • โ†’ ์ •๋‹นํ™” ์ƒ์„ฑ

๋ณธ ๋…ผ๋ฌธ์€ ์ž๋™ ํŒฉํŠธ์ฒดํ‚น ์‹œ์Šคํ…œ์—์„œ ํŒ์ • ๊ฒฐ๊ณผ๋ฅผ ์„ค๋ช…ํ•˜๊ธฐ ์œ„ํ•œ ์ •๋‹นํ™”(justification) ์ž๋™ ์ƒ์„ฑ์— ์ดˆ์ ์„ ๋งž์ถ˜ ์ข…ํ•ฉ ์„œ๋ฒ ์ด๋กœ, ์ตœ๊ทผ ํŠธ๋žœ์Šคํฌ๋จธ์™€ ๋Œ€ํ˜•์–ธ์–ด๋ชจ๋ธ(LLM) ๋ฐœ์ „์— ๋”ฐ๋ฅธ ์„ค๋ช… ๊ฐ€๋Šฅํ•œ ํŒฉํŠธ์ฒดํ‚น์˜ ์ง„ํ™”๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ๋ถ„์„ํ•˜๊ณ  ์ •๋‹นํ™” ํ‘œ์ค€ํ™”๋ฅผ ์œ„ํ•œ ๋‹ค์ฐจ์› ๋ถ„๋ฅ˜์ฒด๊ณ„๋ฅผ ์ œ์‹œํ•œ๋‹ค.

Motivation

Achievement

Figure 3

์ •๋‹นํ™” ์ƒ์„ฑ์„ ์œ„ํ•œ 5๊ฐœ ์ฐจ์›์˜ ๋ถ„๋ฅ˜ ์ฒด๊ณ„: ํŒŒ์ดํ”„๋ผ์ธ ์•„ํ‚คํ…์ฒ˜, ์ž…๋ ฅ ์œ ํ˜•, ์ถœ๋ ฅ ์œ ํ˜•, ์„ค๋ช… ๊ฐ€๋Šฅ์„ฑ, ์ฃผ์š” ์ ‘๊ทผ๋ฒ•

  1. ๋‹ค์ฐจ์› ๋ถ„๋ฅ˜์ฒด๊ณ„ ์ œ์‹œ: AFC ์ •๋‹นํ™” ์ƒ์„ฑ์„ (i) ํŒŒ์ดํ”„๋ผ์ธ ์•„ํ‚คํ…์ฒ˜ (ii) ์ž…๋ ฅ ์œ ํ˜•(ํ…์ŠคํŠธ/๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ) (iii) ์ถœ๋ ฅ ์œ ํ˜•(์ž์—ฐ์–ธ์–ด/๊ฐ•์กฐ/SPO ํŠธ๋ฆฌํ”Œ) (iv) ์„ค๋ช… ๊ฐ€๋Šฅ์„ฑ(์ž๊ธฐ์„ค๋ช…์ /๋น„์ž๊ธฐ์„ค๋ช…์ ) (v) ์ฃผ์š” ๋ฐฉ๋ฒ•๋ก (์–ดํ…์…˜, ์ง€์‹๊ทธ๋ž˜ํ”„, ์š”์•ฝ, ๋ฉ€ํ‹ฐํ™‰, LLM RAG/ํŒŒ์ธํŠœ๋‹) ๋“ฑ์œผ๋กœ ์ฒด๊ณ„์ ์œผ๋กœ ๋ถ„๋ฅ˜
  2. ์ •๋‹นํ™” ํ‘œ์ค€ํ™” ์ง„ํ–‰ ์ƒํ™ฉ ๋ถ„์„: Graves (2018)์˜ ์™„์ „์„ฑ, ์ผ๊ด€์„ฑ, ์ƒํ˜ธ์ž‘์šฉ์„ฑ, ์‹คํ–‰๊ฐ€๋Šฅ์„ฑ, ์‹œ๊ฐ„์„ฑ, ์ฐธ์‹ ์„ฑ, ๋ณต์žก์„ฑ, ๊ฐ„๊ฒฐ์„ฑ, ์ธ๊ณผ์„ฑ, ์ค‘๋ฆฝ์„ฑ ๋“ฑ 10๊ฐ€์ง€ ๋ฐ”๋žŒ์งํ•œ ํŠน์„ฑ(desiderata)์„ ์ œ์‹œํ•˜๊ณ , Atanasova et al. (2022)์˜ ์†์‹คํ•จ์ˆ˜ ๊ธฐ๋ฐ˜ ์ผ๊ด€์„ฑ ๊ฐ•ํ™” ์‹œ๋„ ๋“ฑ ์ง„ํ–‰ ์ƒํ™ฉ ๊ธฐ๋ก
  3. ๊ธฐ์กด ์„œ๋ฒ ์ด์˜ ํ•œ๊ณ„ ๊ทน๋ณต: Kotonya and Toni (2020a)์˜ ๋…ผ๋ฌธ ์ดํ›„ ์ถœํ˜„ํ•œ ์ƒˆ๋กœ์šด ์ ‘๊ทผ๋ฒ•๋“ค(ํŠนํžˆ LLM ๊ธฐ๋ฐ˜)์„ ํฌํ•จํ•˜๋ฉฐ, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ •๋‹นํ™” ์ƒ์„ฑ ๋ถ„์•ผ์˜ ๋ฏธ๊ฐœ์ฒ™ ์˜์—ญ์— ๋Œ€ํ•œ ์ดˆ๊ธฐ ๊ด€์ฐฐ ์ œ๊ณต

How

AFC ํŒŒ์ดํ”„๋ผ์ธ์˜ 4๋‹จ๊ณ„ ๊ตฌ์„ฑ:

์ฃผ์š” ์ •๋‹นํ™” ์ƒ์„ฑ ์ ‘๊ทผ๋ฒ•:

ํ‘œ์ค€ ์ •์žฅํ™”๋ฅผ ์œ„ํ•œ ํ‰๊ฐ€ ์ง€ํ‘œ:

Originality

Limitation & Further Study

ํ•œ๊ณ„:

ํ›„์† ์—ฐ๊ตฌ ๋ฐฉํ–ฅ:

Evaluation

์ดํ‰: ์ด ์„œ๋ฒ ์ด๋Š” ์ž๋™ ํŒฉํŠธ์ฒดํ‚น์˜ ์„ค๋ช… ๊ฐ€๋Šฅ์„ฑ ํ–ฅ์ƒ์ด๋ผ๋Š” ์‹œ์˜์ ์ ˆํ•œ ์ฃผ์ œ๋ฅผ ๋‹ค๋ฉด์  ๋ถ„๋ฅ˜์ฒด๊ณ„๋กœ ์ •๋ฆฌํ•œ ์œ ์šฉํ•œ ์ฐธ๊ณ ์ž๋ฃŒ์ด๋‚˜, ์ •์žฅํ™” ํ‘œ์ค€ํ™”์˜ ๊ตฌ์ฒด์  ๊ธฐ์ˆ ์  ์ง„์ „๊ณผ ์‹ค์ œ ๋ฒค์น˜๋งˆํ‚น ๊ฒฐ๊ณผ ๋ถ„์„์„ ํ†ตํ•ด ๋”์šฑ ๊ฐ•ํ™”๋  ์ˆ˜ ์žˆ์„ ๊ฒƒ์œผ๋กœ ํŒ๋‹จ๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
827๋ฒˆ ๋…ผ๋ฌธ์€ ์ฃผ์žฅ ์ถ”์ถœ ๋ฐ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜์—ฌ 124์˜ ํŒฉํŠธ์ฒดํ‚น ์ •๋‹นํ™” ์ž๋™์ƒ์„ฑ ๋…ผ์˜์˜ ๊ธฐ์ดˆ ์ž๋ฃŒ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Transforming Science with Large Language Models ๋…ผ๋ฌธ์€ LLM์ด ๊ณผํ•™์  ์ฆ๊ฑฐ์™€ ์„ค๋ช…์„ ์–ด๋–ป๊ฒŒ ๋งŒ๋“ค๊ณ  ์ง„ํ™”ํ•˜๋Š”์ง€ ๊ฐœ๊ด„์ ์œผ๋กœ ์„ค๋ช…ํ•˜์—ฌ, ์ •๋‹นํ™” ์ƒ์„ฑ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Automated justification production for claim veracity in fact checking์€ ML ๊ธฐ๋ฐ˜ ์˜ˆ์ธก ๊ฒฐ๊ณผ์— ๋Œ€ํ•œ ์„ค๋ช… ๋ฐ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ ์—ฐ๊ตฌ๋กœ, ํ˜ผํ•ฉ ์‹ ๊ฒฝ๋ง ๋ชจ๋ธ ์˜ˆ์ธก์˜ ์‹ค์šฉ์  ํ•ด์„ ํ•„์š”์„ฑ๊ณผ ์—ฐ๊ณ„๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
124๋Š” fact-checking ๋ฐ claim veracity explanation ์ž๋™ํ™” ๊ธฐ๋ฒ•์„ ๋‹ค๋ฃจ์–ด, 3024 ๋…ผ๋ฌธ์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ reasoning์—์„œ์˜ '์„ค๋ช…๊ฐ€๋Šฅ์„ฑ' ๊ธฐ์ˆ ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
What Can NLP Do for Peer Review? ๋…ผ๋ฌธ์€ LLM์˜ ๋ฆฌ๋ทฐ ์ƒ์„ฑยท์ •๋‹นํ™” ์—ญํ• ์— ๋Œ€ํ•œ ํ˜„ํ™ฉ์„ ๋‹ค๋ฅธ ์‹œ๊ฐ์—์„œ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ํ”„๋กœ๊ทธ๋žจ ๊ธฐ๋ฐ˜ ํŒฉํŠธ์ฒดํ‚น ์ž๋™ํ™” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•˜์—ฌ, ์ •๋‹นํ™” ์„ค๋ช… ์ƒ์„ฑ ๊ธฐ๋ฒ•์˜ ์‘์šฉ๊ณผ ์ž๋™ํ™” ๊ฐ€๋Šฅ์„ฑ์„ ์‹ค์ฆํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ํŒฉํŠธ์ฒดํ‚น ์„ค๋ช… ์ž๋™ํ™”์™€ justification ํ‘œ์ค€ํ™” ์ด์Šˆ๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, TrendFact ๋ฒค์น˜๋งˆํฌ์˜ ํ‰๊ฐ€ ๊ธฐ์ค€ ๋ฐ ํ”„๋ ˆ์ž„์›Œํฌ ๊ณ ๋„ํ™” ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ReviewEval ๋…ผ๋ฌธ์€ AI๊ฐ€ ์ƒ์„ฑํ•œ ๋ฆฌ๋ทฐ์˜ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, ์ •๋‹นํ™” ์ž๋™์ƒ์„ฑ ์‹œ์Šคํ…œ ๊ฒฐ๊ณผ์˜ ํ’ˆ์งˆ ๊ฒ€์ฆ์— ์ฐธ๊ณ ํ•  ๋งŒํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
124๋ฒˆ ๋…ผ๋ฌธ์€ ํŒฉํŠธ์ฒดํ‚น ๊ฒฐ๊ณผ์˜ ์ •๋‹นํ™” ์ž๋™ ์ƒ์„ฑ์— ์ง‘์ค‘๋˜์–ด ์žˆ์–ด 827์˜ ์ฃผ์žฅ ์ถ”์ถœยทํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ์™€ ์‹œ๋„ˆ์ง€๋ฅผ ์ด๋ฃจ๋ฉฐ ์ฝ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
541๋ฒˆ ๋…ผ๋ฌธ์€ ๋ฐ˜์ฆ ์ฆ๊ฑฐ ๋ถ€์žฌ์˜ ํ•œ๊ณ„๋ฅผ ์ง‘์š”ํ•˜๊ฒŒ ๋น„ํŒํ•˜์—ฌ 124์—์„œ ์ œ์‹œํ•˜๋Š” ์ •๋‹นํ™” ์ž๋™ํ™”์˜ ์‹คํšจ์„ฑยทํ•œ๊ณ„๋ฅผ ์ ๊ฒ€ํ•  ๋•Œ ์ฐธ๊ณ ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •