Automated justification production for claim veracity in fact checking: A survey on architectures and approaches

Essence

일반적인 자동 팩트체킹(AFC) 파이프라인: 주장 검증성 탐지 → 증거 검색 및 선택 → 진위 판정 → 정당화 생성

본 논문은 자동 팩트체킹 시스템에서 판정 결과를 설명하기 위한 정당화(justification) 자동 생성에 초점을 맞춘 종합 서베이로, 최근 트랜스포머와 대형언어모델(LLM) 발전에 따른 설명 가능한 팩트체킹의 진화를 체계적으로 분석하고 정당화 표준화를 위한 다차원 분류체계를 제시한다.

Motivation

Known: 온라인 콘텐츠의 급증으로 자동 팩트체킹의 중요성 증대; 기존 연구는 주로 진위 판정(veracity prediction)에 집중
Gap: 판정 결과만 제시하는 방식은 거짓 정보를 강화할 수 있으며, 신뢰성 있는 설명(justification)을 제공하는 연구는 부족함; Kotonya and Toni (2020a) 이후 트랜스포머/LLM 기반의 새로운 접근법들이 등장했으나 체계적인 정리 부재
Why: 신경망 모델의 해석 어려움을 극복하고 정당화의 신뢰성을 확보하려면 표준화된 평가 기준과 다양한 방법론의 비교 분석이 필수적
Approach: 정당화 생성 방법론을 (1) 파이프라인 아키텍처, (2) 입출력 유형, (3) 주요 접근법, (4) 설명 가능성 등 5개 차원의 다면적 분류체계로 정리하고 진행 상황을 분석

Achievement

정당화 생성을 위한 5개 차원의 분류 체계: 파이프라인 아키텍처, 입력 유형, 출력 유형, 설명 가능성, 주요 접근법

다차원 분류체계 제시: AFC 정당화 생성을 (i) 파이프라인 아키텍처 (ii) 입력 유형(텍스트/멀티모달) (iii) 출력 유형(자연언어/강조/SPO 트리플) (iv) 설명 가능성(자기설명적/비자기설명적) (v) 주요 방법론(어텐션, 지식그래프, 요약, 멀티홉, LLM RAG/파인튜닝) 등으로 체계적으로 분류
정당화 표준화 진행 상황 분석: Graves (2018)의 완전성, 일관성, 상호작용성, 실행가능성, 시간성, 참신성, 복잡성, 간결성, 인과성, 중립성 등 10가지 바람직한 특성(desiderata)을 제시하고, Atanasova et al. (2022)의 손실함수 기반 일관성 강화 시도 등 진행 상황 기록
기존 서베이의 한계 극복: Kotonya and Toni (2020a)의 논문 이후 출현한 새로운 접근법들(특히 LLM 기반)을 포함하며, 멀티모달 정당화 생성 분야의 미개척 영역에 대한 초기 관찰 제공

How

AFC 파이프라인의 4단계 구성:

주장 검증성 탐지 (3.1): 주장의 중요도, 검증 가능성, 잠재적 해악성 판단
증거 검색 및 선택 (3.2): 신뢰할 수 있는 출처에서 관련 증거 수집
진위 판정 (3.3): 이진(참/거짓) 또는 세분화된 다중 분류(부분적 참, 오도적 등)
정당화 생성 (3.4): 판정 근거를 자연언어로 설명

주요 정당화 생성 접근법:

어텐션 기반(Attention-based): 증거와 주장 간 관계에서 높은 어텐션 스코어 부분 강조
지식그래프 기반(Knowledge Graph-based): 그래프 구조로 증거 표현, 선택된 노드를 정당화로 활용
요약 기반(Summarization-based): 관련 증거를 자연언어 텍스트로 요약
멀티홉 기반(Multi-hop based): 주장을 부분으로 분해하여 순차적 검증
LLM 기반(RAG/Fine-tuning): 프롬프팅을 통한 LLM 활용

표준 정장화를 위한 평가 지표:

전역 일관성(global coherence): 정당화와 주장, 판정 레이블의 관련성
지역 일관성(local coherence): 정장 내 문장 간 모순 부재

Originality

포괄적 다면적 분류체계: 기존 Kotonya and Toni (2020a)의 분류를 상당히 확장하여 파이프라인 아키텍처, 입출력 유형, 설명 가능성을 독립적 차원으로 처리
최신 기술 반영: 트랜스포머 및 LLM 기반 접근법의 급속한 발전(2020년 이후)을 체계적으로 정리한 최초 시도
정당화 표준화 과정 추적: Graves, Kotonya & Toni, Atanasova 등의 바람직한 특성(desiderata) 정의부터 실제 평가 구현까지 진화 과정을 명확히 기록
멀티모달 정당화 생성의 초기 탐색: 기존 멀티모달 팩트체킹 서베이에서 언급되지 않은 자연언어 정장화 분야의 새로운 시도들을 포함