์ ์: Preetam Prabhu Srikar Dammu, Himanshu Naidu, Mouly Dewan, Youngmin Kim, Tanya Roosta, Aman Chadha, Chirag Shah | ๋ ์ง: 2024 | DOI: N/A 📄 PDF
Essence
ClaimVer์ ์ฃผ์ฅ ๊ฒ์ฆ ๋ฐ ์ฆ๊ฑฐ ๊ท์ ์์ฐ. ์๋ ์์ ์ฝ๋ฉ(ํฉ์: ์ธ์ฝ, ์ ์: ๋ชจ์)๊ณผ ์ํค๋ฐ์ดํฐ ๊ธฐ๋ฐ ์ฆ๊ฑฐ ์ ์
๋ณธ ๋
ผ๋ฌธ์ ์ง์ ๊ทธ๋ํ(Knowledge Graph, KG)๋ฅผ ํ์ฉํ์ฌ ํ
์คํธ์ ๊ฐ ์ฃผ์ฅ(claim)์ ์ธ๋ถํ๋ ์์ค์์ ๊ฒ์ฆํ๊ณ , ๊ฐ ๊ฒ์ฆ ๊ฒฐ๊ณผ์ ๋ํ ๋ช
ํํ ์ฆ๊ฑฐ์ ์ค๋ช
์ ์ ๊ณตํ๋ ClaimVer ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. ๋จ์ํ ์ด์ง ํ์ ๋์ ์ฃผ์ฅ ๋จ์์ ์ธ๋ฐํ ๋ถ์์ ํตํด ์ฌ์ฉ์์ ์ ๋ขฐ๋๋ฅผ ํฅ์์ํจ๋ค.
Evaluation
์ดํ: ClaimVer๋ ์ฌ์ฉ์ ์ค์ฌ์ ์ค๋ช
๊ฐ๋ฅํ ์ฌ์ค ๊ฒ์ฆ์ด๋ผ๋ ์ค์ํ ๋ฌธ์ ์ ์ ๊ทผํ ์ค์ฉ์ ํ๋ ์์ํฌ๋ก, ์ฃผ์ฅ ๋จ์ ๊ฒ์ฆ๊ณผ KG ๊ธฐ๋ฐ ์ฆ๊ฑฐ ์ ์ ๋ฐฉ์์ด ์ ์ ํ๋ค. ๋ค๋ง ์ ๋์ ํ๊ฐ ๊ฒฐ๊ณผ์ ๋ถ์ฌ์ ๊ธฐ์ ์ ์ธ๋ถ์ฌํญ์ ๋ถ์กฑ์ผ๋ก ์ธํด ์ฌํ์ฑ๊ณผ ์ ๋ขฐ์ฑ ๊ฒ์ฆ์ด ํ์ํ๋ฉฐ, ์ค์ ์์คํ
์ฑ๋ฅ๊ณผ ์ฌ์ฉ์ ์ ๋ขฐ๋ ํฅ์์ ์ค์ฆ์ ์ฆ๊ฑฐ๊ฐ ์ ์๋์ด์ผ ์์ฑ๋ ์๋ ์ฐ๊ตฌ๋ก ํ๊ฐ๋ ์ ์๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ์ฆ๊ฑฐ ์ถ๋ก ๋ฐ ํฉํธ์ฒดํน์ ๋ํ์ ํ๋ ์์ํฌ๋ก, ClaimVer์ ๋
ผ๋ฆฌ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ค๋ช
๊ฐ๋ฅํ ํด๋ ์ ๊ฒ์ฆ ๋ฐ ์ฆ๊ฑฐ ์ถ์ถ์ ๊ดํ ์ฒด๊ณ์ ๋ฐฉ๋ฒ๋ก ์ ์ ๊ณตํด ๋๋ฉ์ธ ๊ฐ ์ผ๋ฐํ ํ๊ตฌ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ฌ์ค ๊ฒ์ฆ ๋ฒค์น๋งํฌ ์ค๊ณ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
CLAIMVER๋ ๊ณผํ์ ์ฃผ์ฅ ๊ฒ์ฆ์ ์ํ ํด์๊ฐ๋ฅํ ๊ทผ๊ฑฐ-์ถ๋ก ์ฒด๊ณ๋ก NSF-SCIFY์ ๋ฐ์ดํฐ์ธํธ ํ์ฉ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ์์ฐ์ด ์ถ๋ก ๋ฐ ํฉํธ์ฒดํน์ ์ด์ ์ ๋ง์ถ ClaimVer๊ณผ ๋ค๋ฅด๊ฒ ์ธ๋๋ค์์์ด COVID-19 ๋๋ฉ์ธ ํนํ์ ์ง์คํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Claimver๋ ์ง์๊ทธ๋ํ ๊ธฐ๋ฐ์ ์๋ ์ฃผ์ฅ ๊ฒ์ฆ ์์คํ
์ผ๋ก, 448์ LLM ๊ธฐ๋ฐ KG ์์ฑ ๊ฒ์ฆ ํ๋ ์์ํฌ์ ์ ๊ทผ๋ฒ์ ์ฐจ์ด๊ฐ ๋น๊ต๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
221์ ์ฒด๊ณ์ ์ด๊ณ ์ค๋ช
๊ฐ๋ฅํ ์ฃผ์ฅ ๊ฒ์ฆ์ ์ํด ์ฆ๊ฑฐยท์ค๋ช
์ ์ ๊ณตํ๋ ์ ๊ทผ๋ฒ์ ์ ์, 185์ ์ํํธ๋ผ๋ฒจ ๊ธฐ๋ฐ ์ฑ๊ฒฉ ํ์ง์ ์ ์ฌํ๊ฒ ์ค๋ช
๋ ฅ ๊ฐํ ์ธก๋ฉด์์ ๋น๊ต๊ฐ ๊ฐ๋ฅํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
Claimver ๋
ผ๋ฌธ์ ์ค๋ช
๊ฐ๋ฅํ ์ฆ๊ฑฐ ํ์ง์ ์ฃผ์ฅ ๊ฒ์ฆ ์๋ํ ๋ฐฉ์์ ๋ค๋ฃจ๊ธฐ ๋๋ฌธ์, BEAR-FACT ์ฝํผ์ค ๊ธฐ๋ฐ ๋ถ์๊ณผ ์ํธ ๋ณด์์ ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ง์๊ทธ๋ํ ๊ธฐ๋ฐ ์ฃผ์ฅ์ ์ธ๋ถํยท๊ฒ์ฆํ๋ ClaimVer ํ๋ ์์ํฌ๋ฅผ ํตํด, ํจ์จ์ ์ฌ์ค ๊ฒ์ฆ ๋ฐฉ๋ฒ๋ก ์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ํ ์ธ์ด๋ชจ๋ธ ๊ธฐ๋ฐ ์์ํ ํด๋ ์ ๊ฒ์ฆ ์ฐ๊ตฌ๋ก, ์ฆ๊ฑฐ์ธ๋ถํ ์ค์ฌ์ ClaimVer์ ์ ๊ทผ๋ฒ์ ๋น๊ตํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
221๋ฒ ๋
ผ๋ฌธ์ ์ฃผ์ฅ ๋จ์ ๊ฒ์ฆ ํ๊ฐ ๋ฌธ์ ๋ 810๋ฒ ๋
ผ๋ฌธ์ด ์ ์ํ๋ LLM ํ๊ฐ์ ํต์ฌ์ญ๋ ํ๋ ์์ํฌ๋ก ์ข ๋ ๋์ ํ๊ฐ ์ฒด๊ณ๋ก ํ์ฅ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
221์ ๊ณผํ ์ฃผ์ฅ ๊ฒ์ฆ์์ ํด์ค๊ฐ๋ฅ(Explainable) ๊ทผ๊ฑฐ ์ถ์ถ์ ๋ํด, 183์ LLM ๊ธฐ๋ฐ ์ค๋ณด ํ์ง ์ํคํ
์ฒ์ ๊ฒฐํฉํด ๋ณผ ๋งํฉ๋๋ค.
๋ฐ๋ก /๋นํ
541 ๋
ผ๋ฌธ์ ์นด์ดํฐ์๋น๋์ค ๋ถ์กฑ์ด ํฉํธ์ฒดํน ์ ๋ขฐ์ฑ์ ๋ผ์น๋ ํ๊ณ์ ์ ์ง์ ํ์ฌ, 221์ ์ธ๋ฐ ๊ฒ์ฆ ๋ฐฉ์์ ํจ๊ณผ์ ๋นํ์ ์๊ฐ์ ์ ๊ณตํฉ๋๋ค.