Essence
์ธ๋๋ค์์์ด COVID-19 ์๋ ํฉํธ์ฒดํน ์ฑ๋ฅ ํฅ์์ ์ํด ์ง์ ๊ทธ๋ํ(Knowledge Graph)๋ฅผ ์ธ๋ถ ์ง์์ผ๋ก ํ์ฉํ์ฌ ์์ฐ์ด ์ถ๋ก (Natural Language Inference, NLI)์ ๊ฐ์ ํ๋ ์ฐ๊ตฌ์ด๋ค. ์ธ ๊ฐ ๋ชจ๋(NLI ๋ชจ๋, ํฉํธ ๋ชจ๋, ๋ถ๋ฅ๊ธฐ ๋ชจ๋)๋ก ๊ตฌ์ฑ๋ ์ํคํ
์ฒ๋ฅผ ํตํด ์ต๋ 0.8616์ ์ ํ๋๋ฅผ ๋ฌ์ฑํ๋ค.
Evaluation
Novelty: 3.5/5 Technical Soundness: 3.5/5 Significance: 4/5 Clarity: 4/5 Overall: 3.75/5
์ดํ: ์ ์์ ์ธ์ด ๊ธฐ๋ฐ COVID-19 ํฉํธ์ฒดํน์ ์ง์ ๊ทธ๋ํ๋ฅผ ํ์ฉํ ์ค์ฉ์ ์ฐ๊ตฌ๋ก, ์ฌํ์ ๊ฐ์น๋ ๋์ผ๋ ๊ธฐ์ ์ ํ์ ์ฑ์ ์ ํ์ ์ด๋ค. ๋จ์ํ ๊ฒ์ ๋ฉ์ปค๋์ฆ ๊ฐ์ ๊ณผ ๋ ์ ๊ตํ ์ง์ ํตํฉ ๋ฐฉ์์ด ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ํฉํธ ๊ฒ์ฆ ํ๋ ์์ํฌ๋ก, ์ธ๋ถ์ง์ ํตํฉ ๊ตฌ์กฐ์ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ง์ ๊ทธ๋ํ๋ฅผ ํ์ฉํ NLI ๋ฐ ๊ณผํ์ ์ฃผ์ฅ์ ํฉํธ์ฒดํฌ ๊ฐ์ ๋ฐฉ๋ฒ๋ก ์ด ์ง์ ์ฐ๊ฒฐ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
413์ ์ธ๊ฐ-AI ํ ํ์
ํ๋ ์์ํฌ๊ฐ 317์ ๋ฐฐ๊ฒฝ์ง์์ ํ์ฉํ์ฌ ๊ณผํ์ ๋ฌธ์ฅ ๋ด์ถ๋ด ์ธํผ๋ฐ์ค ์ฑ๋ฅ์ ๋์ผ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ง์ ๊ทธ๋ํ ๊ด๋ จ ๋ค๋ฅธ ๊ด์ ์ ์กฐ์ฌ ๋๋ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
Fact-checking complex claims with program-guided reasoning์ ๋ณต์ก ์ฃผ์ฅ์ ๋ํด ํ๋ก๊ทธ๋จ์ ์ถ๋ก ์ ์ ๋ชฉํ ๋์ ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ์์ฐ์ด ์ถ๋ก ๋ฐ ํฉํธ์ฒดํน์ ์ด์ ์ ๋ง์ถ ClaimVer๊ณผ ๋ค๋ฅด๊ฒ ์ธ๋๋ค์์์ด COVID-19 ๋๋ฉ์ธ ํนํ์ ์ง์คํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ ๋ฌธํ ๊ธฐ๋ฐ ์ฐ๊ตฌ ๊ฐ์ค ์์ฑ ๋ฐ ํฉํธ์ฒดํฌ๋ฅผ ๋ค์ํ ๊ทธ๋ํ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ผ๋ก ๊ตฌํํ๋ค.
ํ์ ์ฐ๊ตฌ
317๋ฒ ๋
ผ๋ฌธ์ NLI ์ฑ๋ฅ์ ์ธ๋ถ ์ง์ ๊ทธ๋ํ๋ก ๋์ด๋ ๋ฐฉ๋ฒ์ ์ ์ํ์ฌ, LLM์ ๋ฐ์ดํฐ ๋ผ๋ฒจ๋ง ๋ฐ ํ๋ณ๋ ฅ ๊ฐ์ ์ ๋ค๋ฃฌ 905๋ฒ ๋
ผ๋ฌธ์ ํ์ ์ฐ๊ตฌ๋ก ์ฐ๊ฒฐ๋๋ค.
ํ์ ์ฐ๊ตฌ
685๋ฒ ๋
ผ๋ฌธ์ ํฉํธ(์ฌ์ค) ๊ฒ์ถ ๊ธฐ๋ฐ์ ๊ฐ๊ฑดํ ๊ฒ์ฆ ๋ฐฉ์์ ํ๊ตฌํ์ฌ, 317๋ฒ ๋
ผ๋ฌธ์ NLI ๊ฐ์ ์ ์ค๋ฌด์ ์ผ๋ก ์ ์ฉ๋ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
๋ฐ์ด์ค๋ฉ๋์ปฌ ์์ญ์์ LLM ํ์ฉ ํฉํธ์ฒดํน ํ๋ ์์ํฌ ํ์ฅ ๋ฐ ๋ค์ํ ์ธ๋ถ ์ง์ ํ์ฉ๋ฒ์ ๋ค๋ฃฌ๋ค.