Essence
์์ํ ์ฃผ์ฅ(biomedical claims)์ ๊ฒ์ฆ ๊ฐ๋ฅ์ฑ์ ๊ฒฐ์ ํ๋ ์์ธ์ ๋ถ์ํ๊ธฐ ์ํด, ์ํฐํฐ(entity)์ ๊ด๊ณ(relation) ์์ฑ์ ์ค์ ์ ๋๊ณ 447๊ฐ์ ๊ฒ์ฆ ๋ถ๊ฐ๋ฅํ ์ฌ๋ก๋ฅผ ํฌํจํ BEAR-FACT ์ฝํผ์ค๋ฅผ ๊ตฌ์ถํ ์ฐ๊ตฌ์ด๋ค.
Evaluation
Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ์์ํ ์ฌ์ค ๊ฒ์ฆ์ ๊ฒ์ฆ ๋ถ๊ฐ๋ฅ์ฑ ๋ฌธ์ ์ ์ด์ ์ ๋ง์ถ์ด ์ฒด๊ณ์ ์ธ ๋ถ์๊ณผ ์๋ก์ด ์ฝํผ์ค๋ฅผ ์ ๊ณตํ ์๋ฏธ ์๋ ์ฐ๊ตฌ์ด๋, ๊ฒ์ฆ ๋ถ๊ฐ๋ฅ ์ฃผ์ฅ ์์ธก์ ๋ฎ์ ์ฑ๋ฅ๊ณผ ์๊ฐ ์ ์ฝ์ ํธํฅ ๋ฌธ์ ๋ ์ค์ ์์ฉ ์ธก๋ฉด์์์ ํ๊ณ๋ฅผ ๋ณด์ฌ์ค๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
708๋ฒ ๋
ผ๋ฌธ์ ์๊ฐ ์ ๋ณด์ ํ
์คํธ ์ฆ๊ฑฐ๋ฅผ ๊ฒฐํฉํด ๊ณผํ ์ฃผ์ฅ ๊ฒ์ฆ์ ์ฐจ๋ณํ๋ ๋ฐ์ดํฐ ํํ์ ์ ์ํ๋ฉฐ, ์๋ฃ ์ฃผ์ฅ ๊ฒ์ฆ์ ๊ตฌํ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
880์ ๋ฉ๋์ปฌ ์ฃผ์ฅ ๊ฒ์ฆ ๋ถ๊ฐ ์์ธ์ ๋ถ์ํ ์ฐ๊ตฌ์ฌ์, 685์์ ์ฌ์ค ์ถ์ถ ๊ธฐ๋ฐ ๊ฒ์ฆ ๋ฐฉ๋ฒ์ ํ์์ฑ๊ณผ ํ๋น์ฑ์ ๊ฒ์ฆํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
FactKG(333)์ ๊ณผํ์ ์ฃผ์ฅ ๊ฒ์ฆ์์ ์ํฐํฐ-๊ด๊ณ ์ ๋ณด ํ์ฉ์ด๋ผ๋ ์ ์ฌ ๋ฌธ์ ์์ ์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ ์ ์ฉํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Claimver ๋
ผ๋ฌธ์ ์ค๋ช
๊ฐ๋ฅํ ์ฆ๊ฑฐ ํ์ง์ ์ฃผ์ฅ ๊ฒ์ฆ ์๋ํ ๋ฐฉ์์ ๋ค๋ฃจ๊ธฐ ๋๋ฌธ์, BEAR-FACT ์ฝํผ์ค ๊ธฐ๋ฐ ๋ถ์๊ณผ ์ํธ ๋ณด์์ ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ํ ๋ถ์ผ ์ฐ๊ตฌ ๋ณด๊ณ ์์ ์ ๋ขฐ์ฑ๊ณผ ๊ฒ์ฆ ๊ฐ๋ฅ์ฑ ๋ฌธ์ ๋ฅผ ๋ถ์ํ์ฌ, LLM ๊ธฐ๋ฐ ํผ์ด ๋ฆฌ๋ทฐ์ ๊ฒ์ฆ ๊ฐ๋ฅ์ฑ ๋
ผ์์ ์ฐ๊ฒฐ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Explainable biomedical claim verification with large language models ๋
ผ๋ฌธ์ ์์๋ช
์ฃผ์ฅ ๊ฒ์ฆ ๋ฌธ์ ์์ LLM ๊ธฐ๋ฐ ์ค๋ช
๊ฐ๋ฅ์ฑ์ ์ด์ ์ ๋ง์ถฐ, 880์ ๊ฒ์ฆ ๊ฐ๋ฅ์ฑ ์์ธ๋ถ์๊ณผ ์ํธ๋ณด์์ ์๊ฐ์ ์ ๊ณตํ๋ค.
ํ์ ์ฐ๊ตฌ
332๋ฒ ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ ๊ณผํ์ ์ฌ์ค ๊ฒ์ฆ์์ ๋ณต์กํ ์ํฐํฐ/๊ด๊ณ/์ฆ๊ฑฐ ๊ธฐ๋ฐ ์ถ๋ก ์ ๋ค๋ฃจ๋ฉฐ ์์ฉ ๋ถ์์ ๋ฒ์์ ๋์ด๋๋ฅผ ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
685๋ ์ฆ๊ฑฐ ๊ธฐ๋ฐ ์ฌ์ค ์ถ์ถ์ ํตํ ์ฃผ์ฅ ๊ฒ์ฆ ๊ฒฌ๊ณ ์ฑ ๊ฐํ ๋ฐฉ๋ฒ์ ์ ์ํ์ฌ, 880์ ๊ฒ์ฆ ๊ฐ๋ฅ์ฑ ๋ถ์ ๊ฒฐ๊ณผ๋ฅผ ํ์ฉํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
Sciclaimhunt๋ ์ฆ๊ฑฐ ๊ธฐ๋ฐ ๊ณผํ ์ฃผ์ฅ ๊ฒ์ฆ์ ์ฌ์ฉํ ์ ์๋ ๋๊ท๋ชจ ๋ฐ์ดํฐ์
๊ณผ ํ์คํฌ๋ฅผ ์ ๊ณตํด, 880์์ ๋ถ์ํ ๊ฒ์ฆ ๋ถ๊ฐ๋ฅ ์ฃผ์ฅ ์ผ์ด์ค์ ๊ณ๋์ ์ฐ๊ตฌ๋ฅผ ํ์ฅ ์ ์ฉํ ์ ์๊ฒ ํด์ค๋ค.
ํ์ ์ฐ๊ตฌ
SPOT(881)์ ๋
ผ๋ฌธ ์ค๋ฅ ์๋ ๊ฒ์ฆ์ ์ค์ ๋ฒค์น๋งํฌ๋ก, claim ๊ฒ์ฆ๊ฐ๋ฅ์ฑ ๋ถ์ ์ฐ๊ตฌ๋ฅผ ์ค์ ์ ์ฉ์ผ๋ก ํ์ฅํฉ๋๋ค.
์์ฉ ์ฌ๋ก
What makes medical claims (un) verifiable? ๋
ผ๋ฌธ์ ChatGPT ๋ฑ ์์ฑํ AI๊ฐ ๊ณผํ์ ์ฃผ์ฅ ๊ฒ์ฆ์ ๋ฏธ์น๋ ์ค์ ์ํฅ๊ณผ ์ํ์ 899์ ๊ณผํ๊ณ ์ํฅ ์ฌ๋ก๋ก ๊ตฌ์ฒดํํ๋ค.
์์ฉ ์ฌ๋ก
What makes medical claims (un)verifiable?๋ ์๋ฃ ํฉํธ์ฒดํฌ ํ๊ฒฝ์์ ๊ฒ์ฆ/๋น๊ฒ์ฆ ์ฃผ์ฅ ํน์ฑ ๋ถ์์ ํตํด, 328์ด ์ ์ํ ์์คํ
ํ๊ฐ์ ํ์ค์ ์ด๋ ค์์ ๋ณด์์ ์ผ๋ก ์ค๋ช
ํฉ๋๋ค.
๋ฐ๋ก /๋นํ
880์ ์๋ฃ ํด๋ ์ ๊ฒ์ฆ์ ํ๊ณ ์์ธ์ ์ง์ค ๋ถ์ํ์ฌ, 116์์ ๋
ผ์ํ๋ '์ฑ
์ ์๋ AI ํตํฉ'์ ํ์์ฑ๊ณผ ์ํ์ฑ์ ๋ท๋ฐ์นจํฉ๋๋ค.