Sciclaimhunt: A large dataset for evidence-based scientific claim verification

์ €์ž: Sujit Kumar, Anshul Sharma, Siddharth Hemant Khincha, Gautam Shroff, Sanasam Ranbir Singh | ๋‚ ์งœ: 2025 | DOI: N/A 📄 PDF


Essence

Figure 1

Fig. 1. The left sub-figure shows an example of a negative scientific claim

๋ณธ ๋…ผ๋ฌธ์€ ๊ณผํ•™์  ์ฃผ์žฅ(scientific claims) ๊ฒ€์ฆ์„ ์œ„ํ•œ ๋‘ ๊ฐœ์˜ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์ธ SciClaimHunt์™€ SciClaimHunt Num์„ ์ œ์•ˆํ•œ๋‹ค. ๊ธฐ์กด ๋ฐ์ดํ„ฐ์…‹์˜ ํฌ๊ธฐ ์ œํ•œ, ์ดˆ๋ก ์œ„์ฃผ์˜ ์ฆ๊ฑฐ ์‚ฌ์šฉ, ์ˆ˜์น˜์  ์ฃผ์žฅ ๋ถ€์žฌ ๋“ฑ์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด ์—ฐ๊ตฌ๋…ผ๋ฌธ์˜ ๊ฒฐ๊ณผ, ๋…ผ์˜, ๊ฒฐ๋ก  ์„น์…˜์—์„œ ์ถ”์ถœํ•œ ์ฃผ์žฅ์„ LLM ๊ธฐ๋ฐ˜ few-shot prompting์œผ๋กœ ์ƒ์„ฑํ•˜๊ณ , ๋ถ€์ •์  ์ฃผ์žฅ์€ ๋ถ€์ •๊ณผ ๊ฐœ์ฒด๋ช… ๊ต์ฒด ๋ฐฉ์‹์œผ๋กœ ์ƒ์„ฑํ•œ๋‹ค.

Motivation

Achievement

Figure 1

Fig. 1. The left sub-figure shows an example of a negative scientific claim

How

Figure 3

Fig. 3. presents a working diagram of the proposed Retrieval-Augmented Generation-based approach for scientific claim va

Originality

Limitation & Further Study

ํ›„์† ์—ฐ๊ตฌ ๋ฐฉํ–ฅ: ๋” ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ์˜ ๋…ผ๋ฌธ์„ ํฌํ•จํ•˜์—ฌ ๋ฐ์ดํ„ฐ์…‹ ํ™•์žฅ, ๋” ๊ฐ•๋ ฅํ•œ ๊ธฐ์ค€์„  ๋ชจ๋ธ ๊ฐœ๋ฐœ, ๋‹ค๊ตญ์–ด ์ง€์›, ํ˜ผํ•ฉ ๋„๋ฉ”์ธ ํ‰๊ฐ€ ์‹ค์‹œ

Evaluation

Novelty: 3/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 3/5 Overall: 3/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ๊ณผํ•™์  ์ฃผ์žฅ ๊ฒ€์ฆ์„ ์œ„ํ•œ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•์ด๋ผ๋Š” ๋ช…ํ™•ํ•œ ๋ชฉํ‘œ๋ฅผ ๊ฐ€์ง€๊ณ  ๊ธฐ์กด ๋ฐ์ดํ„ฐ์…‹์˜ ์ฃผ์š” ํ•œ๊ณ„๋“ค(ํฌ๊ธฐ, ์ฆ๊ฑฐ ์ œํ•œ, ์ˆ˜์น˜ ์ฃผ์žฅ ๋ถ€์žฌ)์„ ์ฒด๊ณ„์ ์œผ๋กœ ํ•ด๊ฒฐํ•˜๋ ค ์‹œ๋„ํ•œ๋‹ค. LLM ๊ธฐ๋ฐ˜์˜ ์ž๋™ํ™”๋œ ๋ฐ์ดํ„ฐ์…‹ ์ƒ์„ฑ๊ณผ ์ˆ˜์น˜ ์ฃผ์žฅ ์ „๋ฌธ ๋ฐ์ดํ„ฐ์…‹์€ ๊ดœ์ฐฎ์€ ๊ธฐ์—ฌ์ด๋‚˜, ์ œ์•ˆ๋œ ๊ธฐ์ค€์„  ๋ชจ๋ธ์˜ ๊ธฐ์ˆ ์  ์‹ฌํ™”, ์ •๋Ÿ‰์  ํ‰๊ฐ€ ๊ฒฐ๊ณผ์˜ ๋ช…ํ™•ํ•œ ์ œ์‹œ, ๋ฐ์ดํ„ฐ ์ƒ์„ฑ ํ”„๋กœ์„ธ์Šค์˜ ์—„๊ฒฉํ•œ ํ’ˆ์งˆ ๊ฒ€์ฆ์ด ๋” ํ•„์š”ํ•˜๋‹ค. ๋ฐ์ดํ„ฐ์…‹์˜ ์‹ค์šฉ์  ๊ฐ€์น˜๋Š” ๋†’์œผ๋‚˜ ๋ฐฉ๋ฒ•๋ก ์˜ ์ฐธ์‹ ์„ฑ๊ณผ ๊ธฐ์ˆ ์  ํƒ€๋‹น์„ฑ ์ธก๋ฉด์—์„œ ๋ณด์™„์ด ํ•„์š”ํ•œ ์ƒํƒœ์ด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
710์—์„œ ๋‹ค๋ฃจ๋Š” ๊ณผํ•™ ์ฃผ์žฅ ๊ฒ€์ฆ์˜ ๊ทผ๊ฐ„์€ 332์™€ ๊ฐ™์€ ํ”„๋กœ๊ทธ๋žจ-์œ ๋„ ๊ธฐ๋ฐ˜ ๋ณต์žก ์ฃผ์žฅ ํŒฉํŠธ์ฒดํ‚น ๋…ผ์˜์— ๊ธฐ์ดˆํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Sciclaimhunt๋Š” ์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์ฃผ์žฅ ๊ฒ€์ฆ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ๊ณตํ•˜๋ฏ€๋กœ SciClaims ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ์˜ ๋ฆฌ์†Œ์Šค๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณผํ•™์  ์ฃผ์žฅ ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ ๊ตฌ์ถ• ๋ฐ ํŽธํ–ฅ ๋ถ„์„์˜ ์‹ค์ฆ ์—ฐ๊ตฌ๊ฐ€ LLM ์š”์•ฝ ์ผ๋ฐ˜ํ™” ํŽธํ–ฅ ๋…ผ๋ฌธ์— ํ‰๊ฐ€ ์ฒด๊ณ„๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ƒ์˜ํ•™ ๋ถ„์•ผ์—์„œ ๊ทผ๊ฑฐ ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ์ฃผ์žฅ ๊ฒ€์ฆ์„ ๋‹ค๋ฃจ์–ด, ํ—ˆ์œ„์ •๋ณด ๊ฒ€์ถœ ๋งฅ๋ฝ์—์„œ ๋ฐ์ดํ„ฐ์…‹๊ณผ ์ ์šฉ ๋ฐฉ๋ฒ• ์ฐจ์ด๋ฅผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์˜๋ฏธ ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰์„ ํ™œ์šฉํ•œ ๊ณผํ•™์  ์ฃผ์žฅ ๊ฒ€์ฆ์—์„œ ์œ ์‚ฌํ•œ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์œผ๋กœ ํ•ด๊ฒฐํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
NSF-SCIFY๋Š” ์ง€์›๊ธˆ ์ดˆ๋ก์—์„œ ๊ณผํ•™ ์ฃผ์žฅ ์ถ”์ถœ, SciClaimHunt๋Š” ๋…ผ๋ฌธ์ฆ๊ฑฐ์— ๊ธฐ๋ฐ˜ํ•œ ์ฃผ์žฅ ๊ฒ€์ฆ์œผ๋กœ ๊ณผํ•™ ์ฃผ์žฅ ๋ฐ์ดํ„ฐ ํ™œ์šฉ ๊ด€์ ์ด ๋‹ค๋ฅด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
SciClaims ๋…ผ๋ฌธ์€ ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ๊ณผํ•™์—์„œ ์ƒ์„ฑ์  ๋ฐฉ์‹์œผ๋กœ ์ฃผ์žฅ ๋ฐ ์ฆ๊ฑฐ ์ฒด๊ณ„ ๊ตฌ์ถ•์— ์ดˆ์ ์„ ๋งž์ถ”๋ฉฐ, SciClaimHunt ๋ฐ์ดํ„ฐ์…‹์˜ ์ฆ๊ฑฐ ๊ทผ๊ฑฐ ๊ตฌ์กฐ์™€ ๋น„๊ตํ•ด๋ณผ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‘˜ ๋‹ค ์ž๋™ ํŒฉํŠธ์ฒดํ‚น ์‹œ์Šคํ…œ๊ณผ ์ฃผ์žฅ ์ถ”์ถœยทํ‰๊ฐ€์— ์ดˆ์ ์„ ๋‘์ง€๋งŒ, 827์€ ์ถ”์ถœ ํ”„๋ ˆ์ž„์›Œํฌ์™€ ์ƒˆ๋กœ์šด ํ‰๊ฐ€๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์•ฝํ•œ ์ฆ๊ฑฐ(supervision)๋ฅผ ํ™œ์šฉํ•œ ๊ณผํ•™์  ์ฃผ์žฅ ๊ฒ€์ฆ ๋ฐฉ๋ฒ•์„ ํ™•์žฅํ•œ ๋…ผ๋ฌธ์œผ๋กœ, SciClaimHunt์˜ ํ™œ์šฉ ๊ฐ€๋Šฅ ๋ฒ”์œ„๋ฅผ ๋„“ํ˜€์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Sciclaimhunt๋Š” ์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์ฃผ์žฅ ๊ฒ€์ฆ์— ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹๊ณผ ํƒœ์Šคํฌ๋ฅผ ์ œ๊ณตํ•ด, 880์—์„œ ๋ถ„์„ํ•œ ๊ฒ€์ฆ ๋ถˆ๊ฐ€๋Šฅ ์ฃผ์žฅ ์ผ€์ด์Šค์˜ ๊ณ„๋Ÿ‰์  ์—ฐ๊ตฌ๋ฅผ ํ™•์žฅ ์ ์šฉํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ค€๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Sciclaimhunt ๋…ผ๋ฌธ์€ ์„ธ๋ถ€์  ๊ณผํ•™ ์ฃผ์žฅ ๊ฒ€์ฆ ๋ฌธ์ œ์— LLM๊ณผ ๊ฒ€์ƒ‰ ๊ธฐ๋ฐ˜ ํ”„๋กฌํ”„ํŠธ ๋ฐฉ์‹(832์˜ ๋ฐฉ๋ฒ•๋ก ) ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Sciclaimhunt ๋…ผ๋ฌธ์€ ์ฆ๊ฑฐ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์ฃผ์žฅ ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ์‹œํ•˜์—ฌ, ๋ณธ ๋…ผ๋ฌธ์—์„œ ๊ฐ•์กฐํ•œ PubMed ๊ธฐ๋ฐ˜ ๊ฑด๊ฐ• ์งˆ๋ฌธ ์‘๋‹ต ์‹œ์Šคํ…œ์˜ ํ‰๊ฐ€ ๋ฐ ์‘์šฉ์— ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
710 ๋…ผ๋ฌธ์€ ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ๋ถ„์•ผ์—์„œ ์ž๋™ ํด๋ ˆ์ž„ ์ƒ์„ฑ ๋ฐ ๊ฒ€์ฆ ์‹œ์Šคํ…œ์„ ์ ์šฉํ•ด ์‹ค์ œ ์—ฐ๊ตฌ ์ž๋™ํ™” ํŒŒ์ดํ”„๋ผ์ธ์˜ ์‹คํšจ์„ฑ ๊ฒ€์ฆ ์‚ฌ๋ก€๋ฅผ ๋ณด์™„ํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •