NSF-SCIFY: Mining the NSF Awards Database for Scientific Claims

์ €์ž: D. Rao, Weiqiu You, Eric Wong, Chris Callison-Burch | ๋‚ ์งœ: 2025 | DOI: N/A 📄 PDF


Essence

Figure 2

NSF ์ฃผ์š” ์ง€์› ๋ถ„์•ผ๋ณ„ ๋ถ„ํฌ: ์žฌ๋ฃŒ๊ณผํ•™(3.9%), ์ˆ˜ํ•™๋ฌผ๋ฆฌ๊ณผํ•™(16.5%), ์ง€๊ตฌ๊ณผํ•™(13.8%) ๋“ฑ

NSF(๋ฏธ๊ตญ ๊ตญ๋ฆฝ๊ณผํ•™์žฌ๋‹จ) ์ง€์›๊ธˆ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์—์„œ ๊ณผํ•™์  ์ฃผ์žฅ(scientific claims)๊ณผ ์—ฐ๊ตฌ ์ œ์•ˆ(investigation proposals)์„ ๋Œ€๊ทœ๋ชจ๋กœ ์ถ”์ถœํ•œ ๋ฐ์ดํ„ฐ์…‹ NSF-SCIFY๋ฅผ ์ œ์‹œํ•œ๋‹ค. 1970๋…„๋ถ€ํ„ฐ 2024๋…„๊นŒ์ง€ 50๋…„๊ฐ„ 400K๊ฐœ ์ด์ƒ์˜ ์ง€์›๊ธˆ ์ดˆ๋ก์—์„œ ์ถ”์ • 280๋งŒ ๊ฐœ์˜ ๊ณผํ•™์  ์ฃผ์žฅ์„ ์ถ”์ถœํ•˜์—ฌ ํ˜„์žฌ๊นŒ์ง€ ๊ฐ€์žฅ ํฐ ๊ทœ๋ชจ์˜ ๊ณผํ•™์  ์ฃผ์žฅ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ–ˆ๋‹ค.

Motivation

Achievement

Figure 3

๊ธฐ์ˆ  ์ดˆ๋ก๊ณผ ๋น„๊ธฐ์ˆ  ์ดˆ๋ก์˜ t-SNE ์ž„๋ฒ ๋”ฉ ๋น„๊ต: STEL ์Šคํƒ€์ผ ์ž„๋ฒ ๋”ฉ์œผ๋กœ ๋ช…ํ™•ํ•œ ๋ถ„๋ฆฌ ๊ด€์ฐฐ

  1. ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•: NSF-SCIFY-MATSCI์—์„œ ์žฌ๋ฃŒ๊ณผํ•™ ๋ถ„์•ผ 16K๊ฐœ ์ดˆ๋ก์œผ๋กœ๋ถ€ํ„ฐ 114K๊ฐœ ๊ณผํ•™์  ์ฃผ์žฅ๊ณผ 145K๊ฐœ ์—ฐ๊ตฌ ์ œ์•ˆ ์ถ”์ถœ (๊ธฐ์กด ์ตœ๋Œ€ ๋ฐ์ดํ„ฐ์…‹ ๋Œ€๋น„ 10๋ฐฐ ์ด์ƒ ๊ทœ๋ชจ)
  2. ๋†’์€ ์ž๋™ ์ถ”์ถœ ์„ฑ๋Šฅ: ๋ฏธ์„ธ์กฐ์ •๋œ ๋ชจ๋ธ์ด ๊ธฐ๋ณธ ๋ชจ๋ธ ๋Œ€๋น„ 100% ์ƒ๋Œ€ ๊ฐœ์„ ์œจ ๋‹ฌ์„ฑ, ์กฐ์‚ฌ ์ œ์•ˆ ์ถ”์ถœ์—์„œ 90% ์ด์ƒ ๊ฐœ์„  ๋‹ฌ์„ฑ
  3. ๊ธฐ์ˆ -๋น„๊ธฐ์ˆ  ์ดˆ๋ก ์ƒ์„ฑ: BERTScore 0.85+ F1 ๋‹ฌ์„ฑ, ๊ธฐ์ˆ  ์ดˆ๋ก๊ณผ ๋น„๊ธฐ์ˆ  ์ดˆ๋ก์˜ ๋Œ€์นญ BLEU ์œ ์‚ฌ๋„ 1.5%๋กœ ์‹ค์งˆ์  ์žฌ์ž‘์„ฑ ํ™•์ธ
  4. LLM ๊ธฐ๋ฐ˜ ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ ๊ฐœ๋ฐœ: ํด๋ ˆ์ž„/์ œ์•ˆ ์ถ”์ถœ ํ’ˆ์งˆ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ์ƒˆ๋กœ์šด ํ‰๊ฐ€ ์ง€ํ‘œ ์ œ์‹œ
  5. ๊ณต๊ฐœ ์ œ๊ณต: ๋ชจ๋“  ๋ฐ์ดํ„ฐ์…‹, ํ•™์Šต๋œ ๋ชจ๋ธ, ํ‰๊ฐ€ ์ฝ”๋“œ๋ฅผ ๊ณต๊ฐœ ๋ฐฐํฌ

How

Originality

Limitation & Further Study

Evaluation

์ดํ‰: NSF-SCIFY๋Š” ์ง€์›๊ธˆ ์ œ์•ˆ์„œ๋ผ๋Š” ์ƒˆ๋กœ์šด ์ถœ์ฒ˜๋กœ๋ถ€ํ„ฐ ๊ทœ๋ชจ ๋ฉด์—์„œ ํš๊ธฐ์ ์ธ ๊ณผํ•™์  ์ฃผ์žฅ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ–ˆ์œผ๋ฉฐ, ์ฃผ์žฅ๊ณผ ์—ฐ๊ตฌ ์ œ์•ˆ์˜ ๊ตฌ๋ถ„ ์ถ”์ถœ์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ๊ณผ์ œ๋ฅผ ์ •์˜ํ•จ์œผ๋กœ์จ ๊ณผํ•™ ๊ฒ€์ฆ ๋ฐ ๋ฉ”ํƒ€๊ณผํ•™ ์—ฐ๊ตฌ์— ์ค‘์š”ํ•œ ์ž์‚ฐ์„ ์ œ๊ณตํ•œ๋‹ค. ๋‹ค๋งŒ LLM ๊ธฐ๋ฐ˜ ์ถ”์ถœ๊ณผ ํ‰๊ฐ€์˜ ์‹ ๋ขฐ์„ฑ ๊ฒ€์ฆ์ด ๋”์šฑ ๊ฐ•ํ™”๋  ํ•„์š”๊ฐ€ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
CLAIMVER๋Š” ๊ณผํ•™์  ์ฃผ์žฅ ๊ฒ€์ฆ์„ ์œ„ํ•œ ํ•ด์„๊ฐ€๋Šฅํ•œ ๊ทผ๊ฑฐ-์ถ”๋ก  ์ฒด๊ณ„๋กœ NSF-SCIFY์˜ ๋ฐ์ดํ„ฐ์„ธํŠธ ํ™œ์šฉ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ResearchBench์˜ ์˜๊ฐ/๊ฐ€์„ค ๋ฒค์น˜๋งˆํ‚น ์ž‘์—…์€ NSF-SCIFY์˜ ๊ฑฐ๋Œ€ ๊ณผํ•™์  ์ฃผ์žฅ ๋ฐ์ดํ„ฐ์…‹์„ ๊ธฐ๋ฐ˜ ์†Œ์Šค๋กœ ํ™œ์šฉํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
579 ๋…ผ๋ฌธ์€ ๊ณผํ•™์  ์ฃผ์žฅ ์ƒ์„ฑ ๋ฐ ๊ฒ€์ฆ์„ ์œ„ํ•œ ๋ฐ์ดํ„ฐ๋งˆ์ด๋‹ ๋ฐฉ์‹์„ ์ œ์‹œํ•ด 719์˜ LLM ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ์˜ ๊ธฐ์ดˆ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
235(Comparing knowledge sources...)์€ ๋‹ค์–‘ํ•œ ์ถœ์ฒ˜ ๊ธฐ๋ฐ˜์˜ ๊ณผํ•™์  ์ฃผ์žฅ/ํด๋ ˆ์ž„ ๊ฒ€์ฆ ์ ‘๊ทผ๋ฒ•์„ ์‹คํ—˜์ ์œผ๋กœ ๋น„๊ตํ•˜์—ฌ, 579์˜ NSF-SCIFY๊ฐ€ ์ถ”์ถœํ•œ ์ฃผ์žฅ ๋ฐ์ดํ„ฐ์˜ ํ™œ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ํ•จ๊ป˜ ์กฐ๋งํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋…ผ๋ฌธ ๊ด€๋ จ ์—…๋ฌด ์ž๋™ ์š”์•ฝ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•๊ณผ ๊ฐ™์ด, LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ์ฃผ์žฅยทํ…์ŠคํŠธ ๊ตฌ์กฐํ™” ๋ฐ ๋ฐ์ดํ„ฐ์…‹ ํ™•์žฅ ๋ฐฉ์‹์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
SciClaims๋Š” ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ๋„๋ฉ”์ธ์—์„œ ์ž๋™์ ์œผ๋กœ ๊ณผํ•™์  ์ฃผ์žฅ ์ถ”์ถœ ๋ฐ ๊ฒ€์ฆ ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•˜์—ฌ, NSF-SCIFY์˜ ๋ฐฉ์‹๊ณผ ๋น„๊ต๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
NSF-SCIFY์˜ ๋Œ€๊ทœ๋ชจ ๊ณผํ•™ ์ฃผ์žฅ ๋ฐ์ดํ„ฐ์…‹๊ณผ ๋‹ฌ๋ฆฌ, SciClaimHunt๋Š” ์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ๊ฒ€์ฆ์— ์ดˆ์ ์„ ๋งž์ถ”๋ฉฐ ๋ฐ์ดํ„ฐ ์„ฑ๊ฒฉ ๋ฐ ํ™œ์šฉ ๋ฐฉํ–ฅ์ด ์ƒ์ดํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ์ฃผ์žฅ ๊ฒ€์ฆ์—์„œ ๋Œ€๊ทœ๋ชจ ์ฃผ์žฅ ๋ฐ์ดํ„ฐ์…‹์„ ํ™œ์šฉํ•จ์œผ๋กœ์จ, ํ—ˆ์œ„์ •๋ณด ํƒ์ง€์˜ ์ž๋ฃŒ ํ™•์žฅ ์‚ฌ๋ก€๋กœ ์ฐธ๊ณ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
579 ๋…ผ๋ฌธ์€ ๋ฏธ๊ตญ NSF ๋ฐ์ดํ„ฐ์—์„œ ๊ณผํ•™์  ์ธ์šฉ ๋„คํŠธ์›Œํฌ๋ฅผ ์ถ”์ถœ ๋ฐ ๋ถ„์„ํ•˜๋ฉฐ, 150์˜ ์ธ์šฉ ์ถ”์ฒœ ๋ฒค์น˜๋งˆํฌ ํ™œ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ๋ฐ์ดํ„ฐ ์Šค์ผ€์ผ์—์„œ ํ™•์žฅํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
NSF ์ œ์•ˆ์„œ๋ฅผ ๋Œ€์ƒ์œผ๋กœ ๋Œ€๊ทœ๋ชจ ๊ณผํ•™์  ์ฃผ์žฅ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ•˜๋ฉฐ ํ—ˆ์œ„์ •๋ณด ๋ถ„์„์˜ ์‹ค์ œ ์‚ฌ๋ก€๋กœ ์ฐธ๊ณ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
NSF-SCIFY ๋ฐ์ดํ„ฐ์…‹์— ๋‚ดํฌ๋œ ๊ณผํ•™์  ์ฃผ์žฅ ๊ฒ€์ฆ ๋ฌธ์ œ๋ฅผ LLM ๊ธฐ๋ฐ˜ ์‚ฌ์‹ค ๊ฒ€์ฆ ์‹œ์Šคํ…œ์— ์‹ค์ œ๋กœ ์ ์šฉํ•˜๋Š” ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •