SciClaims: An end-to-end generative system for biomedical claim analysis

์ €์ž: Raรบl Ortega, Josรฉ Manuel Gรณmez-Pรฉrez | ๋‚ ์งœ: 2025 | DOI: ๋ฏธ์ œ๊ณต 📄 PDF


Essence

Figure 1: System Architecture

์‹œ์Šคํ…œ ์•„ํ‚คํ…์ฒ˜: Llama3 8B Instruct ๋ชจ๋ธ๊ณผ Elasticsearch ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰ ์—”์ง„์œผ๋กœ ๊ตฌ์„ฑ๋œ ์ƒ์˜ํ•™ ๋…ผ๋ฌธ ๋ถ„์„ ํŒŒ์ดํ”„๋ผ์ธ

SciClaims๋Š” ์ƒ์˜ํ•™ ํ…์ŠคํŠธ์—์„œ ๊ณผํ•™์  ์ฃผ์žฅ์„ ์ž๋™์œผ๋กœ ์ถ”์ถœํ•˜๊ณ , PubMed์—์„œ ๊ด€๋ จ ์ฆ๊ฑฐ๋ฅผ ๊ฒ€์ƒ‰ํ•œ ํ›„, ๋‹จ์ผ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์„ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒ€์ฆํ•˜๋Š” ํ†ตํ•ฉ ์‹œ์Šคํ…œ์ด๋‹ค. ์ฒด๊ณ„์  ๋ฌธํ—Œ๊ณ ์ฐฐ(Systematic Literature Review, SLR)๊ณผ ํŠนํ—ˆ ๊ฒ€์ฆ ๋“ฑ ๊ณ ์œ„ํ—˜๋„ ํ™œ์šฉ ์‚ฌ๋ก€๋ฅผ ์ง€์›ํ•œ๋‹ค.

Motivation

Achievement

Figure 2: SciClaims ๋ฐ๋ชจ ์ธํ„ฐํŽ˜์ด์Šค

์‚ฌ์šฉ์ž ์ธํ„ฐํŽ˜์ด์Šค: ์ž…๋ ฅ ํ…์ŠคํŠธ ๋ถ„์„ ์‹œ ์ถ”์ถœ๋œ ์ฃผ์žฅ, ๊ฒ€์ฆ ๊ฒฐ๊ณผ, ๊ด€๋ จ ์ฆ๊ฑฐ, ๊ทผ๊ฑฐ ์ œ์‹œ

  1. ํฌ๊ด„์  End-to-End ํŒŒ์ดํ”„๋ผ์ธ: ์ฃผ์žฅ ์ถ”์ถœ, ์ฆ๊ฑฐ ๊ฒ€์ƒ‰, ๊ฒ€์ฆ์„ ๋‹จ์ผ LLM์œผ๋กœ ํ†ตํ•ฉํ•˜์—ฌ ์ถ”๊ฐ€ ๋ฏธ์„ธ์กฐ์ •(fine-tuning) ์—†์ด ๊ตฌํ˜„. ๊ธฐ์กด ๋‹ค๋‹จ๊ณ„ ํŒŒ์ดํ”„๋ผ์ธ์˜ ์‹คํŒจ ๊ฐ€๋Šฅ์„ฑ์„ ์ œ๊ฑฐํ•˜๊ณ  ์ธํ„ฐํ”„๋ฆฌํ„ฐ๋นŒ๋ฆฌํ‹ฐ(interpretability) ํ–ฅ์ƒ.
  2. ์‹ค์ œ ๋ฐฐํฌ ์ตœ์ ํ™”: 24GB VRAM GPU ํ•˜๋‚˜์—์„œ ํšจ์œจ์ ์œผ๋กœ ๋™์ž‘ํ•˜๋ฉฐ, ์ตœ๋Œ€ 10,000์ž ๊ธธ์ด์˜ ๋ฌธ์„œ ์ฒ˜๋ฆฌ ๊ฐ€๋Šฅ. vLLM์„ ํ™œ์šฉํ•œ ๊ณ ์ฒ˜๋ฆฌ๋Ÿ‰ ์ถ”๋ก ์œผ๋กœ ์‹ค์‹œ๊ฐ„ ์„ฑ๋Šฅ ๊ตฌํ˜„.
  3. ํ’ˆ์งˆ ๋†’์€ ์ฆ๊ฑฐ ์ฝ”ํผ์Šค: Semantic Scholar์˜ Highly Influential Citations ๋ฉ”ํŠธ๋ฆญ์œผ๋กœ ํ๋ ˆ์ด์…˜๋œ 4.7๋ฐฑ๋งŒ ๊ฐœ PubMed ์ดˆ๋ก(2000-2022) ํ™œ์šฉ. ๊ฐ ๋ฌธ์„œ๋Š” ์ตœ์†Œ 3๊ฐœ์˜ ๊ณ ๋„๋กœ ์ธ์šฉ๋œ ๋…ผ๋ฌธ์œผ๋กœ ์ง€์ง€๋ฐ›์Œ.
  4. ์‚ฌ์šฉ์ž ์นœํ™”์  ์ธํ„ฐํŽ˜์ด์Šค: 30๊ฐœ ์ด์ƒ์˜ ์‚ฌ์ „ ์„ค์ • ์˜ˆ์ œ(์ƒ์˜ํ•™ ๋…ผ๋ฌธ, COVID ๊ด€๋ จ ๋‰ด์Šค, SNS, ํŠนํ—ˆ) ์ œ๊ณต. ๋ชจ์ˆœ๋œ ์ฆ๊ฑฐ์— ๋Œ€ํ•ด ๋ชจ๋“  ๊ด€๋ จ ์Œ์„ ๋ฐ˜ํ™˜ํ•˜์—ฌ ์‚ฌ์šฉ์ž๊ฐ€ ์ •ํ™•๋„๋ฅผ ํŒ๋‹จ ๊ฐ€๋Šฅ. ์‹ ๋ขฐ์„ฑ ์ ์ˆ˜(confidence score)์™€ ๊ทผ๊ฑฐ(rationale) ์ œ์‹œ.

How

Figure 1 ์žฌ์ฐธ์กฐ: ์‹œ์Šคํ…œ ์•„ํ‚คํ…์ฒ˜ ์ƒ์„ธ ๊ตฌ์กฐ

Originality

Limitation & Further Study

ํ›„์† ์—ฐ๊ตฌ ๋ฐฉํ–ฅ:

Evaluation

์ดํ‰: SciClaims๋Š” ๊ณผํ•™์  ์ฃผ์žฅ ๊ฒ€์ฆ์˜ ์™„์ „ํ•œ ํŒŒ์ดํ”„๋ผ์ธ์„ ๋‹จ์ผ LLM์œผ๋กœ ํ†ตํ•ฉํ•˜์—ฌ ์‹ค์ œ ๋ฐฐํฌ ๊ฐ€๋Šฅํ•˜๋„๋ก ์ตœ์ ํ™”ํ•œ ์šฐ์ˆ˜ํ•œ ์‹œ์Šคํ…œ ๋ฐ๋ชจ์ด๋‹ค. ์ƒ์˜ํ•™ ๋ถ„์•ผ์˜ ์ฒด๊ณ„์  ๋ฌธํ—Œ๊ณ ์ฐฐ ๊ฐ™์€ ๊ณ ์œ„ํ—˜๋„ ํ™œ์šฉ์— ์ง์ ‘์  ๊ฐ€์น˜๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, ๊ณต๊ฐœ ์ฝ”๋“œ์™€ ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ํ†ตํ•ด ์žฌํ˜„์„ฑ๊ณผ ํ™•์žฅ์„ฑ์„ ๋‹ด๋ณดํ•œ๋‹ค. ๋‹ค๋งŒ ํ‰๊ฐ€ ๋ฒ”์œ„ ํ™•๋Œ€์™€ ๋„๋ฉ”์ธ ์™ธ ์ ์šฉ์„ฑ ๊ฒ€์ฆ์œผ๋กœ ๋”์šฑ ๊ฐ•ํ™”๋  ์ˆ˜ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
567 ๋…ผ๋ฌธ์€ ์•ฝํ•œ ๊ฐ๋… ๊ธฐ๋ฐ˜ LLM ๊ณผํ•™ ์ฃผ์žฅ ๊ฒ€์ฆ์˜ ๋ฐฉ๋ฒ•๋ก ์„ ๋‹ค๋ฃจ์–ด 711์˜ ์ฃผ์žฅ ๊ฒ€์ฆ ์‹œ์Šคํ…œ์— ์‹ฌํ™”๋œ ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ณต์žกํ•œ ์ƒ์˜ํ•™์  ์ฃผ์žฅ ์ž๋™ ํŒฉํŠธ์ฒดํ‚น๊ณผ ํ”„๋กœ๊ทธ๋žจ ๊ธฐ๋ฐ˜ ์ถ”๋ก ์— ๋Œ€ํ•œ ์ด๋ก ์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419๋Š” LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ชจ๋ธ์˜ ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•˜์—ฌ, 711์˜ SLR/์ฃผ์žฅ ๊ฒ€์ฆ ์‹œ์Šคํ…œ์— ์ด๋ก ์  ๋ฐ”ํƒ•์„ ์ค€๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Sciclaimhunt๋Š” ์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์ฃผ์žฅ ๊ฒ€์ฆ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ๊ณตํ•˜๋ฏ€๋กœ SciClaims ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ์˜ ๋ฆฌ์†Œ์Šค๊ฐ€ ๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
327 ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ํ˜‘์—… ์—์ด์ „ํŠธ์˜ ์‚ฌํšŒ์  ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ๋ถ„์„ํ•˜์—ฌ, 711์˜ ์‹ค์งˆ์  ์—์ด์ „ํŠธ ํ˜‘๋ฒฝ ์„ค๊ณ„์— ๋Œ€์•ˆ์  ์˜๊ฐ์„ ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
492๋Š” ๋ฌธํ—Œ๊ณผ ๋ฐ์ดํ„ฐ์˜ ํ†ตํ•ฉ์  ๊ฐ€์„ค ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์„ ์ œ์‹œํ•˜์—ฌ, 711์ด ๋‹ค๋ฃจ๋Š” ๊ณผํ•™์  ์ฃผ์žฅ ์ถ”์ถœ ๋ฐ ๋ฌธํ—Œ ๊ฒ€์ฆ๊ณผ ์ ‘๊ทผ๋ฒ•์ด ๋งž๋‹ฟ์•„ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์˜คํ”ˆ๋„๋ฉ”์ธ ๊ณผํ•™์  ๊ฐ€์„ค ๊ฒ€์ฆ ๋ฐ LLM ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ๊ฒ€์ฆ ๋ฐฉ๋ฒ•๋ก ์— ๋Œ€ํ•œ ๋Œ€์•ˆ์  ์ ‘๊ทผ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜์˜ ํ—ˆ์œ„ ์ •๋ณด ํƒ์ง€ ์‹œ์Šคํ…œ์„ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ์˜์—ญ์˜ ๊ณผํ•™์  ํด๋ ˆ์ž„ ์ƒ์„ฑ ๋ฐ ํŒฉํŠธ ๊ฒ€์ฆ ์ƒ์„ฑํ˜• ๋ชจ๋ธ๋กœ, KG ๊ฒ€์ฆ ์™ธ end-to-end ๋ฐฉ์‹ ์ ‘๊ทผ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
763 ๋…ผ๋ฌธ์€ ์ƒ์˜ํ•™ ๋…ผ๋ฌธ ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์„ ๋ชฉํ‘œ๋กœ ํ•˜๋ฉฐ, ์ฃผ์žฅ ๊ฒ€์ฆ๊ณผ ๊ฐ€์„ค ์ƒ์„ฑ ๋ชจ๋‘์—์„œ LLM์˜ ์‘์šฉ์„ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
SciClaims๋Š” ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ๋„๋ฉ”์ธ์—์„œ ์ž๋™์ ์œผ๋กœ ๊ณผํ•™์  ์ฃผ์žฅ ์ถ”์ถœ ๋ฐ ๊ฒ€์ฆ ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•˜์—ฌ, NSF-SCIFY์˜ ๋ฐฉ์‹๊ณผ ๋น„๊ต๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
SciClaims ๋…ผ๋ฌธ์€ ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ๊ณผํ•™์—์„œ ์ƒ์„ฑ์  ๋ฐฉ์‹์œผ๋กœ ์ฃผ์žฅ ๋ฐ ์ฆ๊ฑฐ ์ฒด๊ณ„ ๊ตฌ์ถ•์— ์ดˆ์ ์„ ๋งž์ถ”๋ฉฐ, SciClaimHunt ๋ฐ์ดํ„ฐ์…‹์˜ ์ฆ๊ฑฐ ๊ทผ๊ฑฐ ๊ตฌ์กฐ์™€ ๋น„๊ตํ•ด๋ณผ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
711 ๋…ผ๋ฌธ์€ ์ƒ์˜ํ•™ ํด๋ ˆ์ž„์— ๋Œ€ํ•œ ์ƒ์„ฑ์  ๊ฒ€์ฆ ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•˜์—ฌ, 057์˜ ๋ฐ˜์ž๋™ ๋ฐฉ์‹์„ ์ƒ์˜ํ•™ ๋“ฑ ํŠน์ • ๋„๋ฉ”์ธ์— ํ™•์žฅํ•œ ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
711 'SciClaims' ๋…ผ๋ฌธ์€ ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ๋ถ„์•ผ์—์„œ LLM ๊ธฐ๋ฐ˜ ์ฃผ์žฅ-์ฆ๊ฑฐ ์ž๋™ ์ถ”์ถœ ์‹œ์Šคํ…œ์„ ๊ฐœ๋ฐœํ•˜์—ฌ, 018์˜ retrieval-augmented knowledge mining๊ณผ ์‹ค์ œ ์ ์šฉ ๊ฐ€๋Šฅํ•œ ๋ฐ์ดํ„ฐ์…‹/์‘์šฉ ๊ตฌ์กฐ๋ฅผ ์ƒํ˜ธ ๋ณด์™„์ ์œผ๋กœ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
168์˜ ๋ฒ”์šฉ ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ AI ์—์ด์ „ํŠธ๋Š” SciClaims์ฒ˜๋Ÿผ ์ฃผ์žฅ ๋ถ„์„ ๋ฐ ์ฆ๊ฑฐ ๊ฒ€์ƒ‰ ๊ธฐ๋Šฅ์„ ์‹ค์ œ ์ž„์ƒ ๋“ฑ ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ์— ์ ์šฉํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
SCI-IDEA๋Š” ๊ณผํ•™์  ์•„์ด๋””์–ด๋ฅผ ๋…ผ๋ฌธ ๊ธฐ๋ฐ˜ LLM์œผ๋กœ ์ƒ์„ฑํ•˜๋Š” ์‹ค์ œ ์‚ฌ๋ก€๋กœ, ์ฆ๊ฑฐ ๊ฒ€์ฆ๊ณผ ๊ฒฐํ•ฉ์‹œ ํ™œ์šฉ๋ฐฉ์•ˆ์„ ์‹œ์‚ฌํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •