A retrieval-augmented knowledge mining method with deep thinking LLMs for biomedical research and clinical support

์ €์ž: Yichun Feng, Jiawei Wang, Ruikun He, Lu Zhou, Yixue Li | ๋‚ ์งœ: 2025 | DOI: 10.1093/gigascience/giaf109 📄 PDF


Essence

Figure 1

Figure 1: Overview of the proposed framework for biomedical knowledge mining. (A) Biomedical knowledge sources, such

์ƒ์˜ํ•™ ์—ฐ๊ตฌ๋ฅผ ์œ„ํ•ด Deep Thinking LLM๊ณผ Retrieval-Augmented Generation(RAG)์„ ํ†ตํ•ฉํ•œ ์ง€์‹ ์ฑ„๊ตด ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์•ˆํ•˜๋ฉฐ, BioStrataKG ์ง€์‹ ๊ทธ๋ž˜ํ”„์™€ BioCDQA ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ•˜๊ณ  IP-RAR ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ๋ฌธ์„œ ๊ฐ„ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚จ๋‹ค.

Motivation

Achievement

Figure 1

Figure 1: Overview of the proposed framework for biomedical knowledge mining. (A) Biomedical knowledge sources, such

How

Figure 3

Figure 3: Framework of IP-RAR. (A) Integrated Reasoning-based Retrieval: Performs pre-retrieval reasoning, extracting

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ์ƒ์˜ํ•™ ์ง€์‹ ์ฑ„๊ตด์„ ์œ„ํ•œ ํฌ๊ด„์ ์ด๊ณ  ์ฒด๊ณ„์ ์ธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•œ ์šฐ์ˆ˜ํ•œ ์—ฐ๊ตฌ์ด๋ฉฐ, LLM์˜ ๊นŠ์€ ์ถ”๋ก  ๋Šฅ๋ ฅ๊ณผ RAG ๊ธฐ๋ฒ•์˜ ํšจ๊ณผ์ ์ธ ํ†ตํ•ฉ์œผ๋กœ ๋ฌธ์„œ ๊ฐ„ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํš๊ธฐ์ ์œผ๋กœ ํ–ฅ์ƒ์‹œ์ผฐ๋‹ค. ์‹ค์ œ ์ž„์ƒ ์˜์‚ฌ๊ฒฐ์ •๊ณผ ์—ฐ๊ตฌ ์ „๋žต ์ˆ˜๋ฆฝ์„ ์ง€์›ํ•  ์ˆ˜ ์žˆ๋Š” ๋†’์€ ์‹ค์šฉ์„ฑ์„ ๊ฐ–์ถ”๊ณ  ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
018์˜ ์ƒ์˜ํ•™์ง€์‹๊ทธ๋ž˜ํ”„ ์งˆ์˜์‘๋‹ต/์ถ”๋ก  ํ”„๋ ˆ์ž„์›Œํฌ๋Š” 333์—์„œ ์ œ์‹œ๋œ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์ง€์‹ ๊ฒ€์ฆ๊ณผ ์›๋ฆฌ์ ์œผ๋กœ ๋งž๋‹ฟ์•„ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ(RAG) ๋ฐฉ๋ฒ•๋ก ์˜ ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
366์˜ ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ(RAG) ๋ฐฉ์‹์€ 018์—์„œ ์ œ์‹œํ•œ ์ƒ์˜ํ•™ ์ง€์‹ ๋งˆ์ด๋‹ ๋ฐ RAG ๊ธฐ๋ฐ˜ ์ถ”๋ก  ํ”„๋ ˆ์ž„์›Œํฌ์™€ ์ด๋ก ์ ์œผ๋กœ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์˜ํ•™ ๋ฌธํ—Œ์—์„œ ์ง€์‹ ์ถ”์ถœ ๋ฐ ๊ทธ๋ž˜ํ”„ ๊ตฌ์ถ•์„ ์œ„ํ•œ LLM ํ™œ์šฉ์„ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ƒ์˜ํ•™ ๋ถ„์•ผ์—์„œ RAG์™€ ์ง€์‹ ๊ทธ๋ž˜ํ”„๋ฅผ ๊ฒฐํ•ฉํ•œ ์ •๋ณด ๊ฒ€์ƒ‰ ๋ฐ ์ถ”๋ก ์„ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ƒ์˜ํ•™ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ตฌ์ถ• ๋ฐ ์ถ”๋ก ์„ ์œ„ํ•œ ๋”ฅ๋Ÿฌ๋‹ ์ ‘๊ทผ๋ฒ•์„ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
018์€ ๋”ฅ์”ฝํ‚น LLM๊ณผ RAG ํ™œ์šฉ ์ƒ์˜ํ•™ QA ์‹œ์Šคํ…œ์„, 701์€ ํ™”ํ•™ ๋ถ„์•ผ ๋Œ€๊ทœ๋ชจ QA ๋ฐ์ดํ„ฐ์™€ ์ƒˆ ๋ชจ๋ธ์„ ์ œ์‹œํ•ด ๋„๋ฉ”์ธ๊ณผ ๊ธฐ๋ฒ•์—์„œ ์ƒ์ดํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ƒ์˜ํ•™ ๋„๋ฉ”์ธ์—์„œ RAG ๋ฐ Knowledge Graph ๊ธฐ๋ฐ˜ LLM ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•ด, ๋ฏธ๋ฐœ๊ฒฌ ๊ฐ€์„ค ์ž๋™ํ™” ์ธก๋ฉด์—์„œ ํ™”ํ•™๋ถ„์•ผ์™€ ๋ฐฉ๋ฒ•์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
RAG๋ฅผ ํ™œ์šฉํ•œ ๊ณผํ•™ ๋ฌธํ—Œ ๊ธฐ๋ฐ˜ ์ง€์‹ ๋งˆ์ด๋‹ ๋ฐฉ๋ฒ•๋ก ์„ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
328 'Explainable biomedical claim verification with large language models'๋Š” ์ด๋ก ์  ์ง€์‹ ๊ทธ๋ž˜ํ”„ ์ ‘๊ทผ์— ์ง‘์ค‘ํ•œ 018๊ณผ ๋‹ฌ๋ฆฌ, LLM ๊ธฐ๋ฐ˜ ์„ค๋ช…๊ฐ€๋Šฅ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ๊ณผํ•™์  ์ฃผ์žฅ ๊ฒ€์ฆ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋ฏ€๋กœ ๋ฐฉ๋ฒ•๋ก  ๋น„๊ต์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋”ฅ ์”ฝํ‚น๊ณผ ๊ฒ€์ƒ‰ ๋Šฅ๋ ฅ์ด ๊ฒฐํ•ฉ๋œ ๋ณต์žกํ•œ ์ธ๊ณผ์ถ”๋ก  ๋ฌธ์ œ์— LLM์ด ์–ด๋–ป๊ฒŒ ์ ‘๊ทผํ•˜๋Š”์ง€ ๋Œ€์•ˆ์ ์œผ๋กœ ๋ณด์—ฌ์ค€๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ƒ์˜ํ•™ ์—ฐ๊ตฌ์— ํŠนํ™”๋œ ์ง€์‹๊ทธ๋ž˜ํ”„ ์—ฐ๊ณ„ LLM์„ ํ†ตํ•œ QA ๋ฐ ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐฉ๋ฒ•์€ PubMedQA์˜ ์‹ค์ œ ๋ฐ์ดํ„ฐ๋ฅผ ํ™•์žฅ์ ์œผ๋กœ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
018์ด ๋‹ค๋ฃฌ Retrieval-Augmented Generation์„ ํ†ตํ•œ ๋ฌธ์„œ๊ฐ„ ์ถ”๋ก ์€ 005์˜ long-context LLM์„ ํ™œ์šฉํ•œ ๊ณผํ•™ QA ์ตœ์‹  ์„ฑ๋Šฅ ๋ถ„์„๊ณผ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
711 'SciClaims' ๋…ผ๋ฌธ์€ ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ๋ถ„์•ผ์—์„œ LLM ๊ธฐ๋ฐ˜ ์ฃผ์žฅ-์ฆ๊ฑฐ ์ž๋™ ์ถ”์ถœ ์‹œ์Šคํ…œ์„ ๊ฐœ๋ฐœํ•˜์—ฌ, 018์˜ retrieval-augmented knowledge mining๊ณผ ์‹ค์ œ ์ ์šฉ ๊ฐ€๋Šฅํ•œ ๋ฐ์ดํ„ฐ์…‹/์‘์šฉ ๊ตฌ์กฐ๋ฅผ ์ƒํ˜ธ ๋ณด์™„์ ์œผ๋กœ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
018์˜ RAG ๋ฐ LLM ํ™œ์šฉ ๊ธฐ์ˆ ์€ 366์—์„œ ๊ณผํ•™ ๋…ผ๋ฌธ์˜ ๋ฏธ๋ž˜ ์„น์…˜ ์ž๋™์ƒ์„ฑ ๋“ฑ ์‘์šฉ ์‚ฌ๋ก€๋กœ ์—ฐ๊ฒฐ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •