Clinical entity augmented retrieval for clinical information extraction

์ €์ž: Ivรกn Lรณpez, Akshay Swaminathan, Karthik S. Vedula, Sanjana Narayanan, F. Nateghi Haredasht | ๋‚ ์งœ: 2025 | DOI: 10.1038/s41746-024-01377-1 📄 PDF


Essence

์ž„์ƒ ๋…ธํŠธ์—์„œ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•  ๋•Œ ์ž„์ƒ ์—”ํ‹ฐํ‹ฐ(clinical entities)๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ด€๋ จ ์ •๋ณด๋งŒ ํšจ์œจ์ ์œผ๋กœ ๊ฒ€์ƒ‰ํ•˜์—ฌ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์— ์ œ๊ณตํ•˜๋Š” CLEAR ํŒŒ์ดํ”„๋ผ์ธ์„ ์ œ์•ˆํ•˜๋ฉฐ, ๊ธฐ์กด embedding ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰ ๋Œ€๋น„ 70% ์ด์ƒ์˜ ํ† ํฐ ์‚ฌ์šฉ๋Ÿ‰ ๊ฐ์†Œ์™€ ์ถ”๋ก  ์‹œ๊ฐ„ ๋‹จ์ถ•์„ ๋‹ฌ์„ฑํ•˜๋ฉด์„œ๋„ ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ–ˆ๋‹ค.

Motivation

Achievement

Figure 3

CLEAR ํŒŒ์ดํ”„๋ผ์ธ์˜ ๊ฐœ์š”: (1) ์ž„์ƒ ๋…ธํŠธ์™€ (2) ์ฟผ๋ฆฌ๋ฅผ ์ž…๋ ฅ๋ฐ›์•„ ์—”ํ‹ฐํ‹ฐ ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰์„ ์ˆ˜ํ–‰

  1. ์„ฑ๋Šฅ ์šฐ์ˆ˜์„ฑ: Stanford MOUD ๋ฐ์ดํ„ฐ์…‹์—์„œ CLEAR์˜ ํ‰๊ท  F1 ์ ์ˆ˜๋Š” 0.90์œผ๋กœ, embedding RAG(0.86)๊ณผ full-note(0.79) ์ ‘๊ทผ๋ฒ•์„ ๋Šฅ๊ฐ€ํ•จ. 6๊ฐœ LLM ๋ชจ๋‘์—์„œ CLEAR์ด ์ตœ๊ณ  ๋˜๋Š” ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ์„ฑ๋Šฅ ๋‹ฌ์„ฑ.
  2. ํšจ์œจ์„ฑ ๊ทน๋Œ€ํ™”:
    • ์ถ”๋ก  ์‹œ๊ฐ„: CLEAR 4.95์ดˆ vs. embedding RAG 17.41์ดˆ vs. full-note 20.08์ดˆ (๊ฐ ๋…ธํŠธ๋‹น)
    • ๋ชจ๋ธ ์ฟผ๋ฆฌ ํšŸ์ˆ˜: CLEAR 1.68ํšŒ vs. embedding RAG 4.94ํšŒ vs. full-note 4.18ํšŒ
    • ํ‰๊ท  ์ž…๋ ฅ ํ† ํฐ: CLEAR 1.1k vs. embedding RAG 3.8k vs. full-note 6.1k
    • ์ „์ฒด์ ์œผ๋กœ 70% ์ด์ƒ์˜ ํ† ํฐ ์‚ฌ์šฉ๋Ÿ‰ ๋ฐ ์ถ”๋ก  ์‹œ๊ฐ„ ๊ฐ์†Œ
  3. ๋‹ค์–‘ํ•œ ์ž„์ƒ ๋ณ€์ˆ˜ ๊ฒ€์ฆ: ๋ฌผ์งˆ ์‚ฌ์šฉ(alcohol dependence, tobacco dependence), ์ •์‹ ๊ฑด๊ฐ•(ADHD, bipolar disorder, depression), ์‚ฌํšŒ์  ๊ฒฐ์ •์š”์ธ(homelessness, unemployment), ํ‰๋ถ€ X-ray ์†Œ๊ฒฌ(pneumonia, cardiomegaly) ๋“ฑ 18๊ฐœ ์ž„์ƒ ๋ณ€์ˆ˜์—์„œ ํ‰๊ฐ€.
  4. BERT ๋ชจ๋ธ ๋ฏธ์„ธ์กฐ์ • ๊ฐ€๋Šฅ์„ฑ: CLEAR๋กœ ์ƒ์„ฑํ•œ ๋ผ๋ฒจ๋กœ Bio+Clinical BERT ๋ชจ๋ธ์„ ๋ฏธ์„ธ์กฐ์ •ํ–ˆ์„ ๋•Œ, ์•Œ์ฝ”์˜ฌ ์˜์กด์„ฑ๊ณผ ๋งŒ์„ฑ ํ†ต์ฆ์—์„œ LLM trainer ๋ชจ๋ธ์˜ F1 ์ ์ˆ˜๋ฅผ ์ดˆ๊ณผํ•˜๋Š” ์„ฑ๋Šฅ ๋‹ฌ์„ฑ.

How

Figure 1

Stanford MOUD ๋ฐ์ดํ„ฐ์…‹์—์„œ NER ์ œ๊ฑฐ ์‹œ CLEAR ์ •๋ณด ๊ฒ€์ƒ‰์˜ F1 ์ ์ˆ˜ ๋ณ€ํ™”: ์ผ๋ถ€ ๋ณ€์ˆ˜๋Š” ์ž‘์€ ๊ฐ์†Œ, ์ผ๋ถ€๋Š” ํฐ ๊ฐ์†Œ๋ฅผ ๋ณด์ž„

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ์ด ๋…ผ๋ฌธ์€ ์ž„์ƒ ์ •๋ณด ์ถ”์ถœ์—์„œ embedding ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰์˜ ๋น„ํšจ์œจ์„ฑ์„ ๋ช…ํ™•ํžˆ ์ธ์‹ํ•˜๊ณ  ์—”ํ‹ฐํ‹ฐ ๊ธฐ๋ฐ˜์˜ ์‹ค์งˆ์  ๋Œ€์•ˆ์„ ์ œ์‹œํ•˜๋Š” ์‹ค์šฉ์ ์ด๊ณ  ๊ฒ€์ฆ๋œ ์—ฐ๊ตฌ์ด๋‹ค. ๋Œ€๊ทœ๋ชจ ์ž„์ƒ ๋ฐ์ดํ„ฐ์…‹์—์„œ ์ผ๊ด€๋˜๊ฒŒ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ๊ณผ ํšจ์œจ์„ฑ์„ ์ž…์ฆํ–ˆ์œผ๋‚˜, ์˜จํ†จ๋กœ์ง€ ์˜์กด์„ฑ๊ณผ ๋„๋ฉ”์ธ ํŠนํ™”์„ฑ ์ธก๋ฉด์—์„œ๋Š” ์ถ”๊ฐ€ ๊ฐœ์„ ์˜ ์—ฌ์ง€๊ฐ€ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ž„์ƒ ๋ฐ ์ƒ์˜ํ•™ ์ •๋ณด ์ถ”์ถœ์—์„œ ํŠนํ™” ์‚ฌ์ „ํ•™์Šต ๋ชจ๋ธ(BioBERT)์˜ ํ•„์š”์„ฑ์„ ๋ณด์˜€๊ณ , CLEAR ํŒŒ์ดํ”„๋ผ์ธ์€ ์ด๋ฅผ ์‹ค์ œ ์ž„์ƒ ์—”ํ‹ฐํ‹ฐ ๊ฒ€์ƒ‰์— ์ ์šฉํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
707 SciBERT๋Š” 224์™€ ๊ฐ™์ด ๋„๋ฉ”์ธ ํŠนํ™” ์–ธ์–ด๋ชจ๋ธ์„ ํ™œ์šฉํ•œ ์ •๋ณด ์ถ”์ถœ ๋ฐ ๊ฒ€์ƒ‰ ํšจ์œจํ™” ์ ‘๊ทผ๋ฒ•์˜ ๋˜ ๋‹ค๋ฅธ ์˜ˆ์‹œ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ž„์ƒ์ •๋ณด ์ถ”์ถœ์„ ์œ„ํ•ด BioBERT์™€๋Š” ๋‹ฌ๋ฆฌ ์ž„์ƒ ์—”ํ‹ฐํ‹ฐ ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰ ๊ฐ•ํ™” ๋ฐฉ์‹์„ ์ œ์•ˆํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ž„์ƒ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•˜๊ณ  ์ž„์ƒ ๋…ธํŠธ์˜ ์˜๋ฏธ ์ดํ•ด์— ํŠนํ™”๋œ ClinicalGPT ์—ฐ๊ตฌ์™€ CLEAR ํŒŒ์ดํ”„๋ผ์ธ์˜ ์‹ค์ œ ์ ์šฉ ์‚ฌ๋ก€๊ฐ€ ๋Œ€์กฐ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
602๋ฒˆ์€ ๊ณผํ•™ ๋…ผ๋ฌธ ์งˆ์˜์‘๋‹ต ๋ฐ ์ •๋ณด ์ถ”์ถœ์— Retrieval-Augmented Generation์„ ์ ์šฉํ•˜๋ฉด์„œ, 224๋ฒˆ CLEAR ํŒŒ์ดํ”„๋ผ์ธ๊ณผ ์ ‘๋ชฉ ๊ฐ€๋Šฅ์„ฑ์ด ๋†’๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ์ž๊ธฐ ๋””๋ฒ„๊น… ๋ฐ ๊ฒ€์ฆ ์ „๋žต์„ ์ •๋ณด ์ถ”์ถœ ํŒŒ์ดํ”„๋ผ์ธ์— ์ ‘๋ชฉํ•จ์œผ๋กœ์จ ์„ฑ๋Šฅ ๋ฐ ์‹ ๋ขฐ๋„ ๋ฌธ์ œ ํ•ด์†Œ ๋ฐฉ์•ˆ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ž„์ƒ ๋ฐ ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ์ •๋ณด ์ถ”์ถœ์—์„œ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์งˆ์˜์‘๋‹ต์„ LLM์œผ๋กœ ๊ตฌํ˜„ํ•˜๋Š” ํ™•์žฅ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
MedBioLM์€ ๋Œ€๊ทœ๋ชจ ์ƒ์˜ํ•™ ์งˆ์˜์‘๋‹ต์—์„œ LLM์˜ ์„ฑ๋Šฅ์„ ์ตœ์ ํ™”ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ํƒ๊ตฌํ•˜๋ฉฐ, 224๋ฒˆ์˜ ์ž„์ƒ ์—”ํ‹ฐํ‹ฐ ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰๊ณผ ์ƒํ˜ธ๋ณด์™„๋ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Clinical entity augmented retrieval ์—ฐ๊ตฌ๋Š” SciBERT์˜ ๋„๋ฉ”์ธ ํŠนํ™” ์–ธ์–ด๋ชจ๋ธ์„ ์ž„์ƒ์ •๋ณด ์ถ”์ถœ์— ์‹ค์ œ ์ ์šฉํ•œ ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •