From large language models to multimodal AI: A scoping review on the potential of generative AI in medicine

์ €์ž: Lukas Buess, Matthias Keicher, Nassir Navab, Andreas Maier, Soroosh Tayebi Arasteh | ๋‚ ์งœ: 2025 | DOI: arXiv:2502.09242 📄 PDF


Essence

Figure 1

์˜๋ฃŒ ๋ถ„์•ผ์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI ํŒŒ์ดํ”„๋ผ์ธ: (A) ๋‹ค์–‘ํ•œ ์˜๋ฃŒ ๋ฐ์ดํ„ฐ ์–‘์‹ ์ˆ˜์ง‘ ๋ฐ ์ฒ˜๋ฆฌ, (B) AI ๋ชจ๋ธ์— ์˜ํ•œ ํ†ตํ•ฉ ํ‘œํ˜„ ๋ณ€ํ™˜, (C) ๋ฆฌํฌํŠธ ์ƒ์„ฑ, ๋Œ€ํ™” ์ง€์›, ์น˜๋ฃŒ ๊ณ„ํš ๋“ฑ์˜ ์ธ์‚ฌ์ดํŠธ ์ƒ์„ฑ, (D) ํ”ผ๋“œ๋ฐฑ์„ ํ†ตํ•œ ๋ฐ˜๋ณต์  ์ตœ์ ํ™”

๋ณธ ๋…ผ๋ฌธ์€ ์˜๋ฃŒ ๋ถ„์•ผ์—์„œ ์ƒ์„ฑํ˜• AI์˜ ์ง„ํ™”๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ๊ฒ€ํ† ํ•œ ์Šค์ฝ”ํ•‘ ๋ฆฌ๋ทฐ๋กœ, ํ…์ŠคํŠธ ๊ธฐ๋ฐ˜ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์—์„œ ์˜๋ฃŒ ์˜์ƒ, ์ž„์ƒ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ฉํ•˜๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI ์‹œ์Šคํ…œ์œผ๋กœ์˜ ์ „ํ™˜์„ ์ถ”์ ํ•˜๋ฉฐ, PRISMA-ScR ๊ฐ€์ด๋“œ๋ผ์ธ์„ ๋”ฐ๋ผ 2020-2024๋…„ ๋ฐœํ‘œ๋œ 144๊ฐœ ๋…ผ๋ฌธ์„ ๋ถ„์„ํ–ˆ๋‹ค.

Motivation

Achievement

Figure 2

PRISMA ํ”Œ๋กœ์šฐ ๋‹ค์ด์–ด๊ทธ๋žจ: ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค 4,384๊ฐœ ๋ ˆ์ฝ”๋“œ์—์„œ 60๊ฐœ, ์ˆ˜๋™ ๊ฒ€์ƒ‰ 83๊ฐœ๋ฅผ ํฌํ•จํ•˜์—ฌ ์ด 144๊ฐœ ๋…ผ๋ฌธ ์„ ์ •

  1. ํ…์ŠคํŠธ ๊ธฐ๋ฐ˜ LLM์˜ ์˜๋ฃŒ ์‘์šฉ ์ฒด๊ณ„ํ™”: BioBERT, BioMistral ๋“ฑ ์˜๋ฃŒ ํŠนํ™” ๋ชจ๋ธ๋“ค์ด supervised finetuning(SFT), prompt engineering, RLHF(๊ฐ•ํ™”ํ•™์Šต) ๋“ฑ ๋‹ค์–‘ํ•œ ๊ธฐ๋ฒ•์œผ๋กœ ์ž„์ƒ ๋ฌธ์„œํ™”, ์˜๋ฃŒ ๋ฌธํ—Œ ์š”์•ฝ, ์ง„๋‹จ ์ง€์›์— ํ™œ์šฉ๋˜๊ณ  ์žˆ์Œ์„ ๋ถ„๋ฅ˜
  2. ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI๋กœ์˜ ํŒจ๋Ÿฌ๋‹ค์ž„ ์ „ํ™˜ ํ™•์ธ: ๋‹จ์ˆœ ํ…์ŠคํŠธ ์ฒ˜๋ฆฌ์—์„œ ์˜๋ฃŒ ์˜์ƒ, ์ž„์ƒ ๋…ธํŠธ, ๊ตฌ์กฐํ™”๋œ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹จ์ผ ๋ชจ๋ธ ๋‚ด ํ†ตํ•ฉํ•˜๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(MLLM)๋กœ์˜ ์ „ํ™˜์ด ์ง„๋‹จ ์ง€์›, ์˜๋ฃŒ ๋ฆฌํฌํŠธ ์ƒ์„ฑ, ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ, ๋Œ€ํ™”ํ˜• AI ํ˜์‹ ์„ ์ฃผ๋„
  3. ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก ์˜ gap ๊ทœ๋ช…: ์–ดํœ˜ ๊ธฐ๋ฐ˜ ์ง€ํ‘œ(BLEU, ROUGE), ์ž„์ƒ ํŠนํ™” ์ง€ํ‘œ, ๋ชจ๋ธ ์‹ ๋ขฐ์„ฑยท์ž„์ƒ ๊ด€๋ จ์„ฑยท์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ ํ‰๊ฐ€์˜ ๋ถˆ์ผ์น˜ ํ™•์ธ

How

Figure 4

์˜๋ฃŒ ๋ถ„์•ผ์˜ ์ƒ์„ฑํ˜• AI ํ‰๊ฐ€: ์–ดํœ˜ ๊ธฐ๋ฐ˜ ์ง€ํ‘œ(BLEU, ROUGE), ์ž„์ƒ ํŠนํ™” ์ง€ํ‘œ, ์ž๋™ ํ‰๊ฐ€ vs. ์ธ๊ฐ„ ํ‰๊ฐ€

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ์˜๋ฃŒ ๋ถ„์•ผ์˜ ์ƒ์„ฑํ˜• AI ์ง„ํ™”๋ฅผ ์ตœ์‹  ๋ฐœํ‘œ๊นŒ์ง€ ํฌํ•จํ•˜์—ฌ ์ฒด๊ณ„์ ์œผ๋กœ ์ •๋ฆฌํ•œ ํ•„์ˆ˜ ์ฐธ๊ณ  ๋ฆฌ๋ทฐ์ด๋ฉฐ, ํŠนํžˆ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ†ตํ•ฉ๊ณผ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก ์˜ gap์„ ๋ช…ํ™•ํžˆ ๊ทœ๋ช…ํ•จ์œผ๋กœ์จ ํ–ฅํ›„ ์—ฐ๊ตฌ์ž์™€ ๊ฐœ๋ฐœ์ž์—๊ฒŒ ์‹ค์งˆ์  ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋‹ค์ค‘ ๋ชจ๋‹ฌ ๋ฐ ํšจ์œจ์  ํฌ๊ธฐ์˜ LLM์— ๋Œ€ํ•œ ๊ธฐ์ˆ ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์ด ์—”์ง€๋‹ˆ์–ด๋ง ๋ฌธ์ œ ํ•ด๊ฒฐ์— ์ฃผ๋Š” ๊ตฌ์กฐ์  ์žฅ๋‹จ์ , ํ˜„์žฅ ์ ์šฉ ์ด์Šˆ๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ์ œ์‹œํ•จ.
๋‹ค๋ฅธ ์ ‘๊ทผ
From large language models to multimodal AI: A scoping review ๋…ผ๋ฌธ์€ PaperQA ์‹œ์Šคํ…œ์ด ์‹ค์ œ ๊ณผํ•™ ์—ฐ๊ตฌ ์ž„๋ฌด์— ์–ด๋–ป๊ฒŒ ์ ์šฉ๋˜๋Š”์ง€ ๊ณ ์ฐฐํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Gemini์˜ ๋ฐœ์ „๋œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ์˜๋ฃŒ์™€ ํƒ€ ๊ณผํ•™ ๋ถ„์•ผ์— ์ง์ ‘์ ์œผ๋กœ ์ ์šฉํ•œ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์˜๋ฃŒ ๋„๋ฉ”์ธ์—์„œ LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ์˜ ์‹ค์ œ ํ™œ์šฉ ํ•œ๊ณ„, ์„ฑ๊ณผ๋ฅผ ์‹œ์Šคํ…œ์ ์œผ๋กœ ๋น„๊ตํ•˜์—ฌ ํ˜„์žฅ ์ธ์‹ ์ฐจ์ด๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
359 ๋…ผ๋ฌธ๊ณผ 344 ๋ชจ๋‘ ๋ฐ”์ด์˜ค/์˜๋ฃŒ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI ์ง„ํ™”๋ฅผ ๋‹ค๋ฃจ์ง€๋งŒ, 344๋Š” ์ƒ๋ช…์ •๋ณดํ•™, 359๋Š” ์œตํ•ฉ AI ์ฒด๊ณ„ ์ „๋ฐ˜์„ ๊ด‘๋ฒ”์œ„ํ•˜๊ฒŒ ์กฐ๋งํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
359 ๋…ผ๋ฌธ์—์„œ ์ข…ํ•ฉํ•œ ์ƒ์„ฑAIยท๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI์˜ ์˜๋ฃŒ ํ˜„์žฅ ์ ์šฉ ์ง€ํ˜• ์†์—์„œ 529์˜ ์ž„์ƒ ํ˜‘์—… ๋ชจ๋ธ ์ ์šฉ ๊ฒฝํ—˜์ด ์‚ฌ๋ก€๋กœ ๊ธฐ๋Šฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์˜๋ฃŒ ๋ถ„์•ผ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์˜ ์‹ค์ œ ์‘์šฉ ์‚ฌ๋ก€์™€ ์œ„ํ—˜์„ฑ, ์„ฑ๋Šฅ์„ ์‹ฌ์ธต์ ์œผ๋กœ ๋ถ„์„ํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
529 ๋…ผ๋ฌธ์€ 359์—์„œ ๋…ผํ•œ ๋‹คํ•™์ œ ํ˜‘์—…ํ˜• ์ƒ์„ฑ AI์˜ ์˜๋ฃŒ ๋ถ„์•ผ ์‹ค์ œ ์ž„์ƒ ์ ์šฉ์„ ๊ตฌ์ฒด์ ์œผ๋กœ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ธ-์ปจํ…์ŠคํŠธ ํ•™์Šต ์—ฐ๊ตฌ๋Š” ์˜๋ฃŒ ์˜์ƒ, ์ž„์ƒ ํ…์ŠคํŠธ ๋“ฑ ๋‹ค์–‘ํ•œ ํ˜•ํƒœ์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ƒ์„ฑ์„ ๋ถ„์„ํ•œ 359 ๋…ผ๋ฌธ๊ณผ ์ง๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Psyche ๋…ผ๋ฌธ์€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI์˜ ์ž„์ƒ์šฉ ํ™˜์ž ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋“ฑ ์‹ค์งˆ์  ์˜๋ฃŒ ํ˜„์žฅ ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•˜์—ฌ ์˜๋ฃŒ ์ƒ์„ฑํ˜• AI ์ง„ํ™” ๋…ผ์˜์˜ ์‹ค์ œ์  ์—ฐ๊ฒฐ๊ณ ๋ฆฌ๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •