Can gpt-4v (ision) serve medical applications? case studies on gpt-4v for multimodal medical diagnosis

์ €์ž: Chaoyi Wu, Jiayu Lei, Qiaoyu Zheng, Weike Zhao, Weixiong Lin, Xiaoman Zhang, Xiao Zhou, Ziheng Zhao, Ya Zhang, Yanfeng Wang, Weidi Xie | ๋‚ ์งœ: 2023 | DOI: arXiv:2310.09909 📄 PDF


Essence

Figure 1

์˜๋ฃŒ ์‹œ์Šคํ…œ 17๊ฐœ์™€ ์˜์ƒ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ 8๊ฐœ๋ฅผ ํฌ๊ด„ํ•˜๋Š” ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ

๋ณธ ๋…ผ๋ฌธ์€ OpenAI์˜ GPT-4V(ision) ๋ชจ๋ธ์ด ์˜๋ฃŒ ์˜์ƒ ์ง„๋‹จ ์ž‘์—…์—์„œ ์‹ค์ œ๋กœ ์ž„์ƒ ์ ์šฉ ๊ฐ€๋Šฅํ•œ์ง€๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ํ‰๊ฐ€ํ•œ ์—ฐ๊ตฌ์ด๋‹ค. 17๊ฐœ ์‹ ์ฒด ์‹œ์Šคํ…œ๊ณผ 8๊ฐœ ์˜์ƒ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ๋ฅผ ํฌํ•จํ•œ ๊ด‘๋ฒ”์œ„ํ•œ ์‚ฌ๋ก€ ์—ฐ๊ตฌ๋ฅผ ํ†ตํ•ด GPT-4V์˜ ์˜๋ฃŒ ์ง„๋‹จ ๋Šฅ๋ ฅ๊ณผ ํ•œ๊ณ„๋ฅผ ๋ช…ํ™•ํžˆ ๊ทœ๋ช…ํ–ˆ๋‹ค.

Motivation

Achievement

Figure 2

GPT-4V์˜ ๋‹จ์ผ ๋‡Œ MRI ์˜์ƒ ๋ถ„์„ ์‚ฌ๋ก€

  1. ์˜์ƒ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ ๋ฐ ํ•ด๋ถ€ํ•™์  ๊ตฌ์กฐ ์ธ์‹ ์šฐ์ˆ˜: GPT-4V๋Š” ์˜๋ฃŒ ์˜์ƒ์˜ ์ดฌ์˜ ๋ฐฉ์‹(X-ray, CT, MRI ๋“ฑ)๊ณผ ์‹ ์ฒด ๋ถ€์œ„๋ฅผ ์ •ํ™•ํ•˜๊ฒŒ ์‹๋ณ„ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด ๋ถ„์•ผ์—์„œ๋Š” ์ƒ๋Œ€์ ์œผ๋กœ ๋†’์€ ์„ฑ๋Šฅ์„ ๋ณด์ž„
  2. ์งˆ๋ณ‘ ์ง„๋‹จ์—์„œ ์‹ฌ๊ฐํ•œ ํ•œ๊ณ„: ์ •ํ™•ํ•œ ์งˆ๋ณ‘ ์ง„๋‹จ ๋Šฅ๋ ฅ์ด ํ˜„์ €ํžˆ ๋ถ€์กฑํ•˜๋ฉฐ, ํŠนํžˆ ๋“œ๋ฌธ ์งˆํ™˜์ด๋‚˜ ๋ณต์žกํ•œ ์ž„์ƒ ์†Œ๊ฒฌ์˜ ๊ฒฝ์šฐ ์˜ค์ง„ ๋˜๋Š” ๊ด€๋ จ ์—†๋Š” ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•จ
  3. ๋ณด๊ณ ์„œ ์ƒ์„ฑ ์‹œ ๊ตฌ์กฐํ™”๋œ ํ˜•์‹์€ ๊ฐ€๋Šฅํ•˜์ง€๋งŒ ๋‚ด์šฉ ์ •ํ™•์„ฑ ๋ถ€์กฑ: ์ž„์ƒ ๋ฆฌํฌํŠธ ํ˜•์‹์„ ์ ์ ˆํžˆ ์ž‘์„ฑํ•˜์ง€๋งŒ ์‹ค์ œ ์˜๋ฃŒ ์ •๋ณด์˜ ์ •ํ™•์„ฑ๊ณผ ์™„์ „์„ฑ์ด ๋ถ€์กฑํ•จ
  4. ๋‹ค์ค‘ ์˜์ƒ ๋ถ„์„์˜ ์–ด๋ ค์›€: ๋™์ผ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ์˜ ์—ฌ๋Ÿฌ ์˜์ƒ(๋‹ค์–‘ํ•œ ๊ฐ๋„์˜ ๋ทฐ)์ด๋‚˜ ์„œ๋กœ ๋‹ค๋ฅธ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ์˜ ์˜์ƒ์„ ํ†ตํ•ฉ ๋ถ„์„ํ•˜๋Š” ๋ฐ significant challenges๋ฅผ ๋ณด์ž„
  5. ํ™˜์ž ๋ณ‘๋ ฅ์— ๋Œ€ํ•œ ๊ณผ๋„ํ•œ ์˜์กด์„ฑ: ํ™˜์ž์˜ ์˜๋ฃŒ ๊ธฐ๋ก์ด ์ œ๊ณต๋˜๋ฉด ๋‹ต๋ณ€์ด ํฌ๊ฒŒ ๋‹ฌ๋ผ์ง€๋ฉฐ, ์ด๋Š” ๋ชจ๋ธ์ด ์˜์ƒ ์ •๋ณด๋ณด๋‹ค ํ…์ŠคํŠธ ์ •๋ณด์— ๋” ํฐ ๊ฐ€์ค‘์น˜๋ฅผ ๋‘๋Š” ๊ฒฝํ–ฅ์„ ์‹œ์‚ฌํ•จ

How

Figure 3

ํ•ด๋ถ€ํ•™์  ๊ตฌ์กฐ ๋ฐ ์ด์ƒ ์†Œ๊ฒฌ ์œ„์น˜ ํŒŒ์•… ํ‰๊ฐ€ ์‚ฌ๋ก€

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3.5/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ๊ธ‰์†ํžˆ ๋ฐœ์ „ํ•˜๋Š” ์ƒ์„ฑํ˜• AI์˜ ์˜๋ฃŒ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์— ๋Œ€ํ•œ ํ˜„์‹ค์ ์ด๊ณ  ์ฒด๊ณ„์ ์ธ ํ‰๊ฐ€๋ฅผ ์ œ๊ณตํ•จ์œผ๋กœ์จ ๊ณผ๋„ํ•œ ๊ธฐ๋Œ€๊ฐ์„ ์กฐ์ ˆํ•˜๊ณ  ์ง„์ •ํ•œ ์˜๋ฃŒ AI์˜ ๋ฐœ์ „ ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•˜๋Š” ์ค‘์š”ํ•œ ๊ธฐ์—ฌ๋ฅผ ํ•œ๋‹ค. ํŠนํžˆ ๊ด‘๋ฒ”์œ„ํ•œ ์˜๋ฃŒ ๋„๋ฉ”์ธ ์ปค๋ฒ„๋ฆฌ์ง€์™€ ๋‹ค์–‘ํ•œ ์ž„์ƒ ์ž‘์—… ํ‰๊ฐ€๋Š” ๋†’์ด ํ‰๊ฐ€๋˜์ง€๋งŒ, ๋Œ€๊ทœ๋ชจ ์ •๋Ÿ‰์  ๋ฉ”ํŠธ๋ฆญ ๋ถ€์žฌ์™€ ํ‰๊ฐ€ ์‚ฌ๋ก€ ์ˆ˜์˜ ์ œํ•œ์€ ํ–ฅํ›„ ๊ฐœ์„ ์ด ํ•„์š”ํ•œ ๋ถ€๋ถ„์ด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋Œ€ํ˜•์–ธ์–ด๋ชจ๋ธ์˜ ๊ธฐ์ดˆ์  ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ์—ฐ๊ตฌ๋กœ, GPT-4V์˜ ์˜๋ฃŒ ์ ์šฉ ์—ฐ๊ตฌ์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์˜๋ฃŒ ๋ถ„์•ผ์—์„œ LLM์˜ ์ž„์ƒ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ํ‰๊ฐ€ํ•˜๋Š” ์—ฐ๊ตฌ๋กœ, ์œ ์‚ฌํ•œ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
CRISPR-GPT ๋…ผ๋ฌธ์€ GPT-4v์˜ ์˜๋ฃŒ ์ž๋™ํ™” ์‘์šฉ๊ณผ ์œ ์‚ฌํ•˜๊ฒŒ, ์œ ์ „์ž ํŽธ์ง‘ ์‹คํ—˜์˜ ์ž๋™ํ™”๋ผ๋Š” ํŠนํ™”๋œ ์‘์šฉ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
GPT-4v ๋“ฑ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์˜ ์ž„์ƒ์  ์‹ค์ œ ์‘์šฉ ๊ฒฝ์šฐ๋ฅผ ์‚ฌ๋ก€๋กœ ๋“ค์–ด, ๋ณ‘๋ฆฌํ•™ ์‘์šฉ AI ์–ด์‹œ์Šคํ„ดํŠธ(Patchat)์™€ ๊ธฐ๋Šฅยทํ•œ๊ณ„๋ฅผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ ์˜๋ฃŒ ์ง„๋‹จ ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ๋กœ, ๋‹ค๋ฅธ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ๋‚˜ ์‹œ์Šคํ…œ์„ ๋Œ€์ƒ์œผ๋กœ ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
507์€ ์˜๋ฃŒ ๋ฒค์น˜๋งˆํฌ์—์„œ ๋‹ค์–‘ํ•œ LLM์˜ ์‹ค์ œ ์ž„์ƒ ์ ์šฉ์„ฑยท์ œ์•ฝ์„ ํ‰๊ฐ€ํ•˜์—ฌ, 181์˜ GPT-4V ์ž„์ƒ ์ ์šฉ ํ‰๊ฐ€์™€ ๋น„๊ต ๊ด€์ ์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
GPT-4V์˜ ์˜๋ฃŒ ์˜์ƒ ์ง„๋‹จ ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ๋กœ, ๋‹ค๋ฅธ ์ ‘๊ทผ ๋ฐฉ์‹์œผ๋กœ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์˜ ์˜๋ฃŒ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ํƒ๊ตฌํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
181 ๋…ผ๋ฌธ์€ GPT-4V ๋“ฑ์˜ ์˜๋ฃŒ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์˜ ์‹ค์ฆ์  ์‚ฌ๋ก€๋ฅผ ํ™œ์šฉํ•˜์—ฌ, SpatialMed์—์„œ ์ง€์ ๋œ ๊ณต๊ฐ„์ง€๋Šฅ ํ•œ๊ณ„๋ฅผ ์ž„์ƒํ™˜๊ฒฝ ๋งฅ๋ฝ์— ์ง์ ‘ ์—ฐ๊ณ„ํ•ด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
529(MedAgents)๋Š” LLM์„ ์˜๋ฃŒ ์ง„๋‹จ ํŒŒํŠธ๋„ˆ๋กœ ํ™œ์šฉํ•˜๋Š” ํ˜‘์—… ์ž‘์—… ๊ตฌ์กฐ๋กœ, 181์˜ ์ž„์ƒ ์‹คํ—˜ ๋น„๊ต๋ฅผ ์—์ด์ „ํŠธ์  ๋„์ž… ์ธก๋ฉด์—์„œ ํ™•์žฅํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์˜๋ฃŒ ๋ถ„์•ผ์—์„œ ๋ฒˆ์—ญ ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•๊ณผ LLM์˜ ์„ฑ๋Šฅ์„ ๋น„๊ตํ•จ์œผ๋กœ์จ, ๋‹ค๊ตญ์–ด/๋‹คํ‘œํ˜„ ์˜๋ฃŒ ์˜์ƒ ํ•ด์„์˜ ์‹ ๋ขฐ์„ฑ๊ณผ ์‹ค์ œ ์ ์šฉ์„ฑ์„ ํ•จ๊ป˜ ๋…ผ์˜ํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •