Essence
๊ทธ๋ฆผ 2: ์์ํ ์ง์์๋ต ์ต์ ํ๋ฅผ ์ํ ์ ๊ทผ ๋ฐฉ์ ๊ฐ์ - ๋ฏธ์ธ์กฐ์ , ๊ฒ์ ์ฆ๊ฐ ์์ฑ(RAG), ํ๋กฌํํธ ์์ง๋์ด๋ง ํตํฉ
MedBioLM์ ์๋ฃ ๋ฐ ์๋ฌผํ ๋ถ์ผ์ ์ง์์๋ต(QA) ์์
์ ์ต์ ํ๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)๋ก, ๋ฏธ์ธ์กฐ์ (fine-tuning)๊ณผ ๊ฒ์ ์ฆ๊ฐ ์์ฑ(RAG)์ ๊ฒฐํฉํ์ฌ ์ฌ์ค์ ์ ํ์ฑ๊ณผ ์ ๋ขฐ์ฑ์ ๋์์ ํฅ์์ํจ๋ค. ํ์ํ QA(๊ฐ๊ด์), ์ฅ๋ฌธํ QA, ๋จ๋ฌธํ QA ๋ฑ ๋ค์ํ ํ์์์ ๊ธฐ์กด ๋ชจ๋ธ์ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค.
How
๊ทธ๋ฆผ 3: RAG(๊ฒ์ ์ฆ๊ฐ ์์ฑ) ํ๋ก์ธ์ค - ์ฟผ๋ฆฌ ์ธ์ฝ๋, ์ง์ ๊ฒ์ยท๊ฒ์, ๋ต๋ณ ์์ฑ๊ธฐ์ 3๋จ๊ณ ๊ตฌ์ฑ
๋ฏธ์ธ์กฐ์ (Fine-tuning)
- ๋๋ฉ์ธ ํนํ ์๋ฃ QA ๋ฐ์ดํฐ์
(MedQA, PubMedQA, BioASQ, MedicationQA, LiveQA, ์ปค์คํ
๋ฐ์ดํฐ์
)์ ํ์ฉํ ๊ฐ๋
ํ์ต(supervised learning)
- ๋ฐฐ์น ํฌ๊ธฐ: ํ๋ จ ์์ ์ 0.2% ์ค์
- ํ์ต๋ฅ : ์ฌ์ ํ์ต ๊ธฐ๋ณธ๋ฅ ์ 0.5~2 ๋ฒ์์ ๋์ ์ค์ผ์ผ๋ง ํฉํฐ ์ ์ฉ
- ์ํฌํฌ: ๋ฐ์ดํฐ์
ํฌ๊ธฐ์ ๋ณต์ก๋์ ๋ฐ๋ฅธ ๋์ ์กฐ์
- ์๋ ์๋ ํ ๋น์ผ๋ก ์ฌํ์ฑ ๋ณด์ฅ
๊ฒ์ ์ฆ๊ฐ ์์ฑ(RAG)
- ๋ฌธ์ ํฌ๋ํน(document cracking), ์ฒญํน(chunking), ์ธ๋ฑ์ค ํ๋ก์ ์
(index projection) ๋จ๊ณ ๊ฑฐ์ณ ๊ด๋ จ ์ง์ ๊ฒ์
- ํ ํฐํ๋ ์ฟผ๋ฆฌ(T1, T2, ..., Tn)๋ฅผ ์ธ์ฝ๋๋ก ์ฒ๋ฆฌ
- ๊ฒ์๋ ์ง์ ์ฒญํฌ(K1, K2, ..., Kn)๋ฅผ ๋ต๋ณ ์์ฑ ๊ณผ์ ์ ํตํฉ
- ํ๊ฐ(hallucination) ๋ฌธ์ ์ํ ๋ฐ ์ฌ์ค์ ์ผ๊ด์ฑ ํฅ์
ํ๋กฌํํธ ์์ง๋์ด๋ง
- ์๋ต ์คํ์ผ ์ ์ด๋ก ์๋ฃ ์ ๋ฌธ๊ฐ์๊ฒ ์ ํฉํ ๊ฐ๊ฒฐํ๊ณ ๊ตฌ์กฐํ๋ ์ถ๋ ฅ ๋ณด์ฅ
- ์์
๋ณ ํน์์ฑ์ ๋ง์ถ ์๋ต ์์ฑ ์ต์ ํ
Azure ํด๋ผ์ฐ๋ ํ๊ฒฝ ํ์ฉ
- ํ์ฅ์ฑ ์๋ ์ปดํจํ
์ธํ๋ผ๋ก ํจ์จ์ ์ธ ๋ฏธ์ธ์กฐ์ ๋ฐ ์ถ๋ก ์ต์ ํ
Evaluation
Novelty: 3.5/5 Technical Soundness: 3/5 Significance: 3.5/5 Clarity: 3/5 Overall: 3/5
์ดํ: MedBioLM์ ๋ฏธ์ธ์กฐ์ ๊ณผ RAG๋ฅผ ์๋ฃ QA์ ํตํฉํ ์ค์ฉ์ ์ฐ๊ตฌ๋ก ์ฑ๋ฅ ํฅ์์ ๋ณด์ฌ์ฃผ์ง๋ง, ๊ธฐ์ ์ ์ธ๋ถ์ฌํญ ๋ฏธ๋น์ ์ ํ์ฐ๊ตฌ ๋๋น ์ฐจ๋ณ์ฑ ๋ถ์กฑ์ผ๋ก ํ์ ์ ๊ธฐ์ฌ๋๋ ์ค์ ์์ค์ด๋ฉฐ, ์์ ํ๋น์ฑ ๊ฒ์ฆ ๊ฐํ๊ฐ ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
BioBERT, SciBERT ๋ฑ ๊ธฐ์กด ์์ํ/์๋ฌผํ ํนํ LLM๊ณผ ๋น๊ตํ์ฌ ๋ณธ ๋ชจ๋ธ์ ์ฑ๋ฅ ๊ฐ์ ์ ์ ์ง์ ์ ์๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
RAG(Retrieval-Augmented Generation)์ ๊ดํ ์ฌ๋์๋ ๋ฆฌ๋ทฐ ๋
ผ๋ฌธ์ผ๋ก, [530]์ด ์ฑํํ RAG ๊ธฐ๋ฐ QA ์์คํ
์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
486 ๋
ผ๋ฌธ์ ์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ์ถ๋ก ๊ณผ ๊ฒ์ฆ์ ์๋ฆฌ์ ์ผ๋ก ์ค๋ช
ํ์ฌ, 530 ๋
ผ๋ฌธ์์ ์๋ฃ ์ง์ ๊ทธ๋ํ ์ง์์๋ต์ ์์ฉ๋ ์ ์๋ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
MedBioLM ๋
ผ๋ฌธ์ ๋ค์ํ ์๋ช
๊ณผํ ๋ถ์ผ QA ๋ฌธ์ ํด๊ฒฐ์ ์ํ ํ์ธํ๋ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ์ด, ScholarChemQA ๋ฐ์ดํฐ์
๊ฐ๋ฐ๊ณผ QAMatch ๋ชจ๋ธ ์ฐ๊ตฌ์ ๊ธฐ์ด๊ฐ ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
MedBioLM ๋
ผ๋ฌธ์ ์๋ช
๊ณผํ/์ํ QA ์ต์ ํ์ ํนํ๋ LLM ๊ฐ๋ฐ์ ๋ค๋ฃจ์ด, PubMedQA์ ์ ๋์ QA ๋ฒค์น๋งํฌ์ ๋น๊ต ๊ฐ๋ฅํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ์๋ฃ LLM ๋ฏธ์ธ์กฐ์ ์์ ์ ์ฌํ ๋ฌธ์ ๋ฅผ ๋ค๋ฅธ ๋ฐฉ์์ผ๋ก ์ ๊ทผํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ํ ๋ฐ ์๋ช
๊ณผํ ๊ด๋ จ ์ง์ ๊ทธ๋ํ ์ง์์๋ต์ LLM ๊ธฐ๋ฐ ๋ฐฉ์์ ์ ์ฉํ์ฌ, MedBioLM์ ์ ๊ทผ๋ฒ๊ณผ ๋น๊ตํ ์ ์๋ ๋์์ ์๋ฃจ์
์ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฃ QA ๋ฐ reasoning์์ LLMs์ ์์ฉ์ ๊ณ ๋ํํ๋ ๊ธฐ์ ์ ์ ๊ทผ์ ๋ ๋ค๋ฅธ ๋ํ ์ฌ๋ก์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
404๋ฒ ๋
ผ๋ฌธ์ ๊ณ ์ฑ๋ฅ RAG ๊ธฐ๋ฐ ๋ฌธํ QA ์์คํ
์ ์ ์ํ๋ฏ๋ก, 530๋ฒ ๋
ผ๋ฌธ๊ณผ ํจ๊ป ๋ณด๋ฉด ์ฌ์ค์ฑ, ์ ๋ขฐ์ฑ ๊ฐ์ ์ ์ํ RAG ํ์ฉ ๋ฐฉ์์ ์ฐจ์ด๋ฅผ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ๊ธฐ๋ฐ ๊ณผํ ์คํ ์ฌํ ์๋ํ์ ๊ดํ ์ฐ๊ตฌ๋ก, ์ง์์๋ต(QA)์ด ์๋ ๋ณต์กํ ์คํ์ ๊ณผํ์ ์์
์ ์ ๋ขฐ์ฑ๊ณผ ๊ฒ์ฆ ๊ฐ๋ฅ์ฑ ๊ด์ ์์ ๋๊ตฌ(MedBioLM) ์ ๊ทผ์ ๋ณด์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
507 ๋
ผ๋ฌธ์ ์ค์ ์์ ํ๊ฒฝ์์ ๋ค์ํ ์๋ฃ LLM์ ํ๊ฐํ ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์
์ ์ ๊ณตํด, 530์์ ์ ์ํ ๋ชจ๋ธ ์ฑ๋ฅ ๋น๊ต์ ๋ํ ์ฐธ๊ณ ๊ฐ ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
RAG๋ฅผ ํ์ฉํ ๊ณผํ ๋ฌธํ ๊ธฐ๋ฐ ์ง์ ๋ง์ด๋ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
MedBioLM์ ํ์ธํ๋ํ ๋ค์ํ ์๋ฃ QA๋ฅผ ํตํด, 225์ ์์ ๊ธฐ๋ก ๊ธฐ๋ฐ ClinicalGPT-R1๊ณผ ๋น๊ต ๊ฐ๋ฅํ ์๋ฃ ์ ํ์ QA ์ฑ๋ฅ์ ์ ๋ณด์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
530 ๋
ผ๋ฌธ์ ์ง์์๋ตํ LLM ๊ธฐ๋ฐ ์๋ฃ/์๋ฌผ QA ์ต์ ํ ๊ธฐ๋ฒ์ ์ ์ํด, 3042์ ํญ์ฒด ๊ฐ๋ฐ๊ฐ๋ฅ์ฑ ํน์ฑ ์์ธก๊ณผ ์ LLM ์์ฉ ํํ๋ฅผ ๋น๊ตํ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
530 ๋
ผ๋ฌธ์ ์์ํ ๋ฐ ์๋ฃ QA ์ต์ ํ๋ฅผ ์ํ ์ธ์ด๋ชจ๋ธ ํ์ธํ๋ ๊ฒฝ๋ก๋ฅผ ๋ค๋ค, 734 ํ๋ ์์ํฌ์ ์ค์ ํ์ฉ ์์ญ์ ํ์ฅ์ํต๋๋ค.
ํ์ ์ฐ๊ตฌ
MedBioLM์ ๋๊ท๋ชจ ์์ํ ์ง์์๋ต์์ LLM์ ์ฑ๋ฅ์ ์ต์ ํํ๋ ๋ฐฉ๋ฒ์ ํ๊ตฌํ๋ฉฐ, 224๋ฒ์ ์์ ์ํฐํฐ ๊ธฐ๋ฐ ๊ฒ์๊ณผ ์ํธ๋ณด์๋ฉ๋๋ค.
์์ฉ ์ฌ๋ก
MedBioLM ๋
ผ๋ฌธ์ BioMedLM์ฒ๋ผ QA ์ฑ๋ฅ ์ต์ ํ๋ ๋ชจ๋ธ๋ก, ์ค์ ๋ฐ์ด์ค ์ง์์๋ต์ ์ด๋ป๊ฒ ์ ์ฉ๋๋์ง ๋ณด์ฌ์ค๋ค.
๋ฐ๋ก /๋นํ
Instruction tuning ๋ฑ ๋ค์ํ ์ต์ ํ ๋ฐฉ๋ฒ์ด ์ค์ QA ํ์คํฌ์์ ์ผ๋ง๋ ์ฐจ์ด๋ฅผ ๋ง๋๋์ง, ๋น๊ต ๋ถ์ ์ฌ๋ก๋ฅผ ์ ๊ณตํ๋ค.
๋ฐ๋ก /๋นํ
184๋ฒ ๋
ผ๋ฌธ์ LLM์ด ๊ณผํ ๋ฌธํ์ ์ค ์ ์๋ ํผ๋๋ฐฑ์ ํ๊ณ์ ํ์ฉ๊ฒฐ๊ณผ๋ฅผ ํ๊ฐํ์ฌ, 530๋ฒ ๋
ผ๋ฌธ์์ ์ ์ํ QA ์ฑ๋ฅ ๊ฐ์ ์ฃผ์ฅ์ ๋ํ ๋นํ์ ์๊ฐ์ ์ ๊ณตํฉ๋๋ค.