Essence
ClinicalGPT์ ์ ์ฒด ๊ตฌ์กฐ: ๋ค์ํ ์๋ฃ ๋ฐ์ดํฐ์ ๊ฐ๋
๋ฏธ์ธ์กฐ์ (SFT), ๋ณด์ ๋ชจ๋ธ(Reward Model), ๊ฐํํ์ต(RL) ํ์ดํ๋ผ์ธ์ ํตํฉ
๋ณธ ๋
ผ๋ฌธ์ ์๋ฃ ๋๋ฉ์ธ์ ํนํ๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ ClinicalGPT๋ฅผ ์ ์ํ๋ค. ๋ค์ํ ์์ ๋ฐ์ดํฐ์ ํฌ๊ด์ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ํ์ฉํ์ฌ ์๋ฃ ๋ถ์ผ์ ๊ณ ์ ํ๋, ํด์์ฑ, ์์ ์ฑ ์๊ตฌ์ฌํญ์ ์ถฉ์กฑํ๋๋ก ์ค๊ณ๋์๋ค.
Evaluation
์ดํ: ClinicalGPT๋ ์๋ฃ ๋๋ฉ์ธ์ ํนํ๋ LLM ๊ฐ๋ฐ์ ์ค์ฉ์ ์ ๊ทผ์ ๋ณด์ฌ์ฃผ๋ฉฐ ๋ค์ํ ์์ ๋ฐ์ดํฐ ํตํฉ๊ณผ ํฌ๊ด์ ํ๊ฐ ํ๋ ์์ํฌ๊ฐ ์ฃผ์ ๊ธฐ์ฌ์ด๋, ๊ธฐ์ ์ ํ์ ์ฑ์ด ์ ํ์ ์ด๊ณ ์ค์ ์์ ์ฑ๋ฅ ๊ฒ์ฆ ๋ฐ ์ค๋ฌด ์ ์ฉ ๊ฒฝ๋ก์ ๋ํ ๋
ผ์๊ฐ ๋ถ์กฑํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
BioBERT๋ ์๋ฌผ์ํ ๋ฐ์ดํฐ๋ฅผ ํตํ ์ฌ์ ํ์ต ๋ชจ๋ธ๋ก, ์๋ฃ LLM ๋๋ฉ์ธ ํนํ ํ์ต์ ๊ทผ๊ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ํ ํนํ LLM์ ๋ค์ํ ๋ฏธ์ธ์กฐ์ ๋ฐ ๋ฐ์ดํฐ ํ์ฉ ์ฌ๋ก๊ฐ Patchat์ ๋น์ -์ธ์ด ๋ณํฉ ์ ๊ทผ๋ฒ๊ณผ ์ฐ๊ด ๊น์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
ClinicalGPT-R1์ ์๋ฃ ํนํ ์ง๋จ ๊ธฐ๋ฅ์ ๋ค์ํ ์์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ClinicalGPT์ ํต์ฌ ๊ฐ๋
์ ๊ณ์น/ํ์ฅํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
ClinicalGPT๋ ์ํ ๋
ผ๋ฌธ ๊ฒํ ๋ฅผ LLM์ผ๋ก ์๋ํํ ์ฌ๋ก๋ก, REMOR๊ฐ ๋ค๋ชฉ์ ๊ฐํํ์ต(MORL) ๊ธฐ๋ฒ์ ํ์ฅํด ๋ค์ํ ๋ถ์ผ์ ์ ์ฉํ ๊ฐ๋ฅ์ฑ๋ ์์ฌํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์ ์๋๋ฆฌ์ค์์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ์ ํ์ฉํ ๊ฐ์ธ๋ง์ถคํ ์๋ฃ์๋น์ค LLM ์์ฉ ์ฌ๋ก์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ์๋ฃ LLM ๋ฏธ์ธ์กฐ์ ์์ ์ ์ฌํ ๋ฌธ์ ๋ฅผ ๋ค๋ฅธ ๋ฐฉ์์ผ๋ก ์ ๊ทผํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฃ LLM๊ณผ ์์ด์ ํธ ์๋ํ๊ฐ ์ค์ ์์ ๋ฐ ๋ฐ์ด์ค๋ฉ๋ ๋ถ์ผ์์ ์ผ๋ง๋ ์ง๋ณดํ๋์ง ํํฉ์ ๋น๊ตยท์ ๊ฒํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์ ์ ๋ณด๋ฅผ ์ถ์ถํ๊ณ ์์ ๋
ธํธ์ ์๋ฏธ ์ดํด์ ํนํ๋ ClinicalGPT ์ฐ๊ตฌ์ CLEAR ํ์ดํ๋ผ์ธ์ ์ค์ ์ ์ฉ ์ฌ๋ก๊ฐ ๋์กฐ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฃ ํนํ ์ธ์ด ๋ชจ๋ธ ๊ฐ๋ฐ์์ ์ ์ฌํ ๋ชฉํ๋ฅผ ๋ค๋ฅธ ์ ๊ทผ๋ฒ์ผ๋ก ๋ฌ์ฑํ๋ ๋์์ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
ClinicalGPT๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ฐํํ์ต์ ํตํด ์ถ๋ก ๋ฅ๋ ฅ์ ๊ฐํํ ํ์ฅ ์ฐ๊ตฌ์ด๋ค.
์์ฉ ์ฌ๋ก
488์ ์์ ๋๋ฉ์ธ์ ์ง์๊ทธ๋ํ QA ์์ญ์์ LLMs์ ํ์ฉ๋๋ฅผ ์ค์ ์ง๋จ ๋ฌธ์ ์ ์ ์ฉํ์ฌ, ClinicalGPT๊ฐ ์๋ํ ์ํ์ ์ง์์๋ต์ ์คํจ์ฑ์ ํ๊ฐํฉ๋๋ค.