Essence
๊ธฐ์กด ์์์ํ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ฝ๋ฌผ-์ง๋ณ ์ํธ์์ฉ(drug-disease interaction)์ ํ์ตํ๋ ๋์กฐํ์ต(contrastive learning) ๋ฐฉ๋ฒ DrugCLIP์ ์ ์ํ์ฌ, ์์ฑ ์ํ(negative samples) ๋ถ์กฑ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์ฝ๋ฌผ ์ฌ์ฐฝ์ถ(drug repurposing) ํจ์จ์ 16.5% ํฅ์์์ผฐ๋ค.
Evaluation
์ดํ: DrugCLIP์ ์ฝ๋ฌผ ์ฌ์ฐฝ์ถ์ด๋ผ๋ ์ค์ฉ์ ๋ฌธ์ ์ ๋์กฐํ์ต์ ์ฐฝ์์ ์ผ๋ก ์ ์ฉํ๊ณ ํ์ง ๋์ ์์์ํ ๊ธฐ๋ฐ ๋ฐ์ดํฐ์
์ ์ ๊ณตํจ์ผ๋ก์จ ์์ฝํ AI ๋ถ์ผ์ ์๋ฏธ ์๋ ๊ธฐ์ฌ๋ฅผ ํ ๋
ผ๋ฌธ์ด๋ค. ๋ค๋ง ์๋ฌผํ์ ๊ฒ์ฆ, ์ธ๋ถ ๋ฐ์ดํฐ์
์ ํตํ ์ผ๋ฐํ ๊ฒ์ฆ, ๊ทธ๋ฆฌ๊ณ ์์ธก ๊ฒฐ๊ณผ์ ํด์ ๊ฐ๋ฅ์ฑ ์ ๊ณ ์ธก๋ฉด์์ ํฅ์์ด ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ฒ ๋
ผ๋ฌธ์ LLM์ ํ์ฉํ ๊ฐ์ค ์์ฑ๊ณผ์ ์์ฒด๋ฅผ ๋ค๋ฃจ๋ฉฐ ๋์กฐํ์ต ๊ธฐ๋ฐ ์ฝ๋ฌผ-์ง๋ณ ์ํธ์์ฉ ๋ชจ๋ธ๋ง๊ณผ ์ฐ๊ฒฐ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋์กฐํ์ต(contrastive learning) ๋ฐฉ๋ฒ๋ก ์ ์ด๋ก ์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
556๋ฒ ๋
ผ๋ฌธ์ ์ฝ๋ฌผ ์ค๊ณ์์ abductive reasoning ๋ฒค์น๋งํฌ๋ฅผ ์ ๊ณตํด DrugCLIP์ฒ๋ผ ๊ณผํ์ ์ถ๋ก ๊ธฐ๋ฐ ์ฝ๋ฌผ์ฌ์ฐฝ์ถ์ ํ๊ฐ์ ๋์์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Protein-ligand ๊ฒฐํฉ ์นํ์ฑ์ local ๊ตฌ์กฐ ์ ๋ณด ํ์ฉ์ ๊ธฐ๋ฐํด, DrugCLIP์ ๋ถ์-์๋ช
์ ๋ณด ์ํธ์์ฉ ์์ธก์ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ฝ๋ฌผ-์ง๋ณ ์ํธ์์ฉ ๋ฐ SAR ์์ธก์ ์ํ ๋์กฐํ์ต ๊ธฐ๋ฐ ํ๋ ์์ํฌ๋ฅผ ๋์
ํ์ฌ, ๋ถ์ ํ์ฑ ์์ธก ์ฐ๊ตฌ์ ํต์ฌ ์ด๋ก ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ฝ๋ฌผ ์ฌ์ฐฝ์ถ์ ์ํด ๋ค๋ฅธ ๋ฅ๋ฌ๋ ๋ฐฉ๋ฒ๋ก ์ ์ ์ฉํ ๋์์ ์ ๊ทผ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
DrugAgent๋ ์ฝ๋ฌผ ์ฌ์ฐฝ์ถ ๋ฑ ์ฝ๋ฌผ-์ง๋ณ ์ถ๋ก ์ agent ๊ธฐ๋ฐ ์ ๊ทผ์ ์ฌ์ฉํ๋ฏ๋ก, DrugCLIP์ ๋น๊ต ๋์์ผ๋ก ์ ํฉํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
291์ ๋๊ท๋ชจ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๋์ contrastive ํ์ต ๊ธฐ๋ฐ์ drug-disease ์ํธ์์ฉ ์์ธก ๋ฐฉ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
291๋ฒ ๋
ผ๋ฌธ์ ์ฝ๋ฌผ ํ์์ LLM ๊ธฐ๋ฐ ๋๋ฆฌ๋ชจ๋ธ ์ต์ ํ ์ ๊ทผ๋ฒ์ ์จ์, 305์์ ํจ์จ์ฑ ๋ฐ ๋ฐฉ์ ๋น๊ต์ ์ ์ตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฏธ๋ณด์ ์ธํฌ์ฃผ์ ๋ํ ์ฝ๋ฌผ ๋ฐ์ ์์ธก์ ์ผ๋ฐํ๋ฅผ ์ํ ๋์์ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
DrugCLIP ๋
ผ๋ฌธ์ ์ฝ๋ฌผ-์ง๋ณ ์ํธ์์ฉ ์ถ๋ก ์ ๋์กฐ์ ๋ชจ๋ธ์ ์ ์ํด, DeepCRE์ ํ์ ์์ค ์์ธก ๋ฐ ๋๋ฉ์ธ ์ผ๋ฐํ ์ ๊ทผ๊ณผ ๋น๊ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Drugpilot ๋
ผ๋ฌธ์ ์ฝ๋ฌผ ์ฌ์ฐฝ์ถ์ parameterized reasoning agent๋ก ํ์ด, DrugCLIP์ ๋์กฐํ์ต ๊ฐํ ์ ๊ทผ๊ณผ ๋์กฐ์ ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ์ฝ๋ฌผ ์ฌ์ฐฝ์ถ์ ๋ค๋ฅธ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ฐ์ ์ธ๊ณผ๊ด๊ณ ์ถ๋ก ์ ํตํ ์์ํ ์์ฉ์ ์ ์ฌํ ๋ฐฉ๋ฒ๋ก ์ ์ทจํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ฝ๋ฌผ ํ๋ณด ๊ตฌ์กฐ ๋ณํ ๋ฌธ์ ๋ฅผ ๋์กฐ ํ์ต ๊ธฐ๋ฐ ํ๋ ์์ํฌ๋ก ์ ๊ทผํ์ฌ, 3231์ MMPT-RAG์ ์๋ก ๋ค๋ฅธ ๋ฐ์ดํฐ ํ์ฉ๋ฒ์ ๋น๊ตํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
DrugCLIP์ ๋๋ฌ๊ทธ-์ง๋ณ ์ํธ์์ฉ ์์ธก์ contrastive learning์ ํ์ฉํ๋๋ฐ, GPS ํ๋ซํผ์ deep-learning ๊ธฐ๋ฐ ์๊ทธ๋์ฒ ์์ธก๊ณผ ๋น๊ต๋ชจ๋ธ๋ก ํ์ฉํ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
์ฝ๋ฌผ ์ฌ์ฐฝ์ถ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํฅ์์ํค๊ธฐ ์ํ ์ถ๊ฐ์ ์ธ ๋ฐฉ๋ฒ๋ก ์ ์ ๊ณตํ๋ค.
ํ์ ์ฐ๊ตฌ
DrugCLIP์ ํจ์จ์ ์ธ ์ฝ๋ฌผ-์ง๋ณ ์ํธ์์ฉ ์ถ๋ก ์ ๋ค์ค ์์ด์ ํธ์ ๋๊ตฌํ LLM ์ตํฉ์ผ๋ก ํ์ฅํ ์ฐ๊ตฌ๋ค.
ํ์ ์ฐ๊ตฌ
3062 ๋
ผ๋ฌธ์ ๋์กฐํ์ต์ ๊ธฐ๋ฐ์ผ๋ก ํญ์ฒด-ํญ์ ์ํธ์์ฉ๊น์ง ๋ฒ์๋ฅผ ํ์ฅํ์ฌ DrugCLIP์ ๋ฐฉ๋ฒ๋ก ์ ์ฌํ์ํต๋๋ค.