์ ์: | ๋ ์ง: 2026-03-07 | URL: https://www.biorxiv.org/content/10.64898/2026.03.07.707871v1 📄 PDF
๋ณธ ๋ ผ๋ฌธ์ ์งํ ํนํ ์ง์ ๊ทธ๋ํ ์์ ๊ตฌ์กฐ์ ์ผ๋ฐ์ฉ๋ LLM ์๋ฒ ๋ฉ์ ์ ๋ ฌํ๋ CLEAR ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ, ์์ธ ํ์ด๋จธ๋ณ ๋ฐ ๊ด๋ จ ์น๋งค(ADRD) ์ฝ๋ฌผ ์ฌ์ฐฝ์ถ ์์ ์์ ์ต์ฒจ๋จ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค. ๋ค์ค ๋ชจ๋ฌ ํํ(LLM ์๋ฒ ๋ฉ, ์ฝ๋ฌผ-์งํ-๋จ๋ฐฑ์ง ๊ด๊ณ, ๋คํธ์ํฌ ์ ํธ)์ ์ฃผ์ ๊ธฐ๋ฐ ๊ทธ๋ํ ์ ๊ฒฝ๋ง์ผ๋ก ์ตํฉํ์ฌ ์งํ ํนํ ๋งฅ๋ฝ์ ์ธ์ฝ๋ฉํ ํตํฉ ์๋ฒ ๋ฉ ๊ณต๊ฐ์ ํ์ตํ๋ค.
Fig. 3 | CLEAR aligns feature space to validate relationships of five FDA-approved AD drugs:
์ฃผ์ ์ฑ๊ณผ: 1) ๋ฒค์น๋งํฌ ํ๊ฐ - 5๊ฐ ์ฝ๋ฌผ-์งํ ์ฐ๊ด์ฑ ์์ธก ๊ณผ์ ์์ ์ต์ฒจ๋จ ์ฑ๋ฅ ๋ฌ์ฑ, F1 score ์ต๋ 30% ํฅ์. 2) ์๋ฌผํ์ ์ผ๊ด์ฑ - CLEAR๊ฐ ํ์ตํ ์๋ฒ ๋ฉ ๊ณต๊ฐ์ด ์๋ฌผํ์ ์ผ๋ก ์ผ๊ด์ฑ ์์ผ๋ฉฐ, FDA ์น์ธ AD ์ฝ๋ฌผ๋ค์ ์๋ ค์ง ์น๋ฃ ๊ด๊ณ๋ฅผ ์ ํํ ์ฌ๊ตฌ์ฑ. 3) ์ฝ๋ฌผ ์ฌ์ฐฝ์ถ ํ๋ณด - ADRD(์์ธ ํ์ด๋จธ๋ณ, ํํจ์จ๋ณ ๊ด๋ จ ์น๋งค, Lewy body ์น๋งค) ์ฝ๋ฌผ ์ฌ์ฐฝ์ถ ํ๋ณด๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์๋ณ ๋ฐ ์ฐ์ ์์ํ. 4) ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ - ์ฌํ๊ด์งํ, ์๊ฐ๋ฉด์ญ์งํ, ๋์ฌ์งํ ๋ฑ ๋ค์ํ ์งํ ๋ฒ์ฃผ์ ํ์ฅ ์ ์ฉ ๊ฐ๋ฅํจ์ ์ ์.
Fig. 3 | CLEAR aligns feature space to validate relationships of five FDA-approved AD drugs:
โข ๋ค์ค ๋ชจ๋ฌ LLM ํน์ง(MoLFormer, BioBERT, ESM-2)์ ๋จ์ผ ์ง์ ๊ทธ๋ํ๋ก ํตํฉํ์ฌ ํธํ๋์ง ์๋ ๊ณ ์ฐจ์ ๊ณต๊ฐ์ ์ ๋ ฌ ๋ฌธ์ ํด๊ฒฐ. โข ์ฃผ์ ๋ฉ์ปค๋์ฆ ๊ธฐ๋ฐ ๊ทธ๋ํ ์ ๊ฒฝ๋ง์ ์ฌ์ฉํ์ฌ ์ฝ๋ฌผ-์งํ-๋จ๋ฐฑ์ง ๊ฐ ๋น์ ํ ์์ ๊ด๊ณ ํ์ต. โข ADRD ํนํ ์ง์ ๊ทธ๋ํ ๊ตฌ์ถ์ผ๋ก ์ผ๋ฐ์ฉ๋ LLM ์๋ฒ ๋ฉ์ ์งํ ํนํ ๋งฅ๋ฝ ์ฃผ์ . โข ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์ 5๊ฐ์ ADRD ์ค์ ์์ฉ ์ฌ๋ก๋ฅผ ํตํด ์ฑ๋ฅ ๊ฒ์ฆ. โข ์๋ ค์ง ์ฝ๋ฌผ-์งํ ์ฐ๊ด์ฑ๊ณผ ๋ฌธํ ๊ฒ์์ผ๋ก ์๋ฌผํ์ ์ผ๊ด์ฑ ํ์ธ.
โข ์ผ๋ฐ์ฉ๋ LLM ์๋ฒ ๋ฉ๊ณผ ์งํ ํนํ ์ง์ ๊ทธ๋ํ ์์์ ์ ๋ ฌํ๋ novel framework ์ ์์ผ๋ก, ๊ธฐ์กด์ LLM ๋๋ KG ์ค ํ๋๋ฅผ ์ ํ์ ์ผ๋ก ํ์ฉํ๋ ๋ฐฉ์์ ๋์ด ํตํฉ์ ์ ๊ทผ ์ ์. โข ์ฝ๋ฌผ(MoLFormer), ์งํ(BioBERT), ๋จ๋ฐฑ์ง(ESM-2) ๋ ธ๋์ ๊ฐ๊ฐ ์ต์ ํ๋ LLM ๋ชจ๋ธ์ ์ ์ฉํ๋ ๋ค์ค ๋ชจ๋ฌ ํน์ง ์ด๊ธฐํ ์ ๋ต์ ๊ธฐ์กด AMVL ๋ฑ๊ณผ ๋ฌ๋ฆฌ ์๋ฌผํ์ entity๋ณ ๋ง์ถคํ ํํ ์ ๊ณต. โข ์ฃผ์ ๊ธฐ๋ฐ ๊ทธ๋ํ ์ ๊ฒฝ๋ง์ผ๋ก ์ผ๋ฐ์ฉ๋ ์๋ฒ ๋ฉ์ ์ฐจ์ ํธํ์ฑ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ฉด์ ์งํ ํนํ ์ ํธ๋ฅผ ๋ถํธํํ๋ ๋ฉ์ปค๋์ฆ์ novelํ ์ตํฉ ๋ฐฉ์.
ํ๊ณ: (1) ADRD ํนํ ์ง์ ๊ทธ๋ํ์๋ง ์ ์ฉ๋์์ผ๋ฉฐ, ๋ค๋ฅธ ์งํ ๋ฒ์ฃผ(์ฌํ๊ด์งํ ๋ฑ)์์ ์ผ๋ฐํ ์ฑ๋ฅ ๋ฏธ๊ฒ์ฆ. (2) ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์ ์ธ์ ADRD ์คํ์ด ๊ณต๊ฐ ์์ ์ํ ๋ฐ์ดํฐ ๋ฑ ๋ ๋ฆฝ์ ์ธ๋ถ ๊ฒ์ฆ ๋ถ์กฑ. (3) ์ฃผ์ ๋ฉ์ปค๋์ฆ์ ํด์ ๊ฐ๋ฅ์ฑ ๋ถ์(attention weight ๋ถ์) ๋ฏธ์ ์๋ก ๋ชจ๋ธ ํฌ๋ช ์ฑ ์ ํ. (4) ๊ณ์ฐ ๋ณต์ก๋ ๋ฐ ํ์ฅ์ฑ(์ฝ๋ฌผยท์งํยท๋จ๋ฐฑ์ง ์ ์ฆ๊ฐ ์)์ ๋ํ ๋ถ์ ๋ถ์ฌ. (5) ์ฌ์ฉ๋ LLM ๋ชจ๋ธ(BioBERT, ESM-2 ๋ฑ) ๋ฒ์ ๋ฐ ํ์ต ๋ฐ์ดํฐ์ ์๊ฐ์ ํธํฅ์ด ๊ฒฐ๊ณผ์ ๋ฏธ์น๋ ์ํฅ ๋ฏธ๊ฒํ . ํ์ ์ฐ๊ตฌ: (1) ๋ค์ํ ์งํ ๋ฒ์ฃผ์ ๋ํ CLEAR ํ๋ ์์ํฌ ์ ์ฉ ๋ฐ ์ผ๋ฐํ ์ฑ๋ฅ ํ๊ฐ. (2) ์์ ์ํ ๋จ๊ณ ์ฝ๋ฌผ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ์ธ๋ถ ๊ฒ์ฆ. (3) ์ฃผ์ ์ค์ฝ์ด ๋ถ์์ ํตํ ํด์ ๊ฐ๋ฅ์ฑ ๊ฐํ. (4) ๋ ์ต์ ์ LLM ๋ชจ๋ธ(GPT-4 ๊ธฐ๋ฐ ์๋ฒ ๋ฉ ๋ฑ) ํตํฉ ๊ฒํ .
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ์ผ๋ฐ์ฉ๋ LLM ์๋ฒ ๋ฉ๊ณผ ์งํ ํนํ ์ง์ ๊ทธ๋ํ๋ฅผ ์ฃผ์ ๊ธฐ๋ฐ ๊ทธ๋ํ ํ์ต์ผ๋ก ํตํฉํ๋ CLEAR ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, 5๊ฐ ๋ฒค์น๋งํฌ์์ ์ต์ฒจ๋จ ์ฑ๋ฅ(F1 score ์ต๋ 30% ํฅ์)์ ๋ฌ์ฑํ๊ณ ์์ธ ํ์ด๋จธ๋ณ ์ฝ๋ฌผ ์ฌ์ฐฝ์ถ์ ์๋ฌผํ์ ์ผ๋ก ์ผ๊ด์ฑ ์๋ ๊ฒฐ๊ณผ๋ฅผ ์ ์ํ๋ค. ๋ค์ค ๋ชจ๋ฌ ํํ ์ตํฉ๊ณผ ์งํ ํนํ ๋งฅ๋ฝ ์ฃผ์ ์ novel ๋ฉ์ปค๋์ฆ, ๋์ ๊ธฐ์ ์ ๊ฑด์ ์ฑ, ์์ ์ ์ฉ ์ ์ฌ๋ ฅ ๋ฑ์ด ๊ฐ์ ์ด๋, ๋ค์งํ ๋ฒ์ฃผ์ ๋ํ ์ผ๋ฐํ ๊ฒ์ฆ ๋ถ์กฑ๊ณผ ํด์ ๊ฐ๋ฅ์ฑ ์ ํ์ด ๋ณด์ ํ์ํ๋ค. ์ ์ฒด์ ์ผ๋ก ์ฝ๋ฌผ ์ฌ์ฐฝ์ถ ์ฐ๊ตฌ์ ์ค์ง์ ๊ธฐ์ฌ๋ฅผ ํ๋ ๊ฐ์น ์๋ ๋ ผ๋ฌธ์ด๋ค.