์ ์: | ๋ ์ง: 2026-04-07 | URL: https://www.biorxiv.org/content/10.64898/2026.04.04.716470v1 📄 PDF
Fig. 1: Overview of DrugPlayground. We prepare datasets with molecule-text-paired
DrugPlayGround๋ ์ฝ๋ฌผ ๋ฐ๊ฒฌ์ ๋ค ๊ฐ์ง ๋ํ์ ์์ (์ฝ๋ฌผ ๊ธฐ๋ฅ ๋ถ์, ์ฝ๋ฌผ-๋จ๋ฐฑ์ง ์ํธ์์ฉ ์์ธก, ์ฝ๋ฌผ ์๋์ง ์กฐํฉ ์์ธก, ์ฝ๋ฌผ ์ญ๋ ์์ธก)์์ ๋ํ์ธ์ด๋ชจ๋ธ(LLM)์ ์ฑ๋ฅ์ ์ฒด๊ณ์ ์ผ๋ก ํ๊ฐํ๋ ๋ฒค์น๋งํน ํ๋ซํผ์ด๋ค. ๋ค์ํ ํ๋กฌํํธ ์ค์ ๊ณผ ๋ชจ๋ธ ์จ๋ ๋ณํ ํ์์ LLM์ด ์์ฑํ ํ ์คํธ ์ค๋ช ๋ฐ ์๋ฒ ๋ฉ์ ํ์ง์ ๊ฐ๊ด์ ์ผ๋ก ์ธก์ ํ๊ณ ํํ์ ํผ๋๋ฐฑ์ ํตํฉํ์ฌ ํ๊ฐํ๋ค.
Fig. 2: Model Performance in Terms of Text Generation (a) Five LLMsโ BLEU scores
Fig. 2: Model Performance in Terms of Text Generation (a) Five LLMsโ BLEU scores
์ดํ: DrugPlayGround๋ ์ฝ๋ฌผ ๋ฐ๊ฒฌ์ด๋ผ๋ ๊ณ ๋๋ก ์ ๋ฌธํ๋ ์์ญ์์ LLM์ ์ฑ๋ฅ์ ์ฒด๊ณ์ ์ผ๋ก ๋ฒค์น๋งํนํ๋ ํตํฉ ํ๋ซํผ์ผ๋ก, ์ฝ๋ฌผ ์ค๋ช ์์ฑ(ํ ์คํธ ํ๊ฐ) ๋ฐ ์๋ฒ ๋ฉ ๊ธฐ๋ฐ ๋ค์ด์คํธ๋ฆผ ์์ (์ฝ๋ฌผ-๋จ๋ฐฑ์ง ์ํธ์์ฉ, ์๋์ง ์์ธก ๋ฑ)์ ๋์์ ๋ค๋ฃจ๋ ํฌ๊ด์ ์ ๊ทผ์ ์ ์ํ๋ค๋ ์ ์์ ๊ฐ์น์๋ค. ๋ค์ํ ํ๋กฌํํธ ์ ๋ต, ์จ๋ ์ค์ , ํํ์ ํผ๋๋ฐฑ์ ํตํฉํ ํ๊ฐ๋ LLM์ ์ค์ฉ์ ํ์ฉ ๊ฐ๋ฅ์ฑ์ ๋ช ํํ ํ๋ ๋ฐ ๊ธฐ์ฌํ ๊ฒ์ผ๋ก ์์๋๋ค. ๋ค๋ง ๋ฐ์ดํฐ์ ๊ท๋ชจ, ๋ฉํธ๋ฆญ์ ํํ์ ํ๋น์ฑ, ํต๊ณ์ ์ ์์ฑ ๊ฒ์ , ํํ์ ํ๊ฐ์ ์ฒด๊ณํ ๋ฑ์์ ์ถ๊ฐ ์ ๋ณด ์ ์ ๋ฐ ๋ณด์์ด ํ์ํ๋ฉฐ, ๋ณธ๋ฌธ ๋ฐ์ท์์๋ ์จ์ ํ ์๋ฒ ๋ฉ ๊ธฐ๋ฐ ์ฑ๋ฅ ํ๊ฐ ๊ฒฐ๊ณผ๊ฐ ๋๋ฝ๋์ด ์ต์ข ํ๋จ์ ์ ์ฝ์ด ์๋ค.