Generation of Tailorable Multi-Property Molecules via Multimodal Spectral Fusion Evolution
๐ง Audio Overview ์์ฑ
์ ์ : Shijie Tao, Meng Huang, Ledu Wang, Shuo Feng, Yulan Han, Jing He, Yan Huang, Zijin Jia, Donglai Zhou, Yi Feng, Guokun Yang, Linjiang Chen, Song Wang, Jun Jiang, Yi Luo | ๋ ์ง : 2026-04-29 | DOI : 10.26434/chemrxiv.15002555/v1 📄 PDF
Essence
Figure 1. Spectroscopy-guided molecular generation framework. (a) Multi-objective molecular
์ด ๋
ผ๋ฌธ์ multimodal spectroscopic ๋ฐ์ดํฐ๋ฅผ universal chemical language๋ก ํ์ฉํ์ฌ ๋ค์ค ์ฑ์ง์ ๋ถ์๋ฅผ ์์ฑํ๋ MUSE ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. S2M ๋ชจ๋ธ์ ํตํด spectral ๋ฐ์ดํฐ๋ก๋ถํฐ ๋ถ์ ๊ตฌ์กฐ๋ฅผ ์์ธกํ๊ณ , evolutionary algorithm๊ณผ spectral fusion์ ๊ฒฐํฉํ์ฌ ๋ชฉํ ์ฑ์ง์ ๋ง์กฑํ๋ ๋ถ์๋ฅผ ์์ฑํ๋ค.
Motivation
Known : ๋ถ์ ์์ฑ์ AI ๊ธฐ๋ฐ ์ฝ๋ฌผ ๋ฐ๊ฒฌ์ ์ค์ํ ๋ถ์ผ์ด๋ฉฐ, ๊ธฐ์กด ์์ฑ ๋ชจ๋ธ์ ์ฃผ๋ก ๋จ์ผ ์ฑ์ง ์ต์ ํ์ ์ด์ ์ ๋ง์ถ๋ค. Spectroscopic ๋ฐ์ดํฐ๋ ๊ตฌ์กฐ, ์ง๋, ์ ์ ํน์ฑ์ ํตํฉ์ ์ผ๋ก ์ธ์ฝ๋ฉํ ์ ์๋ ์ฐ์์ ํน์ฑ์ ๊ฐ์ง๋ค.
Gap : ๊ธฐ์กด ์์ฑ ๋ชจ๋ธ์ด ๋ค์ค ๊ตฌ์กฐ ๋ฐ ์ ์ ํน์ฑ์ ๋์์ ์ธ์ฝ๋ฉํ๊ณ ์งํ์ํค๋ ๋ฐ ์ด๋ ค์์ ๊ฒช๊ณ ์์ผ๋ฉฐ, ์ด์ฐ์ ๋ถ์ ํํ(SMILES, graphs)์ ๋ค์ํ ์ฑ์ง์ ๊ฐ์ง ๋ถ์๋ค์ ๊ตฌ์กฐ ํน์ฑ์ ํตํฉํ๊ธฐ ์ด๋ ต๋ค.
Why : ๋ค์ค ์ฑ์ง์ ๋ง์กฑํ๋ ๋ถ์์ ํจ์จ์ ์ค๊ณ๋ ํํ ๊ณต๊ฐ์ ํฌ์ ์์ญ ํ์์ ์ค์ํ๋ฉฐ, multimodal spectroscopic ๋ฐ์ดํฐ์ ์ฐ์์ ํน์ฑ์ ํ์ฉํ ์๋ก์ด ์ ๊ทผ์ ๋ถ์ ์์ฑ์ ํจ๋ฌ๋ค์ ์ ํ์ ์ ์ํ ์ ์๋ค.
Approach : USTC-FG26 ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ตฌ์ถ(238,869๊ฐ ๋ถ์, 26๊ฐ functional group ๊ท ํ ๋ฐฐ๋ถ), DFT ๊ธฐ๋ฐ multimodal spectral ๊ณ์ฐ(IR, Raman, UV-Vis, XAS, NMR), encoder-decoder architecture์ S2M ๋ชจ๋ธ ๊ฐ๋ฐ, spectral fusion์ ํตํ evolutionary algorithm ๊ธฐ๋ฐ ์์ฑ ๋ฐฉ์.
Achievement
Figure 3. Results of structural feature molecule design. (a) Molecular weight tuning through multi-
๋์ ์์ฑ ์ ํ๋ : S2M ๋ชจ๋ธ์ด ๋์ ์ฑ๊ณต๋ฅ ๋ก ๋ถ์ ๊ตฌ์กฐ ์์ฑ ๋ฌ์ฑ. ๋ค์ค ์ฑ์ง ์ต์ ํ : structural features, drug-likeness, electronic properties๋ฅผ ๋์์ ์ ์ด ๊ฐ๋ฅ. ํฌ์ ๋ถ์ ๋ฐ๊ฒฌ : 4๊ฐ ์ฑ์ง์ ๋ง์กฑํ๋ rare candidates์ 700๋ฐฐ enrichment ๋ฌ์ฑ. ๋๊ท๋ชจ ์์ฑ : 101 million๊ฐ์ ์๋ก์ด ๋ถ์ ์์ฑ. ๊ฒ์ฆ : ์ด๋ก ๋ฐ ์คํ์ ๊ฒ์ฆ์ผ๋ก ์์ฑ ๋ถ์์ ์ฑ์ง ํ์ธ.
How
Figure 1. Spectroscopy-guided molecular generation framework. (a) Multi-objective molecular
Functional group-centric sampling ์ ๋ต์ผ๋ก ํํ ๊ณต๊ฐ์ ๊ท ํ์กํ ํ์. - Modality-specific encoder๋ก ๊ฐ spectroscopic ๋ฐ์ดํฐ ํน์ฑ ์ถ์ถ. - Transformer ๊ธฐ๋ฐ fusion mechanism์ผ๋ก cross-modality ์๊ด๊ด๊ณ ํฌ์ฐฉ. - Autoregressive generation์ผ๋ก SELFIES ํ์์ ๋ถ์ ๊ตฌ์กฐ ์์ฑ. - Evolutionary approach๋ฅผ ํตํ iterative refinement๋ก multi-property candidates ํ์.
Originality
Multimodal spectroscopic ๋ฐ์ดํฐ๋ฅผ universal chemical language๋ก ์ฒ์ ์ ์. - Spectral fusion์ ํตํ multi-property ๋ถ์ ์์ฑ์ ์ ๊ท ์ ๊ทผ. - USTC-FG26 ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๊ท ํ์กํ functional group ๋ถํฌ ์ค๊ณ ๋ฐฉ์. - Continuously variable spectral descriptors์ ํน์ฑ์ ํ์ฉํ ๋ค์ค ์ฑ์ง ํตํฉ ์์ฑ.
Limitation & Further Study
๊ธฐ์ด ์ฐ๊ตฌ ๋จ๊ณ์ด๋ฏ๋ก ์ฝ๋ฌผ ํ๋ณด๋ก์์ in vitro/in vivo ๊ฒ์ฆ ๋ถ์ฌ. - DFT ๊ณ์ฐ ๊ธฐ๋ฐ spectral ๋ฐ์ดํฐ์ ์คํ๊ฐ ํธ์ฐจ ๋ฏธ๊ฒํ . - Spectral fusion์ ํํ์ ํฉ๋ฆฌ์ฑ์ ๋ํ ๊น์ด์๋ ๋ถ์ ๋ถ์กฑ. - ๊ณ์ฐ ๋น์ฉ ๋ฐ ํ์ฅ์ฑ์ ๋ํ ์์ธ ๋
ผ์ ๋ฏธํก. ํ์ ์ฐ๊ตฌ : ์ค์ ์ฝ๋ฌผ ๊ฐ๋ฐ ํ์ดํ๋ผ์ธ ์ ์ฉ, ๋ ๋ณต์กํ ๋ถ์ ๊ตฌ์กฐ๋ก์ ํ์ฅ, Spectral quality vs. diversity trade-off ์ต์ ํ.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ : ์ด ๋
ผ๋ฌธ์ multimodal spectroscopic ๋ฐ์ดํฐ๋ฅผ ๋ถ์ ์์ฑ์ universal language๋ก ํ์ฉํ๋ ํ์ ์ ์ ๊ทผ์ ์ ์ํ๋ค. MUSE ํ๋ ์์ํฌ์ ๋ค์ค ์ฑ์ง ์ต์ ํ ๋ฅ๋ ฅ๊ณผ ๋์ enrichment (700๋ฐฐ)๋ ๋ถ์ ์ค๊ณ ๋ถ์ผ์์ ์ค์ํ ์ง์ ์ ์๋ฏธํ๋ค. ๋ค๋ง ์ค์ ์ฝ๋ฌผ ๊ฐ๋ฐ๋ก์ ์ ํ, ์คํ์ ๊ฒ์ฆ์ ํ๋, ๊ทธ๋ฆฌ๊ณ spectral fusion์ ํํ์ ํฉ๋ฆฌ์ฑ์ ๋ํ ์ถ๊ฐ ๋ถ์์ด ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ ๊ธฐ๋ฐ ์ฐ๊ตฌ
3046๋ฒ ๋
ผ๋ฌธ์ ๋ถ์/๋จ๋ฐฑ์ง reasoning์ ์ํ ๋ฉํฐ๋ชจ๋ฌ LLM ์ํคํ
์ฒ๋ฅผ ์ ์ํ๋ฏ๋ก, 3113์ multi-property ๋ถ์ ์์ฑ์์ ๋ฐฉ๋ฒ๋ก ์ ๋ฐฐ๊ฒฝ์ด ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ChemAgent๋ LLM์ ํ์ฉํ ๋ถ์ ๊ตฌ์กฐยท์ฑ์ง ์์ธก๊ณผ ๋ง์ถคํ ๋์๊ด ๊ตฌ์ถ์ ๋ค๋ฃจ๋ฏ๋ก, 3113์ ๋ค์ค์ฑ์ง ๋ถ์ ์์ฑ๊ณผ ๋ฐฉ๋ฒ๋ก ๋น๊ต๊ฐ ๊ฐ๋ฅํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ถ๊ดํ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ๋ถ์ ๊ตฌ์กฐ ์์ฑ ๋ฐ ํด์์ ์ต์ ๋ฐฉ๋ฒ์ ๋น๊ตํ์ฌ, MUSE์ ๋ฒ์ฉ์ฑ ๋ฐ ์ ์ฉ๋ฒ์๋ฅผ ์ ๊ฒํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
720๋ฒ ๋
ผ๋ฌธ์ ์๋ช
๊ณผํ ๋ถ์ผ์ LLM, multimodal foundation model์ ์ต์ ๋ณดํธํ ๋ํฅ ๋ฐ ์์ฉ์ ์ ๋ฆฌํด, 3113์ ์คํํธ๋ผ ๊ธฐ๋ฐ ๋ถ์ ์์ฑ๋ฒ์ ์ผ๋ฐ์ฑ๊ณผ ๋ฏธ๋ ํ์ฅ ๋ถ์์ ์ฐธ๊ณ ๊ฐ ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Nanostructured Material Design via a Retrieval-Augmented Generative Model์ ์์ฑํ ๋ชจ๋ธ๊ณผ ์งํ์ ๊ฒ์, ์คํํธ๋ผ ์ตํฉ ๊ธฐ๋ฐ ๋๋
ธ์์ฌ ์์ฑ์์ 3113์ ํ๋ ์์ํฌ๋ฅผ ์์ฌ ํ์์ผ๋ก ํ์ฅ ์ ์ฉํ๋ค.
ํ์ ์ฐ๊ตฌ
๋ฉํฐ๋ชจ๋ฌ ์๋ฒ ๋ฉ์ ํตํ ๋ถ์ ํํ ํ์ต ๋
ผ๋ฌธ์ผ๋ก, MUSE ํ๋ ์์ํฌ์ ๋ค์ค์ฑ์ง ๋ถ์ ์์ฑ ์๋ฆฌ์ ์ ์ฉํ ์ ์์ต๋๋ค.
์์ฉ ์ฌ๋ก
๋ฉํฐํ๋กํผํฐ ๋ถ์ ์์ฑ ํ๋ ์์ํฌ๊ฐ ์ค๋ ฅํ ๋ฐ Kerr ๋ธ๋ํ ๋ฌธ์ ์์ ํ์ต ๊ธฐ๋ฐ ์งํญ ์์ฑ์ ์ค์ ์ ์ธ ์ถ๊ฐ ์์ฉ์ฌ๋ก๊ฐ ๋ ์ ์๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
๋์ ์ฒญ์ค
์ผ๋ฐ์ธ
๋ํ์ยท๋ํ์์
์ ๋ฌธ๊ฐ
ํค
์น๊ทผํ
ํ์ ์
ํ๊ธฐ์ฐฌ
์ฃผ์์ (์ ํ)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์
๋ซ๊ธฐ
์์ฑ
Developed by Jehyun Lee, KIST AIX Strategy Department | jehyun.lee@gmail.com