์ ์: Zongru Li, Xingsheng Chen, Honggang Wen, Regina Qianru Zhang, Ming Li, Xiaojin Zhang, Hongzhi Yin, Qiang Yang, Kwok-Yan Lam, Pietro Lio, Siu-Ming Yiu | ๋ ์ง: 2026-04-17 | URL: https://arxiv.org/abs/2604.16586 📄 PDF
Essence
Figure 1: Overview of this survey. The framework organizes more than 100 deep learning methods for molecular
๋ณธ ๋
ผ๋ฌธ์ ๋ถ์ ์ฑ์ง ์์ธก์ ๋ํ ์ฒด๊ณ์ ๋ฒค์น๋งํฌ ๋ฐ ์ค๋ฌธ์กฐ์ฌ๋ก, Quantum, Descriptor ML, Geometric DL, Foundation Model์ 4๊ฐ์ง ํจ๋ฌ๋ค์์ ํตํฉ๋ ๋ถ๋ฅ์ฒด๊ณ ๋ด์์ ๋น๊ต ๋ถ์ํ๊ณ ๋ฐ์ดํฐ ๊ด๋ จ ํ์คํ ๋ฌธ์ ์ ์ฌํ์ฑ ํ๊ณ๋ฅผ ์ง์ ํ๋ฉฐ physics-aware learning๊ณผ uncertainty-calibrated foundation models ๋ฑ ํฅํ ๋ฐฉํฅ์ ์ ์ํ๋ค.
Achievement
Figure 2: Taxonomy of existing studies for molecular property prediction
ํตํฉ ๋ถ๋ฅ์ฒด๊ณ ์๋ฆฝ: ๋ถ์ ํํ, ๋ชจ๋ธ ์ํคํ
์ฒ, ํ์ ๊ฐ ์์ฉ์ ์ฐ๊ฒฐํ๋ ํตํฉ ๋ถ๋ฅ์ฒด๊ณ ์ ์. ๋ฒค์น๋งํฌ ๋ถ์: ์ฐ์
๊ด์ ์ ๋ฐ์ํ ๋ฐ์ดํฐ์
๊ณผ ๊ด๋ฒ์ํ ๋๋ฉ์ธ ์ปค๋ฒ๋ฆฌ์ง๋ฅผ ํฌํจํ ๋ฒค์น๋งํฌ. ๋ฌธ์ ์ ์ง์ : ์
์ฒดํํ ๋ถ์ผ์น, ์ด์ข
์ด์ธ์ด ์ถ์ฒ, ์ฌํ์ฑ ํ๊ณ ๋ฑ ํํฉ ๋ฒค์น๋งํฌ์ ๊ตฌ์ฒด์ ๋ฌธ์ ์ ๋์ถ. ๋ฏธ๋ ๋ฐฉํฅ ์ ์: physics-aware learning, uncertainty-calibrated foundation models, multimodal benchmark ecosystems์ 3๊ฐ์ง ์ ๋ต์ ๋ฐฉํฅ ์ ์.
Limitation & Further Study
ํ์กด ํ๊ณ: ๋ถํ์ค์ฑ ์ ๋ํ ๋ฐ ์ ๋ขฐ๋ ํ๊ฐ ๋ฐฉ๋ฒ์ด ์ถฉ๋ถํ ๋ฐ๋ฌ๋์ง ์์์; foundation models์ ๊ณ์ฐ ๋น์ฉ๊ณผ ๋ฉ๋ชจ๋ฆฌ ์๊ตฌ์ฌํญ ๋ฏธํก; ํ์ค์ ์คํ ๋ฐ์ดํฐ์ ๊ณ์ฐ ์์ธก ๊ฐ์ ๊ฒฉ์ฐจ ๋ฏธํด๊ฒฐ. ํ์ ์ฐ๊ตฌ: physics-aware GNN ์ค๊ณ์ ํ์คํ ํ์; uncertainty quantification ๊ธฐ๋ฒ์ ์ค์ฆ์ ๋น๊ต ๋ถ์กฑ; time-aware ๋ฐ scaffold-aware ๋ถํ ์ ๋ต์ ์ฐ์
๋ฐ์ดํฐ์
์ ๋ํ ๊ฒ์ฆ ์๊ตฌ; multimodal fusion ๋ฉ์ปค๋์ฆ์ ํด์์ฑ ๊ฐ์ .
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ๋ถ์ ์ฑ์ง ์์ธก ์์ญ์ ๋ํ ์ต์ด์ ํฌ๊ด์ ์ค๋ฌธ์กฐ์ฌ๋ก, 4๊ฐ์ง ํจ๋ฌ๋ค์์ ํตํฉ์ ์ผ๋ก ๋ถ์ํ๊ณ ๋ฐ์ดํฐ ๊ด๋ฆฌ ๋ฐ ์ฌํ์ฑ ๋ฌธ์ ๋ฅผ ๋ช
ํํ ์ง์ ํ๋ฉฐ ๋ช
ํํ ๋ฏธ๋ ๋ฐฉํฅ์ ์ ์ํ๋ค. ํนํ physics-aware learning๊ณผ uncertainty-calibrated foundation models ๋ฐฉํฅ์ ํ์ ๋ฐ ์ฐ์
์์ค ๋ชจ๋์์ ์ฆ์ ํ์ฉ ๊ฐ๋ฅํ ์ ๋ต์ ๊ฐ์น๋ฅผ ๊ฐ์ง๋ค. ๋ค๋ง ์ ์๋ ์ธ ๋ฐฉํฅ์ ๋ํ ๊ตฌ์ฒด์ ๊ธฐ์ ๊ฒ์ฆ์ด๋ ํ๋กํ ํ์
๊ตฌํ์ด ๋ถ์ฌํ ์ ์ ์ ํ์ฌํญ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ถ์ ์์ฑ ๋ฅ๋ฌ๋ ๋ฐฉ์์ ์ ๋ฐ์ ๋ฒค์น๋งํน ๋ฐ ์ค์ ์ฑ๋ฅ ํ๊ณ ๋ถ์์ด ๊ตฌ์กฐ ๊ธฐ๋ฐ ํ ํฐํ ์ฐ๊ตฌ์ ์คํจ์ฑ ํ๊ฐ์ ์ค์ํ ๋ฐํ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ฅ๋ฌ๋ ๊ธฐ๋ฐ ์ง๋ ์คํํธ๋ผ ์์ธก ๋๊ตฌ๋ค์ ์์คํ
์ ๋ฒค์น๋งํน ๋ฆฌ๋ทฐ ๋
ผ๋ฌธ์ผ๋ก FlexMS ํ๋ ์์ํฌ์ ํ์์ฑ๊ณผ ๋ฐฉํฅ์ ์ ๋ฆฝํ๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ถ์ ์์ฑ ์์ธก ๋ฅ๋ฌ๋์ ์ฒด๊ณ์ ๋ฒค์น๋งํฌ ์ฐ๊ตฌ๋ก, domain adaptation ๋ฐ ๋ฒ ์ด์ค๋ผ์ธ ๋ชจ๋ธ์ ์ฑ๋ฅ๋ชจ๋ธ๋ง์ ๊ณต์ ํ๊ฒ ๋น๊ตํ ๊ทผ๊ฑฐ ์๋ฃ๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
2997 ๋
ผ๋ฌธ์ ๋ถ์ ์์ค ML ๋ชจ๋ธ์ ์ฑ๋ฅ ํ๊ฐ์ ๋ฒค์น๋งํฌ ๊ตฌ์ฑ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ค, 3035์ ์ค์ wet-lab ํ๊ฐ์ ์๋ฐํ ๋ฒค์น๋งํฌ ๊ตฌ์ถ ๋
ผ์์ ์ด๋ก ์ ์ธ์ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ถ์ ๋ํน ๋ฐ ์ฌ๋ญํน ๋ฐฉ๋ฒ ๋ฒค์น๋งํน์ ์ด์ ์ ๋ง์ถ ๋
ผ๋ฌธ์ผ๋ก, ๊ฐ์ ํ์ค ํ๊ฐ ์ ๊ทผ๋ฐฉ์์ ๋
ผ์ํ๋ฏ๋ก ํจ๊ป ๋น๊ตํด๋ณด๋ฉด ์ ์ฉํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ถ์ ์ค๊ณ, ์ฝ๋ฌผ ๋ฐ ํฉํ์ด๋ ์์ฑ์ ์์ด ๋ฐ์ดํฐ ๋ถํฌ ๋ฐ bias์ ์ํฅ, ๋ฒค์น๋งํน ๋ฐฉ๋ฒ์ ๋ํ ์ ๋ฐ์ ๋
ผ์๋ฅผ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
344 ๋
ผ๋ฌธ์ bioinformatics ํนํ foundation model์ ์ ๋ฐ์ ๋ถ๋ฅ ๋ฐ ๋ฒค์น๋งํฌ ํ๋ ์์ ์ ์ํด, 2997์ ๋ถ์์ฑ์ง ์์ธก ๋ฒค์น๋งํน๊ณผ ๋งฅ๋ฝ์ ์ผ๋ก ๋์กฐ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๊ท๋ชจ ๋ฐ์ดํฐ์
์์ ์ฌ์ธต ์ ๊ฒฝ๋ง์ ์ผ๋ฐํ ๋ฐ ๋ฒค์น๋งํน ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
3227๋ฒ ๋
ผ๋ฌธ์ ํ๋ผ์ฆ๋ง ์ ์ด ๋ฑ์์ ๋ด๋ด ๋คํธ์ํฌ ๊ธฐ๋ฐ ์ค์๊ฐ ์์ธก์ ๋ค๋ฃจ๋ฉฐ, ๋ถ์ ๋ฌผ์ฑ ์์ธก ๋ถ์ผ์ ML-๊ธฐ๋ฐ ๋ฒ์ฉ์ฑ๊ณผ ํ๊ณ๋ฅผ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ถ์ ํน์ฑ ์์ธก์ ๊ดํ ๋ฅ๋ฌ๋ ๋ฒค์น๋งํฌ ๋
ผ๋ฌธ์ผ๋ก, ์๋ก ๋ค๋ฅธ ๋ฐ์ดํฐ์ ๋ฐฉ๋ฒ๋ก ์ ๋น๊ตํ๋ฉฐ ๋
๋ฆฝ์ ์ธ ๊ด์ ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
2997 ๋
ผ๋ฌธ์ ๋ถ์ ์ค๊ณ ๋ฐ ์์ธก์์ ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ ํ๊ณ์ ๊ฐ๋ฅ์ฑ์ ๋ฒค์น๋งํฌํ์ฌ, 3027์ DEL ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์ผ๋ฐํ ํ๊ฐ์ ๋์กฐํด๋ณผ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
2997 ๋
ผ๋ฌธ์ ๋ถ์ ๋ํน ๋ฐ ์ฝ๋ฌผ๋ฐ๊ตด ๋ฅ๋ฌ๋ ๋ฐฉ๋ฒ์ ์ฑ๋ฅ ๋ฒค์น๋งํน์ ํญ๋๊ฒ ๋ค๋ค, 3036์ ํ๊ฐ ํ๋ ์์ํฌ์ ๋์กฐํด๋ณผ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
ํํ ๋ถ์ผ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ๋ํ ์๊ฐ์ ์ ์ํ์ฌ, ๋ถ์ ์ฑ์ง ์์ธก ๋ฒค์น๋งํฌ ๋
ผ๋ฌธ์ ๋์
๊ณผ ์ฐ๊ฒฐ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
346 ๋
ผ๋ฌธ์ ๋ฒค์น๋งํฌ ๋ฐ ๋ฐ์ดํฐ ํจ์จ์ฑ, ์ฌํ์ฑ ํ๊ณ๋ฅผ physics-aware paradigms ๊ด์ ์์ ๋ค๋ค, 2997์ ์คํ์ ์์ฌ์ ์ ์ฌํ์ํต๋๋ค.
ํ์ ์ฐ๊ตฌ
2998๋ฒ ๋
ผ๋ฌธ์ GNN ๊ธฐ๋ฐ ์ ์ดํ์ต ๋ถ์ ์ค๋นํ ์์ธก์ ํตํด 2997๋ฒ ๋
ผ๋ฌธ์ ์ฒด๊ณ์ ๋ถ์ ์์ธก ๋ฒค์น๋งํฌ์ ์ฑ๋ฅ ํฅ์ ์ฌ๋ก๋ฅผ ๊ตฌ์ฒด์ ์ผ๋ก ๋ณด์ฌ์ค๋๋ค.
์์ฉ ์ฌ๋ก
2997๋ฒ ๋
ผ๋ฌธ์ ๋ค์ํ DL ๋ถ์ ์์ธก ๋ชจ๋ธ์ ๋ฒค์น๋งํฌ๋ฅผ ์ ๊ณตํ์ฌ, GNN ๋ถ์์ค๋นํ ์์ธก ์ฑ๋ฅ์ ๊ฐ๊ด์ ๋น๊ต์ ํ์ฉ๋ ์ ์์ต๋๋ค.