A data-efficient foundation model for porous materials based on expert-guided supervised learning
์ ์: Jiawen Zou, Zirui Lv, Weimin Tan, Taoyang Wang, Runfeng Lin, Zhongyao Wang, Yi Yang, Qiaowei Li, Xiaomin Li, Bo Yan, Dongyuan Zhao | ๋ ์ง: 2026-02-11 | DOI: 10.1038/s41467-026-69245-y 📄 PDF
Essence
Fig. 1 | Overall training pipeline of SpbNet. SpbNet consists of four main parts: (1)
๋ณธ ๋
ผ๋ฌธ์ MOF ๋ฑ ๋ค๊ณต์ฑ ์์ฌ ๋์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ SpbNet์ ์ ์ํ๋ค. potential energy surface (PES) ๊ธฐ์ ํจ์๋ฅผ ํตํฉ ๋์คํฌ๋ฆฝํฐ๋ก ํ์ฉํ๊ณ dual-stream multi-modal ์ํคํ
์ฒ๋ฅผ ํตํด ๊ตฌ์กฐ ์ ๋ณด์ ์๋์ง ์ ๋ณด๋ฅผ ์ตํฉํ์ฌ, 0.1๋ฐฑ๋ง ๊ฐ MOF ๋ฐ์ดํฐ๋ก ์ฌ์ ํ์ตํ๋ฉด์๋ 20๋ฐฐ ํฐ ๋ฐ์ดํฐ์
์ผ๋ก ํ์ตํ ๋ชจ๋ธ์ ๋ฅ๊ฐํ๋ ๋ฐ์ดํฐ ํจ์จ์ ์์ธก์ ๋ฌ์ฑํ๋ค.
Motivation
- Known: ๋ค๊ณต์ฑ ์์ฌ(MOF, COF, zeolite ๋ฑ)๋ ๋์ ๋นํ๋ฉด์ ๊ณผ ์กฐ์ ๊ฐ๋ฅํ ๊ตฌ์กฐ์ ํน์ฑ์ผ๋ก ์ฐ์
์ ์ค์์ฑ์ด ํฌ๋ค. ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ๋๊ท๋ชจ ๋ฐ์ดํฐ๋ก ์ฌ์ ํ์ตํ๋ฉด ์ ์ ๋ฐ์ดํฐ๋ก๋ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ด์ง๋ง, ์ฌ๋ฃ๊ณผํ์์๋ ๋ฐ์ดํฐ ํ๋ณด๊ฐ ๋งค์ฐ ์ด๋ ต๋ค(์: ์คํ์ zeolite ๊ตฌ์กฐ 1000๊ฐ ๋ฏธ๋ง). ๊ธฐ์กด ์ฐ๊ตฌ๋ ๋ชจ๋ธ ์ํคํ
์ฒ๋ ํ์คํฌ ์ค๊ณ์ ์ ๋ฌธ ์ง์์ ๋ถ๋ถ์ ์ผ๋ก ํตํฉํ์ผ๋, ์ฌ์ ํ์ต ๋ฐ์ดํฐ ํจ์จ์ฑ ํฅ์์ ์ํ ์ ๋ฌธ ์ง์์ ์ ์ฌ๋ ฅ์ ์ถฉ๋ถํ ํ๊ตฌ๋์ง ์์๋ค.
- Gap: ๊ธฐ์กด ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ๋ฐฉ๋ํ ํ๋ จ ๋ฐ์ดํฐ๊ฐ ํ์ํ๋ฐ ์ฌ๋ฃ๊ณผํ์์ ๋๊ท๋ชจ ๋ฐ์ดํฐ ํ๋ณด๊ฐ ๋ถ๊ฐ๋ฅํ๋ฉฐ, ๋ถ์ ๋ ฅ์ฅ๊ณผ ๊ธฐํํ์ ๋ถ์ ๊ฐ์ ์ค๋๋ ๋ฌผ๋ฆฌ์ ์ง์์ ์ฌ์ ํ์ต์ ๊ฐ๋ ฅํ ๊ฐ๋
์ ํธ๋ก ์ง์ ํ์ฉํ๋ ๊ฒ์ด ๋ฏธํกํ๋ค. ํนํ ์๋ก ๋ค๋ฅธ guest ๋ถ์์ ๋ํ PES ํ๋กํ์ ์ฐจ์ด๋ฅผ ๋ฒ์ฉ ๋์คํฌ๋ฆฝํฐ๋ก ๋ณํํ๋ ๋ฌธ์ ๊ฐ ๋ฏธํด๊ฒฐ๋์ด ์๋ค.
- Why: ๋ค๊ณต์ฑ ์์ฌ๋ ์๋์งยทํ๊ฒฝ ๋ถ์ผ์ ๊ด๋ฒ์ํ ์์ฉ(๊ฐ์ค ์ ์ฅ, ๋ถ๋ฆฌ, ์ด๋งค)์ด ์์ด ๊ณ ์ฒ๋ฆฌ๋ ์คํฌ๋ฆฌ๋์ด ์ค์ํ๋, ๋ฌผ์ฑ ์์ธก์ ์ํด ํ์ฌ ๊ณ์ฐ ๋น์ฉ์ด ํฌ๋ค. ๋ฐ์ดํฐ ํจ์จ์ ์ด๋ฉด์๋ ๋ฒ์ฉ์ ์ธ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ด ์์ผ๋ฉด ์ ์์ฌ ๋ฐ๊ตด๊ณผ ์ต์ ํ๋ฅผ ๊ฐ์ํํ ์ ์๋ค.
- Approach: PES ๊ธฐ์ ํจ์๋ฅผ ๋์
ํ์ฌ Pauli ๊ตํ-๋ฐ๋ฐ ์๋์ง, London ๋ถ์ฐ ์๋์ง, Coulomb ์๋์ง๋ฅผ ์ ํ๊ฒฐํฉ์ผ๋ก ํํํ๋, ํน์ guest์ ํธํฅ๋์ง ์๊ฒ 21๊ฐ ํญ์ ํตํฉ ๋์คํฌ๋ฆฝํฐ๋ก ์ฌ์ฉํ๋ค. GNN์ผ๋ก ์ฌ๋ฃ ๊ตฌ์กฐ๋ฅผ, vision transformer๋ก ์ ํ๊ฒฐํฉ๋ PES๋ฅผ ์ธ์ฝ๋ฉํ ํ, cross-attention ๊ธฐ๋ฐ fusion ๋ชจ๋๋ก ๋ ๋ชจ๋ฌ๋ฆฌํฐ๋ฅผ ๊ฒฐํฉํ๋ค. ๋ค์ค ๊ท๋ชจ ์ฌ์ ํ์ต ํ์คํฌ(์ฌ๋ฃ ๋ ๋ฒจ: ์์ ๋ถ๋ฅ, PLD, LCD, ASA, VF; ์์ ๋ ๋ฒจ: PES ํจ์น ๋ด ์์ ์, SDF)๋ฅผ ์ค๊ณํ์ฌ ๊ธฐํํ์ ํน์ฑ์ ํ์ตํ๋ค.
Achievement
Fig. 3 | Prediction error distributions (box plots) across diverse tasks. a Gas
โข 0.1๋ฐฑ๋ง MOF๋ก ์ฌ์ ํ์ตํ SpbNet์ด 2๋ฐฑ๋ง ๊ฐ ์ด์์ ๋ค๊ณต์ฑ ์์ฌ, 1.2์ต ๊ฐ ๋ถ์ยท์ฌ๋ฃ ์ํ๋ก ํ์ตํ ๊ธฐ์กด ๋ชจ๋ธ์ ์๋์ค์ฐจ 20% ์ด์ ๊ฐ์์ํค๋ฉฐ ๋ฅ๊ฐ
โข 40๊ฐ ์ด์ MOF ๋ฒค์น๋งํฌ(๊ฐ์ค ํก์ฐฉ, ๋ถ๋ฆฌ, ํ์ฑ๋ฅ ๋ฑ)์์ ์ผ๊ด๋๊ฒ ์ฐ์ํ ์ฑ๋ฅ
โข COF, PPN, zeolite ๋ฑ ๋ถํฌ ์ธ ์ฌ๋ฃ์ ๋ํด์๋ ๊ฐํ ์ผ๋ฐํ ๋ฅ๋ ฅ ์
์ฆ
โข ๋ ์ด๋ธ ํจ์จ์ฑ ์คํ์์ ์ ํ๋ ๋ฏธ์ธ์กฐ์ ๋ฐ์ดํฐ๋ก๋ ์ฐ์ํ ์ฑ๋ฅ ์ ์ง
How
Fig. 1 | Overall training pipeline of SpbNet. SpbNet consists of four main parts: (1)
โข PES ๊ธฐ์ ํจ์์ ์ ํ๊ฒฐํฉ์ ํตํ 21์ฑ๋ 3D ์ด๋ฏธ์ง ํํ์ผ๋ก ๋ถ์ ํธํฅ ์ ๊ฑฐ
โข Dual-stream multi-modal ์ํคํ
์ฒ(GNN + Vision Transformer + cross-attention)๋ก ๊ตฌ์กฐ์ ์๋์ง ์ ๋ณด ๋
๋ฆฝ์ ์ฒ๋ฆฌ ๋ฐ ํจ์จ์ ์ตํฉ
โข Multi-scale ์ฌ์ ํ์ต ํ์คํฌ(์์, ๊ณต๊ทน ํฌ๊ธฐ, ํ๋ฉด์ , ์ ๊ทผ์ฑ ๋ฑ)๋ก ๋ค์ํ ๊ณต๊ฐ ๊ท๋ชจ์ ๊ธฐํํ์ ํน์ฑ ํ์ต
โข Multi-head fine-tuning ์ ๋ต์ผ๋ก ๋ค์ํ downstream ํ์คํฌ์ ์ ์ ์ ์
Originality
โข PES ๊ธฐ์ ํจ์๋ฅผ ๋ฒ์ฉ ๋์คํฌ๋ฆฝํฐ๋ก ๋์
ํ์ฌ ๊ฒ์คํธ ๋ถ์๋ณ ํธํฅ ์ ๊ฑฐ โ ๊ธฐ์กด์ ๋ถ์ ํน์ด์ PES ํํ์ ํ๊ณ ๊ทน๋ณต
โข Dual-stream multi-modal ์ค๊ณ์์ GNN๊ณผ vision transformer์ ์ด์ง์ ํํ์ cross-attention์ผ๋ก ์ตํฉ โ ๊ฐ ๋ชจ๋ฌ๋ฆฌํฐ์ ๋ค์์ฑ ์ ์ง
โข ์ ๋ฌธ ๋ฌผ๋ฆฌ ์ง์(๋ถ์ ๋ ฅ์ฅ, ๊ธฐํํ์ ๋ถ์)์ ์ง์ ๊ฐ๋
์ ํธ๋ก ํตํฉํ์ฌ ์ฌ์ ํ์ต ๋ฐ์ดํฐ ํจ์จ์ฑ ํฅ์ โ ๊ธฐ์กด์ ๋ถ๋ถ์ ์ง์ ํ์ฉ์ ๋์ด์ ์ฒด๊ณ์ ์ ๊ทผ
Limitation & Further Study
โข ์ฌ์ ํ์ต์ MOF ์ค์ฌ์ด๋ฏ๋ก ๋ค๋ฅธ ๋ค๊ณต์ฑ ์์ฌ์์์ ์ฑ๋ฅ ์ํ ๋ถ๋ช
ํ
โข PES ๊ธฐ์ ํจ์ 21๊ฐ ํญ์ ์ ํ ๊ทผ๊ฑฐ์ ์ต์ ์ฑ์ ๋ํ ์์ธํ ๋ถ์ ๋ถ์กฑ
โข ๋ค์ํ GNN ์ํคํ
์ฒ์ ๋ํ ์ฒด๊ณ์ ๊ฒ์ฆ ๋ถ์กฑ
โข ํฐ ๊ท๋ชจ downstream ํ์คํฌ์์์ ๋ฏธ์ธ์กฐ์ ์๋ ด ํน์ฑ๊ณผ ๊ณผ์ ํฉ ์ํ์ ๋ํ ๋
ผ์ ํ์
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ expert knowledge๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ํตํฉํ ํ์ ์ ์ฌ์ ํ์ต ํ๋ ์์ํฌ๋ก, ๋ฐ์ดํฐ ๋ถ์กฑ์ด ์ฌ๊ฐํ ์ฌ๋ฃ๊ณผํ ๋ถ์ผ์์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ์ค์ฉ์ ๊ฐ๋ฅ์ฑ์ ์
์ฆํ๋ค. PES ๊ธฐ์ ํจ์์ ๋์
๊ณผ dual-stream ์ํคํ
์ฒ์ ์ค๊ณ๊ฐ ์ฐ์ํ๊ณ , ๊ด๋ฒ์ํ ๋ฒค์น๋งํฌ์์ ๊ฐํ ๋ฐ์ดํฐ ํจ์จ์ฑ์ ๋ณด์ธ๋ค. ๋ค๋ง ๊ธฐ์ ํจ์ ์ ํ์ ์ต์ ์ฑ ๋ถ์ ๋ฐ ๋ค์ํ ์์ฌ๊ตฐ์์์ ์์คํ
์ ํ๊ฐ ๊ฐํ๊ฐ ์๊ตฌ๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
344๋ฒ ๋
ผ๋ฌธ์ ๋ฐ์ด์ค/์์ฌ ๋ถ์ผ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ๊ตฌ์กฐ์ ํ ๋์ ๋ฐ์ ๋ฐฉํฅ์ ์ฌ๋ ๊น๊ฒ ๋ค๋ค SpbNet ๊ธฐ์ด ์ดํด์ ๋์์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
343๋ฒ ๋
ผ๋ฌธ์ ์์ฌ ๊ณผํ์์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ์ ๋ฐ์ ๋ค๋ฃจ๋ฏ๋ก, SpbNet์ ๋งฅ๋ฝ์ด๋ ํ์ฅ์ ๋ต ๋
ผ์์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
325 ๋
ผ๋ฌธ์ ํฉ๊ธ ์ค๊ณยท๋ฐ๊ฒฌ์์ physics-aware agentic ์์คํ
์ ๋์
ํด, SpbNet๊ณผ ๋ฌผ์ง ์ค๊ณ ๋ฌธ์ ํด๊ฒฐ ๋ฐฉ์์์ ๋น๊ต๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ค๊ณต์ฑ ์์ฌ์ ํนํ๋ ๋ฐ์ดํฐ ํจ์จ์ ์ฌ๋ฃ ๋ถ์ผ ํ๋ผ์ ๋ชจ๋ธ์ ์ฌ๋ก๋ก, ML ๊ธฐ๋ฐ ๊ณ ์ฐจ์ ์ฌ๋ฃ ์๋ฎฌ๋ ์ด์
์ ๋ ๋ค๋ฅธ ๋ฐฉํฅ์ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
516๋ฒ ๋
ผ๋ฌธ์ ๊ธฐ๊ณํ์ต ๊ธฐ๋ฐ ์์๊ฐ ํผํ
์
์์ธก์ ํนํ๋ ๋ฆฌ๋ทฐ๋ก์, SpbNet์ ์ฅ๋จ์ ์ ๋ฌผ๋ฆฌ์ ๋งฅ๋ฝ์์ ๋น๊ต ๋ถ์ํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ค๋ฅธ ํ์ฅ ๊ฐ๋ฅํ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๊ธฐ๋ฐ ๋ถ์ ์๋ฎฌ๋ ์ด์
์ ๊ทผ๋ฒ์ ์ ์ํ์ฌ, ๋ค์์ค ์คํ ํ๊ฒฝ์์์ ์ฐํฉํ์ต ์ ์ฉ๊ณผ ๋น๊ตํ ๊ฐ์น๋ฅผ ๊ฐ์ง๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ค๊ณต์ฑ ์์ฌ์ ํนํ๋ ๊ณ ํจ์จ ์์ ๋ฐ์ดํฐ ํ์ต ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ํตํด, ๋ฐฐํฐ๋ฆฌ/์ ํด์ง ์ฉ๋งคํ ์์ธก๊ณผ ์ ์ฌํ ๋ฌธ์ ๋ฅผ ํ ๋ฐ์ดํฐ/๊ตฌ์กฐ ๊ธฐ๋ฐ ์ ๊ทผ์ผ๋ก ํด๊ฒฐํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
2995 ๋
ผ๋ฌธ์ DFT ๋์ฒด๋ฅผ ๋ชฉํ๋ก ํ๋ ML ๊ธฐ๋ฐ interatomic potential์ ํจ๋ฌ๋ค์ ์ ํ ๋
ผ์๋ก, 2986์ ๋ค๊ณต์ฑ ์์ฌ ํนํ ์ํคํ
์ฒ์ ๊ฐ์ ๋์ ์ ๋ค๋ฃน๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ค๊ณต์ฑ ์์ฌ(์: ZIF) ํ์ฑ ๋ฉ์ปค๋์ฆ์ ๋ฐ์ดํฐ ํจ์จ์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๊ธฐ๋ฐ ์๋ฎฌ๋ ์ด์
์ผ๋ก ๊ท๋ช
ํ๋ ๋์กฐ์ ์ฐ๊ตฌ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ธฐ์กด ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๊ธฐ๋ฐ ๋ค๊ณต์ฑ ๋ฌผ์ง ์๋ฎฌ๋ ์ด์
๋ฐ์ดํฐ์
๊ณผ ๋ณธ ๋
ผ๋ฌธ์์ ์ ์ํ๋ ๊ณ ์จ ๊ณ ์ฒด์ ํด์ง ๋ฐ์ดํฐ์
์ ๋น๊ต๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
372๋ฒ ๋
ผ๋ฌธ์ ์ ๋๋ด ํผํฌ์ฆ MLIP ๊ฐ๋ฐ ์ฌ๋ก๋ก, SpbNet์ด ์ ์ํ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ์์ฌ ํ์ฅ์ฑ๊ณผ ์ง์ ์ ์ผ๋ก ์ฐ๊ณ๋ฉ๋๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์