DiffSyn: a generative diffusion approach to materials synthesis planning

์ €์ž: Elton Pan, Soonhyoung Kwon, Sulin Liu, Mingrou Xie, Alexander J. Hoffman, Yifei Duan, Thorben Prein, Killian Sheriff, Yuriy Roman-Leshkov, Manuel Moliner, Rafael Gomez-Bombarelli, Elsa A. Olivetti | ๋‚ ์งœ: 2026-02-12 | DOI: 10.1038/s43588-025-00949-9 📄 PDF


Essence

DiffSyn์€ 50๋…„์น˜ 23,961๊ฑด์˜ ์ œ์˜ฌ๋ผ์ดํŠธ ํ•ฉ์„ฑ ๋ ˆ์‹œํ”ผ๋กœ ํ•™์Šต๋œ generative diffusion model์œผ๋กœ, ๋ชฉํ‘œ ์ œ์˜ฌ๋ผ์ดํŠธ ๊ตฌ์กฐ์™€ ์œ ๊ธฐ ํ…œํ”Œ๋ฆฟ์ด ์ฃผ์–ด์กŒ์„ ๋•Œ ํ™•๋ฅ ์  ํ•ฉ์„ฑ ๊ฒฝ๋กœ๋ฅผ ์ƒ์„ฑํ•˜๋ฉฐ, ์‹ค์ œ UFI ์†Œ์žฌ ํ•ฉ์„ฑ์„ ํ†ตํ•ด ๊ฒ€์ฆ๋˜์—ˆ๋‹ค.

Motivation

Achievement

How

Originality

Limitation & Further Study

Evaluation

Novelty: 5/5 Technical Soundness: 4/5 Significance: 5/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: DiffSyn์€ diffusion model์„ ๋ฌผ์งˆ ํ•ฉ์„ฑ ๊ฒฝ๋กœ ์ƒ์„ฑ์— ์ฐฝ์˜์ ์œผ๋กœ ์ ์šฉํ•˜์—ฌ, ๊ธฐ์กด ํŒ๋ณ„ ๋ชจ๋ธ๋กœ ํฌ์ฐฉํ•  ์ˆ˜ ์—†๋˜ ๋‹ค์ค‘ ๋ชจ๋“œ ๊ตฌ์กฐ-ํ•ฉ์„ฑ ๊ด€๊ณ„๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ•™์Šตํ•œ๋‹ค. ์‹ค์ œ UFI ์†Œ์žฌ ํ•ฉ์„ฑ ๊ฒ€์ฆ๊ณผ ๊ณต๊ฐœ ๋ฐ์ด์…‹ ์ œ๊ณต์œผ๋กœ ๋†’์€ ์˜ํ–ฅ๋ ฅ์„ ๊ธฐ๋Œ€ํ•  ์ˆ˜ ์žˆ์œผ๋‚˜, ๋‹ค๋ฅธ ๋ฌผ์งˆ์œผ๋กœ์˜ ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ๊ณผ ์ƒ์„ฑ ๊ฒฝ๋กœ์˜ ์‹ ๋ขฐ์„ฑ ํ‰๊ฐ€ ์ฒด๊ณ„ํ™”๊ฐ€ ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
OSDA Agent ๋…ผ๋ฌธ์€ ์ œ์˜ฌ๋ผ์ดํŠธ ํ•ฉ์„ฑ์—์„œ LLM ๊ธฐ๋ฐ˜ de novo ์„ค๊ณ„ ์ž๋™ํ™” ์‚ฌ๋ก€๋ฅผ ์ œ์‹œ, DiffSyn์˜ diffusion ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์ƒ์„ฑ ํ•ฉ์„ฑ๋ฒ•๊ณผ ์ƒํ˜ธ ๋ณด์™„์ ์ธ ๋น„๊ต ์—ฐ๊ตฌ๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
3077 ๋…ผ๋ฌธ์€ ์žฌ๋ฃŒ ํ•ฉ์„ฑ ๊ฒฝ๋กœ ๋ฐ ๋ฏธ์„ธ๊ตฌ์กฐ ์ƒ์„ฑ์— diffusion ๊ธฐ๋ฐ˜ ์‹ ๊ฒฝ๋ง์„ ์ ์šฉํ•˜์—ฌ, 3173์˜ Molecular Crystal ๊ตฌ์กฐ ์˜ˆ์ธก ๋ชจ๋ธ์˜ ๊ธฐ๋ฐ˜ ๊ฐœ๋…์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ธฐ์ดˆ ๋ถ„์ž๋ถ„ํฌ ํ•™์Šต ๊ธฐ๋ฐ˜์˜ ์ƒ์„ฑ์  ๋ชจ๋ธ๋กœ, DiffSyn๊ณผ ์œ ์‚ฌํ•œ ๊ตฌ์กฐยทํ•ฉ์„ฑ ๊ณ„ํš ๋ชจ๋ธ์˜ ์ด๋ก ์  ๋ฐ”ํƒ• ์—ญํ• ์„ ํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฌด๊ธฐ๋ฌผ ํ•ฉ์„ฑ ๋ฐ ์—ญ์„ค๊ณ„์—์„œ ์ƒ์„ฑ AI ๋ฐฉ๋ฒ•์˜ ๋ฐ์ดํ„ฐ-ํ‘œํ˜„-๋ชจ๋ธ ํŒŒ์ดํ”„๋ผ์ธ์„ ์ฒด๊ณ„์ ์œผ๋กœ ์ •๋ฆฌํ•จ.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ œ์˜ฌ๋ผ์ดํŠธ ๋˜๋Š” ๋‹ค๊ณต์„ฑ ์†Œ์žฌ ํ•ฉ์„ฑ์„ ์œ„ํ•œ ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ์œ ์‚ฌํ•œ ๋ฐฉ๋ฒ•๋ก ์„ ๋‹ค๋ฃจ๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์†Œ์žฌ ํ•ฉ์„ฑ ๋ ˆ์‹œํ”ผ ์ƒ์„ฑ ๋˜๋Š” ์ตœ์ ํ™”๋ฅผ ์œ„ํ•œ ์ƒ์„ฑ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์†Œ์žฌ ํ•ฉ์„ฑ ์กฐ๊ฑด ์˜ˆ์ธก์„ ์œ„ํ•œ ์ƒ์„ฑ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๋Œ€์•ˆ์  ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
retrieval-augmented generative AI๋กœ ์†Œ์žฌ ํ•ฉ์„ฑ ๊ฒฝ๋กœ๋‚˜ ์ƒˆ๋กœ์šด ์กฐ์„ฑ์„ ์ƒ์„ฑํ•˜๋Š” ๋™์‹œ๋Œ€ ๋ฐฉ๋ฒ•๋ก ์„ ๋น„๊ตํ•จ.
๋‹ค๋ฅธ ์ ‘๊ทผ
DiffSyn ๋…ผ๋ฌธ์„ ํ†ตํ•ด ์ƒ์„ฑํ˜• ํ™•์‚ฐ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์†Œ์žฌ ํƒ์ƒ‰ ๋ฐ ์‹คํ—˜ ๋ฐ์ดํ„ฐ๋ถ€ํ„ฐ ๊ตฌ์กฐ ์ƒ์„ฑ๊นŒ์ง€ ์ ์šฉ์ด ๋Œ€์•ˆ์  ๊ด€์ ์—์„œ ์ œ์‹œ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
3077๋ฒˆ ๋…ผ๋ฌธ์€ ๊ฒฐ์ • ์†Œ์žฌ ํ•ฉ์„ฑ์„ ์œ„ํ•œ diffusion ๊ธฐ๋ฐ˜ ์ƒ์„ฑ ์ ‘๊ทผ๋ฒ•์œผ๋กœ, DMFlow์™€๋Š” ๋‹ฌ๋ฆฌ ์žฌ๋ฃŒ ํ•ฉ์„ฑ ๊ฒฝ๋กœ์— ์ดˆ์ ์„ ๋งž์ถฅ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ƒ์„ฑ์  ํ™•์‚ฐ ๊ธฐ๋ฐ˜ ์†Œ์žฌ ์„ค๊ณ„ ์ ‘๊ทผ์œผ๋กœ, 3230์˜ ์†Œ์žฌ ์‹œ์Šคํ…œ์—์„œ ํ•˜๋“œ์›จ์–ด ์ˆ˜์ค€ ์—ฐ์‚ฐ ์‘์šฉ๊ณผ ๋Œ€๋น„๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
DiffSyn ๋…ผ๋ฌธ์€ diffusion model์„ ํ™œ์šฉํ•œ ๋ฌผ์งˆ ํ•ฉ์„ฑ์„ ๋‹ค๋ฃจ๋ฉฐ, CSMC Sampler์™€ ๋น„๊ต๋˜๋Š” ์ƒˆ๋กœ์šด ์ƒ˜ํ”Œ๋ง ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
DiffSyn์€ ์ƒ์„ฑํ˜• ํ™•์‚ฐ์„ ํ†ตํ•œ ์†Œ์žฌ ํ•ฉ์„ฑ ๊ฒฝ๋กœ ํƒ์ƒ‰์œผ๋กœ, 3119์˜ Flow-based ๋ชจ์‚ฌ ๋ฐฉ๋ฒ•๊ณผ ๋น„๊ต ๊ฐ€๋Šฅํ•œ ์ƒ์„ฑ์  ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ™•์‚ฐ ๋ชจ๋ธ์„ ์†Œ์žฌ ํ•ฉ์„ฑ ๊ฒฝ๋กœ ์ƒ์„ฑ์— ์ ์šฉํ•˜๋Š” ๋Œ€์•ˆ์  ์ ‘๊ทผ๋ฒ•์„ ์ œ์•ˆํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์†Œ์žฌ ํ•ฉ์„ฑ ์กฐ๊ฑด ์˜ˆ์ธก ๋ฐ ์ƒ์„ฑ์„ ์œ„ํ•œ ๊ด€๋ จ ๋จธ์‹ ๋Ÿฌ๋‹ ์ ‘๊ทผ๋ฒ•์„ ๋‹ค๋ฃจ๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ๋ถ„์ž ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ํ™œ์šฉํ•ด ์ƒ์„ฑ์  ์žฌ๋ฃŒ ํƒ์ƒ‰์„ ์ง€์›ํ•˜๋Š” ๋Œ€์•ˆ์  ์ ‘๊ทผ ์‚ฌ๋ก€์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฌผ๋ฆฌ ์ƒ์„ฑ๋ชจ๋ธ์—์„œ ๋ณตํ•ฉ์  ๋ถ„ํฌ๋ฅผ ํ•™์Šตํ•˜๋Š” ํ™•๋ฅ ์  ์ƒ์„ฑ๋ชจ๋ธ๋กœ AlloyVAE ๋Œ€์‹  ์“ธ ์ˆ˜ ์žˆ๋Š” ๋Œ€์•ˆ ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
3077์€ ๋ฐ”์ด๋Ÿฌ์Šค ๋Œ์—ฐ๋ณ€์ด ๋ฐ RNA ๊ตฌ์กฐ ์˜ˆ์ธก์„ ์œ„ํ•œ diffusion ๊ธฐ๋ฐ˜ ์ƒ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, 3277 VARIANT์˜ ๋ฐ”์ด๋Ÿฌ์Šค ์œ ์ „์ฒด ๋ถ„์„ ์›น ์„œ๋ฒ„์™€ ๋น„๊ต ํ™œ์šฉ์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Hamiltonian ์˜ˆ์ธก๊ณผ ๊ตฌ์กฐ ํŠน์„ฑ ์˜ˆ์ธก ๋“ฑ ์—ญ๋ฐฉํ–ฅ ยท ์ƒ์„ฑ์  ๋ฌผ์„ฑ ์˜ˆ์ธก ์—ฐ๊ตฌ์— ์ง์ ‘์ ์ธ ์—ฐ๊ฒฐ๊ณ ๋ฆฌ๊ฐ€ ์žˆ์Œ.
์‘์šฉ ์‚ฌ๋ก€
์‹ค์ œ ์ œ์˜ฌ๋ผ์ดํŠธ ํ•ฉ์„ฑ inverse design์— ์ƒ์„ฑ AI๋ฅผ ๋„์ž…ํ•œ ๊ฒ€์ฆ ์‚ฌ๋ก€์ž„.
์‘์šฉ ์‚ฌ๋ก€
Synthegy ํ”„๋ ˆ์ž„์›Œํฌ์˜ ํ™”ํ•™ ํ•ฉ์„ฑ ๊ฒฝ๋กœ ํ‰๊ฐ€ ๋ฐฉ์‹๊ณผ DiffSyn์˜ ์ƒ์„ฑ์  ๋ ˆ์‹œํ”ผ ์ œ์•ˆ ๋ฐฉ๋ฒ•์ด ํ™”ํ•™ ํ•ฉ์„ฑ ํ”Œ๋ž˜๋‹์—์„œ ์ƒํ˜ธ ์—ฐ๊ฒฐ๋œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •