Scaling Deep Learning for Materials Discovery

์ €์ž: Amil Merchant, Simon Batzner, Samuel S. Schoenholz, Muratahan Aykol, Gowoon Cheon, Ekin Dogus Cubuk | ๋‚ ์งœ: 2023 | DOI: 10.1038/s41586-023-06735-9 📄 PDF


Essence

Figure 1

GNoME ๊ธฐ๋ฐ˜ ํšจ์œจ์  ๋ฐœ๊ฒฌ. (a) ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ํ•„ํ„ฐ๋ง๊ณผ DFT์˜ ๋ฐ์ดํ„ฐ ํ”ผ๋“œ๋ฐฑ ๋ฃจํ”„, (b) 381,000๊ฐœ์˜ ์‹ ๊ทœ ์•ˆ์ • ๋ฌผ์งˆ ๋ฐœ๊ฒฌ์œผ๋กœ ๊ธฐ์กด ๋Œ€๋น„ ๊ฑฐ์˜ 10๋ฐฐ ์ฆ๊ฐ€, (c) 736๊ฐœ ๊ตฌ์กฐ์˜ ๋…๋ฆฝ์  ์‹คํ—˜ ๊ฒ€์ฆ, (d) 6๊ฐœ ์›์†Œ ํฌํ•จ ๋ฌผ์งˆ๊นŒ์ง€ ํ™•์žฅ๋œ ์˜ˆ์ธก ๋Šฅ๋ ฅ

๊ทธ๋ž˜ํ”„ ์‹ ๊ฒฝ๋ง(GNN)์„ ๋Œ€๊ทœ๋ชจ๋กœ ํ•™์Šต์‹œํ‚จ GNoME(Graph Networks for Materials Exploration) ๋ชจ๋ธ์„ ํ†ตํ•ด ๋ฌผ์งˆ ์•ˆ์ •์„ฑ ์˜ˆ์ธก์—์„œ ์ „๋ก€ ์—†๋Š” ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜์˜€์œผ๋ฉฐ, 220๋งŒ ๊ฐœ์˜ ์‹ ๊ทœ ์•ˆ์ • ๊ฒฐ์ •์งˆ ๊ตฌ์กฐ๋ฅผ ๋ฐœ๊ฒฌํ•˜์—ฌ ์ธ๋ฅ˜๊ฐ€ ์•Œ๊ณ  ์žˆ๋Š” ์•ˆ์ • ๋ฌผ์งˆ์„ ์•ฝ 10๋ฐฐ ํ™•์žฅํ–ˆ๋‹ค.

Motivation

Achievement

Figure 2

๋ฐœ๊ฒฌ๋œ ์•ˆ์ • ๊ฒฐ์ •์งˆ์˜ ์š”์•ฝ. (a) 4๊ฐœ ์ด์ƒ ์›์†Œ๋ฅผ ํฌํ•จํ•œ ๋ฌผ์งˆ์—์„œ GNoME์˜ ์šฐ์ˆ˜ํ•œ ๋ฐœ๊ฒฌ ํšจ์œจ, (b) 4์›๊ณ„(quaternary) ๋ฌผ์งˆ์˜ ์œ„์ƒ ๋ถ„๋ฆฌ ์—๋„ˆ์ง€ ๋ถ„ํฌ

  1. ๋ฌผ์งˆ ๋ฐœ๊ฒฌ์˜ ํš๊ธฐ์  ํ™•์žฅ: 381,000๊ฐœ์˜ ์‹ ๊ทœ ์•ˆ์ • ๋ฌผ์งˆ ๋ฐœ๊ฒฌ์œผ๋กœ ์ด 421,000๊ฐœ์˜ ์•ˆ์ • ๊ฒฐ์ •์งˆ ์นดํƒˆ๋กœ๊ทธ ๊ตฌ์„ฑ (๊ธฐ์กด ๋Œ€๋น„ ์•ฝ 10๋ฐฐ ์ฆ๊ฐ€). ์ด ์ค‘ 736๊ฐœ ๊ตฌ์กฐ๊ฐ€ ๋…๋ฆฝ์ ์œผ๋กœ ์‹คํ—˜ ๊ฒ€์ฆ๋จ
  2. ์˜ˆ์ธก ์„ฑ๋Šฅ์˜ ํ˜„์ €ํ•œ ํ–ฅ์ƒ:
    • ์—๋„ˆ์ง€ ์˜ˆ์ธก ์˜ค์ฐจ๋ฅผ 11 meV/atom์œผ๋กœ ๊ฐ์†Œ (๊ธฐ์กด 28 meV/atom)
    • ๊ตฌ์กฐ ์ •๋ณด ๊ธฐ๋ฐ˜ ์•ˆ์ •์„ฑ ์˜ˆ์ธก ์ •ํ™•๋„(hit rate) 80% ์ด์ƒ ๋‹ฌ์„ฑ (๊ธฐ์กด 1% ๋Œ€๋น„)
    • ์กฐ์„ฑ ์ •๋ณด๋งŒ์œผ๋กœ 100์‹œ๋„๋‹น 33% ์ •ํ™•๋„ (๊ธฐ์กด 1%)
  3. ์‹ ํฅ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ: ํ•™์Šต ๋ฐ์ดํ„ฐ์— ์—†๋˜ 5๊ฐœ ์ด์ƒ ์›์†Œ๋ฅผ ํฌํ•จํ•œ ๊ตฌ์กฐ์— ๋Œ€ํ•œ ์ •ํ™•ํ•œ ์˜ˆ์ธก, ์ž„์˜ ๊ตฌ์กฐ ํƒ์ƒ‰์œผ๋กœ๋ถ€ํ„ฐ์˜ ๋ถ„ํฌ ์™ธ(out-of-distribution) ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ๊ฐ•๊ฑด์„ฑ ํ™•๋ณด
  4. ํ•˜์œ„ ์‘์šฉ ๋ชจ๋ธ๋ง ๋Šฅ๋ ฅ: ๋Œ€๊ทœ๋ชจ ์ด๋ฐฉ์„ฑ ์ƒํ˜ธ์ž‘์šฉ ํฌํ…์…œ(equivariant interatomic potentials) ํ•™์Šต์œผ๋กœ ๋ถ„์ž๋™์—ญํ•™(molecular dynamics) ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ ์ด์˜จ ์ „๋„๋„ ์˜์  ์ƒท(zero-shot) ์˜ˆ์ธก ๊ฐ€๋Šฅ

How

Figure 3

ํ•™์Šต๋œ ์ƒํ˜ธ์ž‘์šฉ ํฌํ…์…œ ์Šค์ผ€์ผ๋ง. ์ด๋ฐฉ์„ฑ ์‹ ๊ฒฝ๋ง ํฌํ…์…œ์˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ์—ฐ๊ตฌ๋Š” ๊ทธ๋ž˜ํ”„ ์‹ ๊ฒฝ๋ง์˜ ๋Œ€๊ทœ๋ชจ ํ•™์Šต๊ณผ ๋Šฅ๋™ ํ•™์Šต์„ ๊ฒฐํ•ฉํ•˜์—ฌ ๋ฌด๊ธฐ ๊ฒฐ์ •์งˆ ๋ฐœ๊ฒฌ์— ํ˜๋ช…์„ ์ผ์œผํ‚จ ํš๊ธฐ์  ์„ฑ๊ณผ๋กœ, 220๋งŒ ๊ฐœ ์‹ ๊ทœ ๋ฌผ์งˆ ๋ฐœ๊ฒฌ๊ณผ ์‹ ํฅ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ ๋‹ฌ์„ฑ์œผ๋กœ ๊ณ„์‚ฐ ๋ฌผ์งˆ ๊ณผํ•™์˜ ์ƒˆ๋กœ์šด ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์ œ์‹œํ•˜๋ฉฐ, Nature ์ตœ๊ณ  ์ˆ˜์ค€์˜ ํ•™์ œ ๊ฐ„ ๊ธฐ์—ฌ๋ฅผ ์ž…์ฆํ•œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์žฌ๋ฃŒ ๋ฐœ๊ฒฌ์šฉ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์ตœ์‹  ๋™ํ–ฅ์„ ์ข…ํ•ฉ์ ์œผ๋กœ ์ •๋ฆฌํ•œ ๋…ผ๋ฌธ์œผ๋กœ, GNoME์˜ ์ด๋ก ยท์‘์šฉ์  ๊ธฐ๋ฐ˜์„ ๊ฐ•ํ™”ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์žฌ๋ฃŒ ๋ฐ ๋ฐ”์ด์˜ค๋งˆ์ปค ๋ฐ์ดํ„ฐ์˜ ํ†ตํ•ฉ๊ณผ ๋Œ€๊ทœ๋ชจ ํ•™์Šต์„ ํ†ตํ•ด ์‹ค์ œ ์ž„์ƒ ๋ฐ ์ง„๋‹จ์—์„œ AI๊ฐ€ ์–ด๋–ป๊ฒŒ ํ™œ์šฉ๋˜๋Š”์ง€์— ๋Œ€ํ•œ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
695๋ฒˆ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์†Œ์žฌยท์˜์ƒ๋ช… ๋ถ„์•ผ ์—ฐ์†ํ•™์Šต์˜ ํ™•์žฅ์„ฑ ๋ฐ ํ•œ๊ณ„๋ฅผ ๋น„๊ต ๋ถ„์„ํ•˜์—ฌ, few-shot ์—ฐ์† ํ•™์Šต ์ „๋žต์˜ ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Œ€๊ทœ๋ชจ ๋”ฅ๋Ÿฌ๋‹์„ ํ†ตํ•œ ์†Œ์žฌ ๋ฐœ๊ฒฌ์˜ ํ™•์žฅ์„ฑ ๋ฐ ๊ณ ์ฒ˜๋ฆฌ๋Ÿ‰ ์Šคํฌ๋ฆฌ๋‹์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์žฌ๋ฃŒ ๋ฐœ๊ฒฌ์—์„œ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์™€ AI ๋ชจ๋ธ์„ ๊ฒฐํ•ฉํ•˜๋Š” ์ ‘๊ทผ๋ฒ•์˜ ๊ทผ๋ณธ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•˜๋Š” ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ์†Œ์žฌ ์˜ˆ์ธก๊ณผ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ์ถ”์ถœ์— ํ•„์š”ํ•œ ์Šค์ผ€์ผ๋ง ์ „๋žต์„ ๋‹ด์€ ๊ธฐ๋ฐ˜์  ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Œ€๊ทœ๋ชจ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ํ™œ์šฉํ•œ ์†Œ์žฌ ๋ฐœ๊ฒฌ ์„ฑ๊ณผ๋ฅผ ์ข…ํ•ฉ์ ์œผ๋กœ ๊ฒ€ํ† ํ•˜์—ฌ, ๋ชจ๋ธ ํฌ๊ธฐ ๋ฐ ํ‘œํ˜„๋ ฅ์ด ์‹ค์ œ ์˜ˆ์ธก ์„ฑ๋Šฅ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ์‹ฌ์ธต์ ์œผ๋กœ ๋…ผ์˜ํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
695๋ฒˆ ๋…ผ๋ฌธ์€ ์†Œ์žฌ ๋ฐœ๊ฒฌ์—์„œ ๋Œ€๊ทœ๋ชจ ํ•™์Šต ๋ฐ ์Šˆํผ์ปด ๋™ํ–ฅ์„ ๋‹ค๋ฃจ์–ด, 3092์˜ exascale multi-task GFM ๊ตฌ์ถ• ๋…ธ๋ ฅ์˜ ๊ธฐ๋ฐ˜์  ๋งฅ๋ฝ์„ ์ค๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ์†Œ์žฌ/์ƒ์ฒด ๊ตฌ์กฐ ์˜ˆ์ธก์˜ ์Šค์ผ€์ผ ํ™•์žฅ ๋ฐ ๋ชจ๋ธ๋ง ๋ฐฉ๋ฒ•๋ก ์˜ ๋Œ€ํ˜•ํ™” ๊ด€์  ์ด๋ก ์  ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
695๋Š” ๋Œ€๊ทœ๋ชจ ๋”ฅ๋Ÿฌ๋‹์„ ํ†ตํ•ด ์žฌ๋ฃŒ ๋ฐœ๊ฒฌ์˜ ํ™•์žฅ์„ฑ์„ ๋…ผ์˜ํ•˜๋ฉฐ, 758์˜ ์—‘์‚ฌ์Šค์ผ€์ผ ์Šˆํผ์ปดํ“จํŒ… ํ™œ์šฉ ๊ด€์ ๊ณผ ์ƒํ˜ธ๋ณด์™„์ ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Scaling Deep Learning for Materials Discovery ๋…ผ๋ฌธ์€ state-space model type์˜ ๊ณ„์‚ฐ ํšจ์œจ ๋ฌธ์ œ ๊ทน๋ณต์„ ์œ„ํ•œ ๋‹ค์–‘ํ•œ ์Šค์ผ€์ผ๋ง ๊ธฐ๋ฒ•์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
695๋Š” ๊ทธ๋ž˜ํ”„ ์‹ ๊ฒฝ๋ง ๊ธฐ๋ฐ˜ ์†Œ์žฌ๋ฐœ๊ฒฌ์„, 684๋Š” ๋กœ๋ด‡-์‹คํ—˜ ๊ธฐ๋ฐ˜ ํ™”ํ•™๊ณต๊ฐ„ ํƒ์ƒ‰์„ ๊ฐ๊ธฐ ๋Œ€์กฐ์ ์œผ๋กœ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Scaling Deep Learning for Materials Discovery ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์‹ฌ์ธตํ•™์Šต ๋ชจ๋ธ์„ ์†Œ์žฌ ๋ฐœ๊ฒฌ์— ์ ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๋‹ค๋ฃจ์–ด, ๋ถ„์ž๋™์—ญํ•™ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ฐ€์†ํ™”์™€ ๋Œ€๊ทœ๋ชจ ML์˜ ํ†ตํ•ฉ์  ๊ด€์ ์„ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋Œ€๊ทœ๋ชจ ๊ทธ๋ž˜ํ”„์‹ ๊ฒฝ๋ง์„ ํ™œ์šฉํ•œ ๋ฌผ์งˆ ์•ˆ์ •์„ฑ ์˜ˆ์ธก๊ณผ ์ƒ์„ฑ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์ƒ๋ฌผ๋ถ„์ž ์ƒํ˜ธ์ž‘์šฉ ๋ถ„ํฌ ํ•™์Šต์ด๋ผ๋Š” ์œ ์‚ฌ ์ ‘๊ทผ์ด ๋น„๊ต ๊ฐ€์น˜๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
695๋Š” ์†Œ์žฌ ๋ฐœ๊ฒฌ์„ ์œ„ํ•œ ๋Œ€๊ทœ๋ชจ ๋”ฅ๋Ÿฌ๋‹ ํ•™์Šต ํ™•์žฅ ์ด์Šˆ๋ฅผ ๋‹ค๋ฃจ๊ณ , 354๋Š” LLM์˜ ๋ณ‘๋ ฌ ๋ถ„์‚ฐ ํ•™์Šต/๋ฐฐํฌ์˜ ์‹ค์šฉ ๊ฐ€์ด๋“œ๋ฅผ ์ œ๊ณตํ•ด ์„œ๋กœ ํ™•์žฅ์„ฑ์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
PDE ์†”๋ฒ„๋ฅผ ์œ„ํ•œ ๋Œ€์•ˆ์  ํŠธ๋žœ์Šคํฌ๋จธ ๊ธฐ๋ฐ˜ ์‹ ๊ฒฝ๋ง ์ ‘๊ทผ๋ฒ•์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์žฌ๋ฃŒ ํƒ์ƒ‰์„ ์œ„ํ•œ ๋Œ€๊ทœ๋ชจ ๋”ฅ๋Ÿฌ๋‹ ์Šค์ผ€์ผ์—… ๋…ผ๋ฌธ์œผ๋กœ, ์‹ ๊ฒฝ์ง„ํ™” ํฌํ…์…œ์˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํšจ์œจ ํ–ฅ์ƒ๊ณผ์˜ ์‹œ๋„ˆ์ง€๋ฅผ ํƒ์ƒ‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
398์€ LLM์„ ํ™œ์šฉํ•œ MOF ๋…ผ๋ฌธ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•๊ณผ ํ•ฉ์„ฑ์กฐ๊ฑด ์ถ”์ฒœ์— ์ง‘์ค‘ํ•˜์—ฌ, 695์—์„œ ์ œ์‹œํ•œ ์†Œ์žฌ ๋ฐ์ดํ„ฐ์˜ ๋Œ€๊ทœ๋ชจ AI ํ™œ์šฉ ์‚ฌ๋ก€๋กœ ์—ฐ๊ฒฐ๋œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
GNoME ๋“ฑ ์‹ค์ œ ๋Œ€๊ทœ๋ชจ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์žฌ๋ฃŒ ๋ฐœ๊ฒฌ ์ ์šฉ ์‚ฌ๋ก€ ๋ถ„์„์„ ํ†ตํ•ด, ์ด๋ก ์  ๋ฆฌ๋ทฐ์˜ ๊ตฌ์ฒด์  ์‹คํ˜„ ์˜ˆ๋ฅผ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •