ChatMOF: an artificial intelligence system for predicting and generating metal-organic frameworks using large language models

์ €์ž: Y. Kang, Jihan Kim | ๋‚ ์งœ: 2024 | DOI: 10.1038/s41467-024-48998-4 📄 PDF


Essence

Figure 1

Fig. 1 | ChatMOF์˜ ๊ฐœ๋…๋„(a)์™€ ๊ตฌ์กฐ๋„(b). ChatMOF๋Š” ์—์ด์ „ํŠธ, ๋„๊ตฌ ๋ชจ์Œ, ํ‰๊ฐ€๊ธฐ์˜ ์„ธ ๊ฐ€์ง€ ํ•ต์‹ฌ ์š”์†Œ๋กœ ๊ตฌ์„ฑ๋˜์–ด ์ž์—ฐ์–ด ์งˆ๋ฌธ์— ๊ธฐ๋ฐ˜ํ•˜์—ฌ ๊ธˆ์†-์œ ๊ธฐ ๊ณจ๊ฒฉ์˜ ์„ฑ์งˆ์„ ์˜ˆ์ธกํ•˜๊ณ  ๊ตฌ์กฐ๋ฅผ ์ƒ์„ฑํ•œ๋‹ค.

๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(Large Language Model, LLM)์„ ํ™œ์šฉํ•˜์—ฌ ๊ธˆ์†-์œ ๊ธฐ ๊ณจ๊ฒฉ(Metal-Organic Framework, MOF)์˜ ์„ฑ์งˆ์„ ์˜ˆ์ธกํ•˜๊ณ  ์‹ ๊ทœ ๊ตฌ์กฐ๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋Š” ์ธ๊ณต์ง€๋Šฅ ์‹œ์Šคํ…œ ChatMOF๋ฅผ ๊ฐœ๋ฐœํ–ˆ๋‹ค. ์ž์—ฐ์Šค๋Ÿฌ์šด ํ…์ŠคํŠธ ์ž…๋ ฅ๋งŒ์œผ๋กœ ๋ณต์žกํ•œ ์žฌ๋ฃŒ ๊ณผํ•™ ์ž‘์—…์„ ์ž๋™ํ™”ํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ฃผ์—ˆ๋‹ค.

Motivation

Achievement

Figure 2

Fig. 2 | ํ…Œ์ด๋ธ” ๊ฒ€์ƒ‰ ๋„๊ตฌ์˜ ์˜ˆ์‹œ. ์‚ฌ์šฉ์ž ์งˆ๋ฌธ์— ๋”ฐ๋ผ ChatMOF๊ฐ€ ์ž๋™์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์—์„œ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•œ๋‹ค.

Figure 3

Fig. 3 | ์˜ˆ์ธก๊ธฐ(predictor)์˜ ์‚ฌ์šฉ ์˜ˆ์‹œ. MOFTransformer ๋ชจ๋ธ์„ ์„ ํƒํ•˜์—ฌ ์žฌ๋ฃŒ์˜ ์„ฑ์งˆ์„ ์˜ˆ์ธกํ•œ๋‹ค.

  1. ๋†’์€ ์˜ˆ์ธก ์ •ํ™•๋„: GPT-4 ๊ธฐ๋ฐ˜ ChatMOF๋Š” ๊ฒ€์ƒ‰(searching) 96.9%, ์˜ˆ์ธก(predicting) 95.7%, ์ƒ์„ฑ(generating) 87.5%์˜ ๋†’์€ ์ •ํ™•๋„ ๋‹ฌ์„ฑ.
  2. ๋‹ค์ค‘ ์ž‘์—… ์ˆ˜ํ–‰: ๋ฐ์ดํ„ฐ ๊ฒ€์ƒ‰(data retrieval), ์„ฑ์งˆ ์˜ˆ์ธก(property prediction), ๊ตฌ์กฐ ์ƒ์„ฑ(structure generation)์˜ ์„ธ ๊ฐ€์ง€ ํ•ต์‹ฌ ์ž‘์—…์„ ์ž๋™์œผ๋กœ ์ˆ˜ํ–‰ํ•˜๋ฉฐ, ์ž์—ฐ์–ธ์–ด ์ž…๋ ฅ๋งŒ์œผ๋กœ ์‚ฌ์šฉ์ž๊ฐ€ ์›ํ•˜๋Š” ์„ฑ์งˆ์˜ MOF ์ƒ์„ฑ ๊ฐ€๋Šฅ.
  3. ์‹ค์งˆ์  ์žฌ๋ฃŒ ์ƒ์„ฑ: ๊ธฐ์กด LLM ์—ฐ๊ตฌ๊ฐ€ ๋ฌธํ—Œ์—์„œ ์ถ”์ถœํ•œ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜์˜ ์‘๋‹ต ์ƒ์„ฑ์— ๊ตญํ•œ๋œ ๋ฐ˜๋ฉด, ChatMOF๋Š” ์‹ค์ œ ์žฌ๋ฃŒ ๊ตฌ์กฐ ์ƒ์„ฑ์ด ๊ฐ€๋Šฅ.

How

Figure 4

Fig. 4 | ์œ ์ „ ์•Œ๊ณ ๋ฆฌ์ฆ˜(genetic algorithm)์„ ํ™œ์šฉํ•œ MOF ์ƒ์„ฑ ํ”„๋กœ์„ธ์Šค.

Figure 5

Fig. 5 | ๋ณตํ•ฉ์  ๋‹ค๋‹จ๊ณ„ ์งˆ๋ฌธ์˜ ์˜ˆ์‹œ. COโ‚‚ Henry ๊ณ„์ˆ˜์™€ ๊ด€๋ จ๋œ ๋ณต์žกํ•œ ์ฟผ๋ฆฌ ์ฒ˜๋ฆฌ.

์‹œ์Šคํ…œ ์•„ํ‚คํ…์ฒ˜:

์ฃผ์š” ๊ธฐ์ˆ  ์š”์†Œ:

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ChatMOF๋Š” ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์„ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๋ฐ ๊ธฐ๊ณ„ํ•™์Šต๊ณผ ๊ฒฐํ•ฉํ•˜์—ฌ ์žฌ๋ฃŒ ๊ณผํ•™ ๋ถ„์•ผ์— ์‹ค์งˆ์  ๊ฐ€์น˜๋ฅผ ์ œ๊ณตํ•˜๋Š” ํ˜์‹ ์  AI ์‹œ์Šคํ…œ์ด๋ฉฐ, ํŠนํžˆ ์ž์—ฐ์–ธ์–ด ๊ธฐ๋ฐ˜ ์ธํ„ฐํŽ˜์ด์Šค์™€ ๊ตฌ์กฐ ์ƒ์„ฑ ๊ธฐ๋Šฅ์€ ์ฃผ๋ชฉํ•  ๋งŒํ•˜๋‚˜, ์ƒ์„ฑ ์ •ํ™•๋„ ํ–ฅ์ƒ๊ณผ ์‹คํ—˜์  ๊ฒ€์ฆ์„ ํ†ตํ•œ ์ถ”๊ฐ€ ๊ฐœ๋ฐœ์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Efficient Evolutionary Search Over Chemical Space ๋…ผ๋ฌธ์€ ๋ณต์žกํ•œ ๊ธˆ์†-์œ ๊ธฐ๊ณจ๊ฒฉ ์„ค๊ณ„ ๋ฐ ์ตœ์ ํ™”์— ๊ด€ํ•œ ์ง„ํ™”์  ํƒ์ƒ‰ ๊ธฐ๋ฒ•์„ ํ†ตํ•ด, ChatMOF์˜ ๊ตฌ์กฐ ์ƒ์„ฑ ์ „๋žต์„ ์ง€์›ํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
208๊ณผ ๊ฐ™์€ LLM ๊ธฐ๋ฐ˜ ์žฌ๋ฃŒ ์„ค๊ณ„๋Š” 004์˜ ๊ด€๋ จ ๋ชจ๋ธ๋“ค๊ณผ ๊ธฐ์ดˆ ์ด๋ก ์—์„œ ์‹œ์ž‘๋œ ํŠธ๋ Œ๋“œ๋ฅผ ๋ฐ˜์˜ํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM์„ ๊ณผํ•™ ์žฌ๋ฃŒ ๋ถ„์•ผ์— ์ ์šฉํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
208๊ณผ 440 ๋ชจ๋‘ inverse design ๊ธฐ๋ฐ˜ MOFยท๋ฉ”ํƒ€๋ฌผ์งˆ ์ƒ์„ฑ์— AI๋ฅผ ์‚ฌ์šฉํ•˜์ง€๋งŒ, 208์€ LLM ์–ธ์–ด ์ธํ„ฐํŽ˜์ด์Šค, 440์€ ๊ทธ๋ž˜ํ”„ ์‹ ๊ฒฝ๋งยท๊ฐ•ํ™”ํ•™์Šต์— ์ค‘์ ์„ ๋‘”๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ™”ํ•™ ๋ฐ ์žฌ๋ฃŒ๊ณผํ•™์—์„œ LLM ์‘์šฉ์„ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ์ด์šฉํ•œ ์žฌ๋ฃŒ ํŠน์„ฑ ๊ณ„์‚ฐ ์ž๋™ํ™”๋ฅผ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ ๊ณผํ•™ ๋ฐ์ดํ„ฐ ์ถ”์ถœ ๋ฐ ๊ตฌ์กฐํ™” ์ž‘์—…์—์„œ ์œ ์‚ฌํ•œ ๋ชฉํ‘œ๋ฅผ ์ถ”๊ตฌํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ChatMOF ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ MOF ์˜ˆ์ธก ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ๋กœ, ๊ธˆ์†-์œ ๊ธฐ ๊ณจ๊ฒฉ์ฒด ๋ฐ์ดํ„ฐ ๊ตฌ์ถ•๊ณผ ํ™œ์šฉ์˜ ๋˜๋‹ค๋ฅธ ์ ‘๊ทผ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
523 ๋…ผ๋ฌธ์€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์„ ์žฌ๋ฃŒ ๊ณผํ•™์— ์ ์šฉ, 208์˜ ์ž์—ฐ์–ด ๊ธฐ๋ฐ˜ MOF ๋””์ž์ธ๊ณผ ๋‹ค์ค‘์ž์› ํ†ตํ•ฉ ์ ‘๊ทผ๋ฒ•์„ ๋…ผ์˜ํ•  ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
407 ๋…ผ๋ฌธ์€ 208๊ณผ ์œ ์‚ฌํ•œ LLM ๊ธฐ๋ฐ˜ MOF ์„ค๊ณ„ ๋ฐ ์˜ˆ์ธก ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์œผ๋กœ ์‹ค์ œ ์„ธ๋ถ€ ์„ค๊ณ„ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํ™•์žฅ์ ์œผ๋กœ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๋‹ค๊ตญ์–ด ์Œ์„ฑ ๋ฐ SLU์˜ ์‹ค์ œ ์‘์šฉ์‚ฌ๋ก€๋กœ, ์ผ๊ด€์„ฑ ์ •๊ทœํ™”์™€ ๋ฐ์ดํ„ฐ ์ฆ๊ฐ•์˜ ์‹ค์ œ์  ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๊ฒ€์ฆํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
440์˜ inverse design ๋ฐ ์ตœ์ ํ™” ๋ฐฉ๋ฒ•์€ 208์˜ MOF ๋””์ž์ธ๊ณผ ์œ ์‚ฌํ•œ ์žฌ๋ฃŒ ๊ตฌ์กฐ ์„ค๊ณ„ ๋ฌธ์ œ์— ๋ฐ”๋กœ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
ChatMOF๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ž…๋ ฅ(ํ…์ŠคํŠธ+์ด๋ฏธ์ง€) ๊ธฐ๋ฐ˜ ์žฌ๋ฃŒ ์„ค๊ณ„ ์ง€์› ์˜ˆ์‹œ๋กœ, Multimodal deepresearcher์˜ ์ฐจํŠธ ํ•ด์„ ๋ฐฉ๋ฒ•์˜ ์‹ค์ œ ์ ์šฉ ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
์žฌ๋ฃŒ๊ณผํ•™์—์„œ LLM์˜ ํšจ๊ณผ๋ฅผ ์‹ค์ฆ์ ์œผ๋กœ ๊ฒ€์ฆํ•˜๋ฉฐ ๋‚™๊ด€์  ์ฃผ์žฅ์— ์˜๋ฌธ์„ ์ œ๊ธฐํ•˜๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •