An automatic end-to-end chemical synthesis development platform powered by large language models

์ €์ž: Yixiang Ruan, Chenyin Lu, Ning Xu, Yuchen He, Yixin Chen, Jian Zhang, Jun Xuan, Jianzhang Pan, Qun Fang, Hanyu Gao, Xiaodong Shen, Ning Ye, Qiang Zhang, Yiming Mo | ๋‚ ์งœ: 2024-11-23 | DOI: 10.1038/s41467-024-54457-x 📄 PDF


Essence

๋ณธ ๋…ผ๋ฌธ์€ GPT-4 ๊ธฐ๋ฐ˜์˜ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์„ ํ™œ์šฉํ•œ ํ†ตํ•ฉ ํ™”ํ•™ํ•ฉ์„ฑ ๊ฐœ๋ฐœ ํ”„๋ ˆ์ž„์›Œํฌ(LLM-RDF)๋ฅผ ์ œ์‹œํ•˜์—ฌ, ๋ฌธํ—Œ ๊ฒ€์ƒ‰๋ถ€ํ„ฐ ๋ฐ˜์‘ ์ตœ์ ํ™”, ๊ทœ๋ชจ ํ™•๋Œ€, ์ •์ œ๊นŒ์ง€ ์ „ ๊ณผ์ •์„ ์ž๋™ํ™”ํ•˜๋Š” ์—”๋“œ-ํˆฌ-์—”๋“œ ํ”Œ๋žซํผ์„ ๊ตฌํ˜„ํ–ˆ๋‹ค.

Motivation

Achievement

Fig. 1 | Overview of LLM-based multi-agent system for reaction development.

๋ฌธํ—Œ ๊ฒ€์ƒ‰๋ถ€ํ„ฐ ์ •์ œ๊นŒ์ง€ ์ „ ๊ณผ์ •์„ ํฌ๊ด„ํ•˜๋Š” LLM ๊ธฐ๋ฐ˜ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ ๋ฐ ์ž์—ฐ์–ธ์–ด ๊ธฐ๋ฐ˜ ์›น ์ธํ„ฐํŽ˜์ด์Šค

  1. ํ†ตํ•ฉ ํ”„๋ ˆ์ž„์›Œํฌ ๊ฐœ๋ฐœ: Literature Scouter, Experiment Designer, Hardware Executor, Spectrum Analyzer, Separation Instructor, Result Interpreter์˜ 6๊ฐœ LLM ์—์ด์ „ํŠธ๋กœ ๊ตฌ์„ฑ๋œ LLM-RDF ๊ตฌ์ถ•
  2. ๊ตฌ๋ฆฌ/TEMPO ์ด‰๋งค ์‚ฐํ™” ๋ฐ˜์‘ ์„ฑ๊ณต ์‹œ์—ฐ:
    • ๋ฌธํ—Œ ๊ฒ€์ƒ‰ ๋ฐ ์ •๋ณด ์ถ”์ถœ์„ ํ†ตํ•ด Cu/TEMPO ๋“€์–ผ ์ด‰๋งค ์‹œ์Šคํ…œ ์„ ์ •
    • ๊ธฐ์งˆ ๋ฒ”์œ„ ๋ฐ ์กฐ๊ฑด ์Šคํฌ๋ฆฌ๋‹, ๋ฐ˜์‘ ๋™์—ญํ•™ ์—ฐ๊ตฌ, ์กฐ๊ฑด ์ตœ์ ํ™”, ๊ทœ๋ชจ ํ™•๋Œ€, ์ƒ์„ฑ๋ฌผ ์ •์ œ์˜ ์ „ ๊ณผ์ • ์ž๋™ ์ˆ˜ํ–‰
  3. ๋ฒ”์šฉ ์ ์šฉ์„ฑ ๊ฒ€์ฆ: SNAr ๋ฐ˜์‘, ๊ด‘์‚ฐํ™”ํ™˜์› C-C ๊ต์ฐจ ๊ฒฐํ•ฉ ๋ฐ˜์‘, ๋ถˆ๊ท ์ผ ๊ด‘์ „๊ธฐํ™”ํ•™ ๋ฐ˜์‘ ๋“ฑ 3๊ฐœ ์„œ๋กœ ๋‹ค๋ฅธ ๋ฐ˜์‘์—์„œ LLM-RDF์˜ ๋‹ค๋ชฉ์ ์„ฑ(versatility) ์ž…์ฆ
  4. ์‚ฌ์šฉ์ž ์ ‘๊ทผ์„ฑ ํ–ฅ์ƒ: ์ฝ”๋”ฉ ๊ธฐ์ˆ  ๋ถˆํ•„์š”ํ•œ ์ž์—ฐ์–ธ์–ด ๊ธฐ๋ฐ˜ ์›น ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๊ตฌํ˜„์œผ๋กœ ๋ชจ๋“  ํ™”ํ•™์ž์˜ ์ ‘๊ทผ์„ฑ ํ™•๋ณด

How

Fig. 2 | LLM-based agents facilitated literature search and information extraction.

Literature Scouter ์—์ด์ „ํŠธ์˜ ๋ฌธํ—Œ ๊ฒ€์ƒ‰ ๋ฐ ์ •๋ณด ์ถ”์ถœ ์›Œํฌํ”Œ๋กœ์šฐ์™€ ์‚ฌ์šฉ์ž ์ƒํ˜ธ์ž‘์šฉ ์˜ˆ์‹œ

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4.5/5 Overall: 4.4/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ LLM์˜ ๋‹ค๋ชฉ์ ์„ฑ์„ ํ™œ์šฉํ•œ ํ™”ํ•™ํ•ฉ์„ฑ ์ž๋™ํ™”์˜ ์ƒˆ๋กœ์šด ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์ œ์‹œํ•˜๋Š” ๊ณ ๋„๋กœ ์ฐฝ์˜์ ์ธ ์—ฐ๊ตฌ๋กœ, ์ž์—ฐ์–ธ์–ด ๊ธฐ๋ฐ˜ ์ธํ„ฐํŽ˜์ด์Šค์™€ ํ†ตํ•ฉ ํ”„๋ ˆ์ž„์›Œํฌ ๊ตฌ์ถ•์ด๋ผ๋Š” ์‹ค์งˆ์  ๊ธฐ์—ฌ๊ฐ€ ์šฐ์ˆ˜ํ•˜๋‚˜, ์™„์ „ ์ž์œจํ™” ๋ฏธ๋‹ฌ์„ฑ, ํŠน์ • ๋ชจ๋ธ ์˜์กด์„ฑ, ์ œํ•œ๋œ ํ™”ํ•™์  ๋ฒ”์œ„ ๋“ฑ์˜ ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค. Nature Communications ์ˆ˜์ค€์˜ ํ•™์ œ ๊ฐ„ ์˜ํ–ฅ๋ ฅ ์žˆ๋Š” ๊ณตํ—Œ์ด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ํ™”ํ•™ ์ž๋™ํ™” ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๊ธฐ์ˆ ์  ๋ฐฐ๊ฒฝ์œผ๋กœ 176์˜ chemistry tool-agent ํ†ตํ•ฉ ์‚ฌ๋ก€๋ฅผ ์ฐธ๊ณ ํ•˜๋ฉด ์ „๋ฐ˜์  ๋งฅ๋ฝ์„ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ํ™”ํ•™ ํ•ฉ์„ฑ ๊ฒฝ๋กœ ๊ฒฐ์ • ๋“ฑ์—์„œ LLM ๊ธฐ๋ฐ˜์˜ ์ „๋žต์  reasoning/๊ณ„ํš ์ˆ˜๋ฆฝ ๋Šฅ๋ ฅ์„ ์‹คํ—˜์ ์œผ๋กœ ์ฆ๋ช…ํ•˜์—ฌ, LLM-RDF์˜ ์ž๋™ํ™” ๊ธฐ๋ฐ˜์„ ๊ณต๊ณ ํžˆ ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Chemist-X ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ํ™”ํ•™๋ฐ˜์‘ ์ถ”์ฒœ๊ณผ ๊ฒฝ๋กœ ์ตœ์ ํ™” ์—์ด์ „ํŠธ ๊ตฌํ˜„ ๋“ฑ ์™„์ „ ์ž๋™ํ•ฉ์„ฑ ๊ฐœ๋ฐœ์„ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ์ ‘๊ทผํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
096๊ณผ 271์€ ๋ชจ๋‘ LLM์„ ํ™œ์šฉํ•œ ํ™”ํ•™ ํ”Œ๋ž˜๋„ˆ๋กœ, 271์€ ์ „๋ฐ˜์  ํ™”ํ•™ ์ž‘์—…์— ํŠนํ™”๋œ LLM ๊ฐœ๋ฐœ์— ์ค‘์ ์„ ๋‘”๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
305์™€ 096 ๋ชจ๋‘ ํ™”ํ•™/๋ถ„์ž ์„ค๊ณ„์— LLM์„ ํ†ตํ•ฉํ•ด ์ตœ์ ํ™” ํšจ์œจ์„ ๋†’์ด๊ณ ์ž ํ•˜์ง€๋งŒ, 305๋Š” EA ์œตํ•ฉ, 096์€ LLM ๊ธฐ๋ฐ˜ end-to-end ์ž๋™ํ™”์— ์ค‘์ ์„ ๋‘”๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
096์€ ๊ฒฝ์ œ(ํ™”ํ•™ ํ•ฉ์„ฑ ๋“ฑ) ์‹ค์ฆ์  ์‘์šฉ์— AI ๊ธฐ๋ฐ˜ ์ž๋™ ์˜์‚ฌ๊ฒฐ์ • ์‹œ์Šคํ…œ์„ ์ ์šฉํ•˜์—ฌ, 301์˜ ๋น„์‹œ์žฅ ์ง€์‹ ํ™œ์šฉ๊ณผ ์‚ฌํšŒ์  ์˜ํ–ฅ ์—ฐ๊ตฌ์™€ ๋Œ€์กฐ์  ๋…ผ์˜๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
GPT ๊ธฐ๋ฐ˜ ์–ธ์–ด๋ชจ๋ธ์„ ํ™”ํ•™ ํ•ฉ์„ฑ ๋˜๋Š” ์‹คํ—˜ ์ž๋™ํ™”์— ์ ์šฉํ•œ ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ƒ๋ฌผ๋ถ„์ž ์„ค๊ณ„์—์„œ ํ™•์‚ฐ๋ชจ๋ธ๋กœ reward ๊ธฐ๋ฐ˜ ์ตœ์ ํ™”๋ฅผ ์‹œ๋„ํ•œ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ํ™”ํ•™ํ•ฉ์„ฑ ์ž๋™ํ™”์™€ ๋ชฉํ‘œ๋Š” ๊ฐ™์ง€๋งŒ ๋ฐฉ๋ฒ•์ด ๋‹ค๋ฆ…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์—ฐ์†Œ ์ด‰๋งค ์„ฑ๋Šฅ ์˜ˆ์ธก์„ ์œ„ํ•œ ๋‹ค๋ฅธ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ์ œ์‹œํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM์„ ํ™œ์šฉํ•œ ํ™”ํ•™ ํ˜„์žฅ(์ž๋™ ํ•ฉ์„ฑ, ์‹คํ—˜ ์ž๋™ํ™”)์—์„œ ์‹ค์งˆ์ ์ธ ๋ถ„์ž/ํ™”ํ•ฉ๋ฌผ ๋ฐœ๊ฒฌ ๊ณผ์ •์„ ์ง„์ผ๋ณด์‹œํ‚ต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ํ™”ํ•™ํ•ฉ์„ฑ ์ž๋™ํ™” ํ”Œ๋žซํผ์˜ ํŠน์ • ๋‹จ๊ณ„(์˜ˆ: ๋ฐ˜์‘ ์˜ˆ์ธก ๋˜๋Š” ๊ทœ๋ชจ ํ™•๋Œ€)๋ฅผ ์‹ฌํ™” ์—ฐ๊ตฌํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ChemAgent ๋…ผ๋ฌธ์€ LLM ๋‚ด์žฅ ์•ฝ๋ฌผ ํ™”ํ•ฉ๋ฌผ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ์ž๋™ ์—…๋ฐ์ดํŠธ ์‹œ์Šคํ…œ์œผ๋กœ ํ•ฉ์„ฑ ๊ฒฝ๋กœ ์ œ์•ˆ-์‹คํ—˜ ์ž๋™ํ™” ์—ฐ๊ณ„๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •