Autonomous chemical research with large language models

์ €์ž: Daniil A. Boiko, Robert MacKnight, Ben Kline, Gabe Gomes | ๋‚ ์งœ: 2023-12-21 | DOI: 10.1038/s41586-023-06792-0 📄 PDF


Essence

Figure 1

Coscientist์˜ ์‹œ์Šคํ…œ ์•„ํ‚คํ…์ฒ˜. ํ”Œ๋ž˜๋„ˆ ๋ชจ๋“ˆ์ด ์ค‘์‹ฌ์ด ๋˜์–ด ์›น ๊ฒ€์ƒ‰, ํŒŒ์ด์ฌ ์ฝ”๋“œ ์‹คํ–‰, ๋ฌธ์„œ ๊ฒ€์ƒ‰, ์‹คํ—˜ ์ž๋™ํ™” ๋ชจ๋“ˆ๋“ค์„ ์กฐ์œจํ•œ๋‹ค.

GPT-4 ๊ธฐ๋ฐ˜์˜ ๋‹ค์ค‘ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM) ์—์ด์ „ํŠธ์ธ Coscientist๋Š” ์›น ๊ฒ€์ƒ‰, ์ฝ”๋“œ ์‹คํ–‰, ์‹คํ—˜ ์ž๋™ํ™”๋ฅผ ํ†ตํ•ฉํ•˜์—ฌ ๋ณต์žกํ•œ ํ™”ํ•™ ์‹คํ—˜์„ ์ž์œจ์ ์œผ๋กœ ์„ค๊ณ„ยท๊ณ„ํšยท์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋Š” ์‹œ์Šคํ…œ์ด๋‹ค. ํŒ”๋ผ๋“ ์ด‰๋งค ๊ต์ฐจ ๊ฒฐํ•ฉ ๋ฐ˜์‘ ์ตœ์ ํ™”๋ฅผ ํฌํ•จํ•œ 6๊ฐ€์ง€ ๋‹ค์–‘ํ•œ ์ž‘์—…์—์„œ ์ž๋™ํ™” ์‹คํ—˜ ์„ค๊ณ„์˜ ์‹คํ–‰ ๊ฐ€๋Šฅ์„ฑ์„ ์ž…์ฆํ–ˆ๋‹ค.

Motivation

Achievement

Figure 2

๋‹ค์–‘ํ•œ LLM์˜ ํ™”ํ•™ ํ•ฉ์„ฑ ๊ณ„ํš ๋Šฅ๋ ฅ ๋น„๊ต. GPT-4 ๊ธฐ๋ฐ˜ ์›น ๊ฒ€์ƒ‰์ด ๋‹ค๋ฅธ ๋ชจ๋ธ๋“ค ๋Œ€๋น„ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ž„.

  1. ํ•ฉ์„ฑ ๊ณ„ํš ๋Šฅ๋ ฅ: ์›น ๊ฒ€์ƒ‰ ๊ธฐ๋Šฅ์ด ํ†ตํ•ฉ๋œ GPT-4 (search-gpt-4)๊ฐ€ ์•„์„ธํŠธ์•„๋ฏธ๋…ธํŽœ, ์•„์Šคํ”ผ๋ฆฐ, ๋‹ˆํŠธ๋กœ์•„๋‹๋ฆฐ, ํŽ˜๋†€ํ”„ํƒˆ๋ ˆ์ธ ๋“ฑ์—์„œ ์ตœ๊ณ  ์ ์ˆ˜๋ฅผ ๋‹ฌ์„ฑํ•˜๋ฉฐ, ๊ฒ€์ƒ‰ ์—†๋Š” ์ˆœ์ˆ˜ LLM์„ ํฌ๊ฒŒ ๋Šฅ๊ฐ€ํ•จ
  2. ๋ฌธ์„œ ๊ธฐ๋ฐ˜ ์ž๋™ํ™”: Opentrons Python API์™€ Emerald Cloud Lab Symbolic Lab Language(SLL) ๋ฌธ์„œ๋ฅผ ์ด์šฉํ•˜์—ฌ ๋กœ๋ด‡์‹ ์•ก์ฒด ํ•ธ๋“ค๋Ÿฌ ์ œ์–ด ๋ฐ ํด๋ผ์šฐ๋“œ ์‹คํ—˜์‹ค ์ž๋™ํ™” ๋ช…๋ น ์‹คํ–‰ ๊ฐ€๋Šฅ
  3. ๋ฐ˜์ž์œจ ์‹คํ—˜ ์„ค๊ณ„: ํŒ”๋ผ๋“ ์ด‰๋งค Suzuki ๋ฐ Sonogashira ๊ต์ฐจ ๊ฒฐํ•ฉ ๋ฐ˜์‘ ์ตœ์ ํ™”๋ฅผ ํฌํ•จํ•œ ๋ณตํ•ฉ ํ™”ํ•™ ์ž‘์—… ์ˆ˜ํ–‰
  4. ๋ชจ๋“ˆ์‹ ํ™•์žฅ์„ฑ: 6๊ฐ€์ง€ ๋‹ค์–‘ํ•œ ์ž‘์—…(ํ•ฉ์„ฑ ๊ณ„ํš, ๋ฌธ์„œ ๊ฒ€์ƒ‰, ๊ณ ์ˆ˜์ค€ ํด๋ผ์šฐ๋“œ ๋žฉ ๋ช…๋ น, ์ €์ˆ˜์ค€ ์•ก์ฒด ํ•ธ๋“ค๋Ÿฌ ์ œ์–ด, ๋‹ค์ค‘ ํ•˜๋“œ์›จ์–ด ๋ชจ๋“ˆ ํ†ตํ•ฉ, ๋ฐ์ดํ„ฐ ๋ถ„์„ ๊ธฐ๋ฐ˜ ์ตœ์ ํ™”)์—์„œ ๊ฒ€์ฆ๋จ

How

Figure 3

๋ฌธ์„œ ๊ฒ€์ƒ‰ ์‹œ์Šคํ…œ. Ada ์ž„๋ฒ ๋”ฉ์„ ์‚ฌ์šฉํ•œ ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๊ธฐ๋ฐ˜ ๋ฌธ์„œ ๊ฒ€์ƒ‰ ๋ฐ ์š”์•ฝ.

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ์ด ๋…ผ๋ฌธ์€ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ์„ ์‹ค์ œ ํ™”ํ•™ ์‹คํ—˜ ์ž๋™ํ™”์™€ ๊ฒฐํ•ฉํ•œ ํš๊ธฐ์ ์ธ ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•˜๋ฉฐ, ํŠนํžˆ ์›น ๊ฒ€์ƒ‰์„ ํ†ตํ•œ Hallucination ๋ฐฉ์ง€์™€ ๋ฌธ์„œ ๊ฒ€์ƒ‰์„ ํ†ตํ•œ API ํ™œ์šฉ์ด ์ธ์ƒ์ ์ด๋‹ค. ๋‹ค๋งŒ ๋Œ€๊ทœ๋ชจ ์ž๋™ํ™” ์‹คํ—˜์˜ ์‹ ๋ขฐ์„ฑ, ์˜ค๋ฅ˜ ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ, ๊ทธ๋ฆฌ๊ณ  ํ˜„์žฌ ์‹œ์Šคํ…œ์˜ ํ•œ๊ณ„(๋ณต์žกํ•œ ๋‹ค๋‹จ๊ณ„ ํ•ฉ์„ฑ, ์ฃผ๊ด€์  ํ‰๊ฐ€)์— ๋Œ€ํ•œ ๋” ๊นŠ์€ ๋ถ„์„์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Œ€ํ˜•์–ธ์–ด๋ชจ๋ธ์„ ํ™œ์šฉํ•œ ํ™”ํ•™ ๋ฐ ์žฌ๋ฃŒ ์—ฐ๊ตฌ ์ž๋™ํ™”์— ๋Œ€ํ•œ ํฌ๊ด„์  ๋…ผ์˜๋กœ, ์‹ค์ œ ์‹คํ—˜์— AI ์ž๋™ํ™”๋ฅผ ์ ‘๋ชฉํ•œ ๋ณธ ๋…ผ๋ฌธ์˜ ๋ฐœ์ „์  ๊ธฐ๋ฐ˜์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
138์€ LLM์„ ํ™œ์šฉํ•œ ์ž์œจ ํ™”ํ•™ ์—ฐ๊ตฌ์˜ ํ˜„ํ™ฉ ๋ฐ ํ•œ๊ณ„๋ฅผ ์ง„๋‹จํ•œ ๋ฆฌ๋ทฐ๋กœ, 311์˜ ์‹œ์Šคํ…œ ์„ค๊ณ„ ์ฒ ํ•™๊ณผ AI-human ํ˜‘์—… ๋ฐฉํ–ฅ์„ ๋’ท๋ฐ›์นจํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM์„ ํ™œ์šฉํ•œ ์ž์œจ ํ™”ํ•™ ์—ฐ๊ตฌ(Autonomous chemical research)์— ๋Œ€ํ•œ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ์„ ํ™œ์šฉํ•œ ์ž์œจ์  ํ™”ํ•™ ์—ฐ๊ตฌ ์ž๋™ํ™” ๊ฐœ๋…์„ ๋‹ค๋ฃฌ ๋…ผ๋ฌธ์œผ๋กœ, PharmAgents์˜ ํ† ๋Œ€๊ฐ€ ๋˜๋Š” ์ด๋ก ๊ณผ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณผํ•™ ์‹คํ—˜ ์ž๋™ํ™”๋ฅผ ์œ„ํ•œ LLM ์—์ด์ „ํŠธ์˜ ๊ธฐ๋ฐ˜ ๊ฐœ๋…์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM์„ ํ™œ์šฉํ•ด ์ž์œจ์ ์œผ๋กœ ์žฌ๋ฃŒ ์—ฐ๊ตฌ ๋ฐ ๋ถ„์ž ์„ค๊ณ„์— ์ ‘๊ทผํ•˜๋Š” ์ตœ์‹  ํ”„๋ ˆ์ž„์›Œํฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์˜คํ”ˆ์†Œ์Šค LLM, ์ž์ฒด ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ์—ฐ๊ตฌ ์ž๋™ํ™” ๋ฐ ์„ค๊ณ„ ์›Œํฌํ”Œ๋กœ ํ˜์‹ ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ™”ํ•™ ๋ถ„์•ผ์—์„œ์˜ AI ์—์ด์ „ํŠธ ์ž๋™ํ™” ์—ฐ๊ตฌ๋กœ ์œ ์‚ฌํ•œ ๋ชฉํ‘œ๋ฅผ ๊ณต์œ ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
210 ๋…ผ๋ฌธ์€ LLM์— ๋‹ค์–‘ํ•œ ํ™”ํ•™๋„๊ตฌ ์‚ฌ์šฉ์„ ๊ฒฐํ•ฉ, 138์˜ LLM multi-agent ์‹คํ—˜ ์ž๋™ํ™”์™€ ๋‹ค๋ฅธ ์ „๋žต์  ์ ‘๊ทผ์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
214 ๋…ผ๋ฌธ์€ 138๊ณผ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ LLM ๊ธฐ๋ฐ˜ ํ™”ํ•™ ํ•ฉ์„ฑ ๋ฐ ์‹คํ—˜ ์ž๋™ํ™”๋ฅผ ์ง€ํ–ฅํ•˜์ง€๋งŒ, ์‚ฌ์šฉ ๋„๊ตฌ ๋ฐ ๋ฒค์น˜๋งˆํฌ ํ™˜๊ฒฝ์ด ์ƒ์ดํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
The Virtual Lab ๋…ผ๋ฌธ์€ ๋‹ค์ค‘ ์ „๋ฌธ๊ฐ€ LLM ์—์ด์ „ํŠธ์˜ ํ˜‘๋ ฅํ˜• ์—ฐ๊ตฌ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜์—ฌ, Coscientist์˜ ํ™”ํ•™ ์ž๋™ํ™” ์ค‘์‹ฌ ์ ‘๊ทผ๊ณผ ๋น„๊ต ๊ฐ€๋Šฅํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋ฌธํ—Œ์˜ ๊ตฌ์กฐํ™”๋œ ์ •๋ณด ์ถ”์ถœ์„ ์œ„ํ•œ ๋‹ค๋ฅธ LLM ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
138๋ฒˆ ๋…ผ๋ฌธ๋„ LLM ๊ธฐ๋ฐ˜ ์ž์œจ ํ™”ํ•™ ์‹คํ—˜ ์—ฐ๊ตฌ๋กœ, ๊ฐ ๋…ผ๋ฌธ์ด ๋‹ค๋ฃจ๋Š” ์ž๋™ํ™” ์ŠคํŽ™ํŠธ๋Ÿผ์„ ๋น„๊ตํ•˜๋Š” ๋ฐ ์ค‘์š”ํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ์ž์œจ ํ™”ํ•™ ์‹คํ—˜ ์„ค๊ณ„ ๋ฐ ์‹คํ–‰ ์‹œ์Šคํ…œ์˜ ์œ ์‚ฌํ•œ ์ ‘๊ทผ ๋ฐฉ์‹์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ™”ํ•™ ๋˜๋Š” ์žฌ๋ฃŒ๊ณผํ•™ ๋ถ„์•ผ AI ์ž๋™ํ™”์˜ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ณต์žกํ•œ ํ™”ํ•™ ์‹คํ—˜์˜ ์ž์œจ ์ˆ˜ํ–‰์„ ์œ„ํ•œ LLM ์—์ด์ „ํŠธ์˜ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
099๋Š” ์ž์œจํ™”ํ•™ ์‹คํ—˜์„ ์‹ ์†ํ•ฉ์„ฑ ์‹คํ—˜์— ํŠนํ™”ํ•˜์—ฌ, 138๋ฒˆ ๋…ผ๋ฌธ์˜ LLM ๊ธฐ๋ฐ˜ ์ž๋™ ์‹คํ—˜ ์„ค๊ณ„์™€ ์‹ค์ œ ์ž๋™ํ™” ๋ฒ”์œ„๋ฅผ ํ™•์žฅ์‹œํ‚จ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
212์˜ ํ™”ํ•™ํ•ฉ์„ฑ AI ์ž๋™ํ™” ํ”„๋ ˆ์ž„์›Œํฌ๋Š” 138์—์„œ ๋…ผ์˜๋˜๋Š” LLM ํ™œ์šฉ ์ž์œจ ํ™”ํ•™์—ฐ๊ตฌ์˜ ๋ฒ”์œ„์™€ ๋ฐฉํ–ฅ์„ฑ์„ ์‹ค์งˆ์ ์œผ๋กœ ํ™•์žฅํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
705 ๋…ผ๋ฌธ์€ 138์˜ ํ™”ํ•™ ์ž๋™ ํ•ฉ์„ฑ ์›Œํฌํ”Œ๋กœ์šฐ์— ์˜๊ฐ์„ ๋ฐ›์•„ ์ƒ๋ช…๊ณผํ•™ ์‹คํ—˜ ๋“ฑ์œผ๋กœ ๋ฒ”์œ„๋ฅผ ํ™•์žฅํ•œ ๋‹ค์Œ ์„ธ๋Œ€ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
138์€ LLM ๊ธฐ๋ฐ˜ ํ™”ํ•™ ์—ฐ๊ตฌ ์ž๋™ํ™”๋ฅผ ํฌ๊ด„์ ์œผ๋กœ ๋‹ค๋ฃจ์–ด, 2174์˜ ChemAgents ์‹œ์Šคํ…œ์„ ์‹ค์ œ ์—ฐ๊ตฌ ๋ฒ”์œ„๋กœ ํ™•์žฅ ์ ์šฉํ•œ ์‚ฌ๋ก€์ด๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Autonomous chemical research ๋…ผ๋ฌธ์€ LLM์ด ๋„๋ฉ”์ธ ์ง€์‹ ๋ฐœ๊ตด๊ณผ ์ƒˆ๋กœ์šด ๊ทœ์น™ ๋ฐœ๊ฒฌ์— ์‹ค์ œ์  ํ™œ์šฉ๋˜๋Š” ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •