Augmenting large language models with chemistry tools

์ €์ž: Andres M. Bran, Sam Cox, Oliver Schilter, Carlo Baldassari, Andrew D. White, Philippe Schwaller | ๋‚ ์งœ: 2024-05-08 | DOI: 10.1038/s42256-024-00832-8 📄 PDF


Essence

ChemCrow๋Š” GPT-4์— 18๊ฐœ์˜ ํ™”ํ•™ ์ „๋ฌธ๊ฐ€ ๋„๊ตฌ๋ฅผ ํ†ตํ•ฉํ•˜์—ฌ ํ•ฉ์„ฑ ๊ณ„ํš, ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ, ์žฌ๋ฃŒ ์„ค๊ณ„ ๋“ฑ ๋‹ค์–‘ํ•œ ํ™”ํ•™ ์ž‘์—…์„ ์ž๋™์œผ๋กœ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋Š” LLM ํ™”ํ•™ ์—์ด์ „ํŠธ์ด๋‹ค. ์ด ์‹œ์Šคํ…œ์€ ๊ณค์ถฉ ๊ธฐํ”ผ์ œ์™€ ์œ ๊ธฐ์ด‰๋งค ํ•ฉ์„ฑ์„ ์ž์œจ์ ์œผ๋กœ ์‹คํ–‰ํ•˜๊ณ  ์ƒˆ๋กœ์šด ์ƒ‰์†Œ์ฒด ๋ฐœ๊ฒฌ์„ ์ฃผ๋„ํ•˜์—ฌ, ๊ณ„์‚ฐ ํ™”ํ•™๊ณผ ์‹คํ—˜ ํ™”ํ•™ ์‚ฌ์ด์˜ ๊ฒฉ์ฐจ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์—ฐ๊ฒฐํ•œ๋‹ค.

Motivation

Achievement

  1. ์ž์œจ์  ํ™”ํ•™ ํ•ฉ์„ฑ ์‹คํ–‰: ChemCrow๋Š” ์‚ฌ์šฉ์ž ์ž…๋ ฅ(์˜ˆ: "๊ณค์ถฉ ๊ธฐํ”ผ์ œ์˜ ํ•ฉ์„ฑ ๊ณ„ํš ๋ฐ ์‹คํ–‰")์„ ๋ฐ›์•„ ํด๋ผ์šฐ๋“œ ์—ฐ๊ฒฐ ๋กœ๋ณดํ‹ฑ ํ”Œ๋žซํผ(RoboRXN)์—์„œ ์ž์œจ์ ์œผ๋กœ DEET(๊ณค์ถฉ ๊ธฐํ”ผ์ œ) ๋ฐ 3๊ฐœ์˜ ํ‹ฐ์˜ค์šฐ๋ ˆ์•„ ์œ ๊ธฐ์ด‰๋งค(Schreiner's, Ricci's, Takemoto's) ํ•ฉ์„ฑ์„ ์„ฑ๊ณต์ ์œผ๋กœ ๊ณ„ํšํ•˜๊ณ  ์‹คํ–‰ํ–ˆ๋‹ค. ํ•ฉ์„ฑ ์ ˆ์ฐจ ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ˜๋ณต์ ์œผ๋กœ ์ฟผ๋ฆฌํ•˜์—ฌ ์šฉ๋งค๋Ÿ‰ ์กฐ์ • ๋“ฑ ์ž๋™ ์ˆ˜์ •์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋Šฅ๋ ฅ๋„ ์‹œ์—ฐํ–ˆ๋‹ค.
  2. ์ธ๊ฐ„-AI ํ˜‘๋ ฅ์„ ํ†ตํ•œ ์‹ ๊ทœ ์ƒ‰์†Œ์ฒด ๋ฐœ๊ฒฌ: ChemCrow๋Š” ๊ธฐ๊ณ„ํ•™์Šต ๋ชจ๋ธ ํ•™์Šต์„ ํ†ตํ•ด ์ƒ‰์†Œ์ฒด ํ›„๋ณด ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์Šคํฌ๋ฆฌ๋‹ํ•˜๊ณ , ๋ชฉํ‘œ ํก์ˆ˜ ์ตœ๋Œ€ ํŒŒ์žฅ(369 nm)์„ ๊ธฐ์ค€์œผ๋กœ ์ƒˆ๋กœ์šด ๋ถ„์ž๋ฅผ ์ œ์•ˆํ–ˆ์œผ๋ฉฐ, ์ด ๋ถ„์ž๋Š” ์‹ค์ œ ํ•ฉ์„ฑ๋˜์–ด ์•ฝ 336 nm์˜ ํก์ˆ˜ ์ตœ๋Œ€ ํŒŒ์žฅ์„ ๊ฐ€์ง„ ์ƒˆ๋กœ์šด ์ƒ‰์†Œ์ฒด๋กœ ๊ฒ€์ฆ๋˜์—ˆ๋‹ค.
  3. ๋‹ค์–‘ํ•œ ํ™”ํ•™ ์ž‘์—…์—์„œ์˜ ํ‰๊ฐ€ ์šฐ์›”์„ฑ: 14๊ฐœ ์‚ฌ์šฉ ์‚ฌ๋ก€์—์„œ GPT-4 ๋‹จ๋… ์‚ฌ์šฉ ๋Œ€๋น„ ChemCrow์˜ ์„ฑ๋Šฅ์ด LLM ๊ธฐ๋ฐ˜ ํ‰๊ฐ€(EvaluatorGPT)์™€ ์ „๋ฌธ๊ฐ€ ์ธ๊ฐ„ ํ‰๊ฐ€ ๋ชจ๋‘์—์„œ ์šฐ์ˆ˜ํ•จ์„ ์ž…์ฆํ–ˆ๋‹ค.

How

Figure 1

Fig. 1 | ๊ฐœ์š” ๋ฐ ๋„๊ตฌ ์ง‘ํ•ฉ. (a) ์ž‘์—… ํ•ด๊ฒฐ ๊ณผ์ •์˜ ๊ฐœ์š” ๋ฐ DEET ํ•ฉ์„ฑ ์˜ˆ์‹œ, (b) ๊ตฌํ˜„๋œ 18๊ฐœ์˜ ํ™”ํ•™ ๋„๊ตฌ (๋ฐ˜์‘, ๋ถ„์ž, ์•ˆ์ „, ๊ฒ€์ƒ‰, ํ‘œ์ค€ ๋„๊ตฌ)

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ChemCrow๋Š” LLM์„ ํ™”ํ•™ ๋„๊ตฌ์™€ ์ฒด๊ณ„์ ์œผ๋กœ ํ†ตํ•ฉํ•˜์—ฌ ์ž์œจ์  ํ•ฉ์„ฑ ์‹คํ–‰๊ณผ ์‹ ์•ฝ ๋ฐœ๊ฒฌ์„ ์‹คํ˜„ํ•œ ํš๊ธฐ์ ์ธ ์ž‘์—…์œผ๋กœ, ํ™”ํ•™ ์ž๋™ํ™” ๋ถ„์•ผ์— ๋ช…ํ™•ํ•œ ์ง„์ „์„ ๋ณด์—ฌ์ค€๋‹ค. ๋‹ค๋งŒ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก ์˜ ํ‘œ์ค€ํ™”์™€ ๋‹ค์–‘ํ•œ ํ™”ํ•™ ๋„๋ฉ”์ธ์œผ๋กœ์˜ ํ™•์žฅ์„ฑ ๊ฒ€์ฆ์ด ํ–ฅํ›„ ๊ณผ์ œ์ด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
115๋Š” LLM์˜ ํ™”ํ•™๋„๊ตฌ ์ฆ๊ฐ• ์ „๋žต์˜ ๊ฐœ๋…์  ๊ธฐ๋ณธ๊ธฐ๋ฅผ ์ œ์‹œํ•ด, 176์—์„œ์˜ ๋„๊ตฌ-์—์ด์ „ํŠธ ์œตํ•ฉ ์„ค๊ณ„์— ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
115๋Š” LLM ๊ธฐ๋ฐ˜ ํ™”ํ•™ํˆด ์ฆ๊ฐ• ๊ธฐ๋ฒ• ์ „๋ฐ˜์„ ์ •๋ฆฌํ•˜์—ฌ, 214์˜ ChemToolAgent ์„ค๊ณ„์˜ ๊ฐœ๋…์  ๊ธฐ๋ฐ˜์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
115(ChemCrow)๋Š” LLM ๊ธฐ๋ฐ˜ ํ™”ํ•™ ์—์ด์ „ํŠธ ์•„ํ‚คํ…์ฒ˜์˜ ์ดˆ๊ธฐ ์‚ฌ๋ก€๋กœ, DrugAgent(290)์˜ ์‹ ์•ฝ๋ฐœ๊ฒฌ ์ž๋™ํ™” ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์ด๋ก ์ ยท๊ตฌํ˜„์  ๊ธฐ๋ฐ˜์ž…๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
115 ๋…ผ๋ฌธ์€ LLM์˜ ํ™”ํ•™ ์ถ”๋ก  ๋Šฅ๋ ฅ ๊ฐœ์„ ์„ ์œ„ํ•œ ์™ธ๋ถ€ ๋„๊ตฌยท๋ฐ์ดํ„ฐ ํ™œ์šฉ ์ „๋žต์„ ๋ชฉ์ ์œผ๋กœ, 209์˜ ์ž๊ธฐ๊ฐฑ์‹  ๋ฉ”๋ชจ๋ฆฌ์™€ ๋ณด์กฐ์  ๋ฐฉ์‹์— ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Augmenting large language models with chemistry tools ๋…ผ๋ฌธ์€ ํ™”ํ•™ ๋„๋ฉ”์ธ ํŠนํ™” ๋„๊ตฌ ์‚ฌ์šฉ์„ ํ†ตํ•œ LLM ํ–ฅ์ƒ์— ์ง‘์ค‘ํ•˜์—ฌ ether0 ๋ชจ๋ธ ํ›ˆ๋ จ ์ „๋žต์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Augmenting large language models with chemistry tools ๋…ผ๋ฌธ(ChemCrow)์€ LLM์— ๋‹ค์ˆ˜ ํ™”ํ•™ ๋„๊ตฌ๋ฅผ ๊ฒฐํ•ฉํ•˜์—ฌ ์•ฝ๋ฌผ ์„ค๊ณ„์™€ ๋ถ„์„ ์ž๋™ํ™”๋ฅผ ์‹คํ˜„ํ•˜๋ฉฐ, TxAgent์˜ ๋‹ค๋‹จ๊ณ„ ์ถ”๋ก ยท๋„๊ตฌ ํ†ตํ•ฉ ์ ‘๊ทผ์— ๊ธฐ์ˆ ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ํ™”ํ•™ ๋„๊ตฌ์™€ LLM ํ†ตํ•ฉ์˜ ์ด๋ก /๋ฐฉ๋ฒ•๋ก  ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•˜์—ฌ LLM ๊ธฐ๋ฐ˜ ๊ณ ์—”ํŠธ๋กœํ”ผ ์ด‰๋งค ํƒ์ƒ‰ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๊ทผ๊ฐ„์ด ๋จ.
๋‹ค๋ฅธ ์ ‘๊ทผ
ChemCrow์™€ ์œ ์‚ฌํ•˜๊ฒŒ, ChemCrow ๋…ผ๋ฌธ๊ณผ ๋ณ„๋„์˜ ChemAgent ๋…ผ๋ฌธ๋„ LLm ๊ธฐ๋ฐ˜ ํ™”ํ•™ ์ง€์‹ ์—…๋ฐ์ดํŠธ ์—์ด์ „ํŠธ ๊ตฌ์กฐ๋ฅผ ์ œ์‹œํ•˜์—ฌ ๋„๊ตฌ ํ™œ์šฉ์— ๋‹ค๋ฅธ ์ ‘๊ทผ์„ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ์ž์œจ ํ™”ํ•™ ์‹คํ—˜ ์„ค๊ณ„ ๋ฐ ์‹คํ–‰ ์‹œ์Šคํ…œ์˜ ์œ ์‚ฌํ•œ ์ ‘๊ทผ ๋ฐฉ์‹์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
CACTUS ๋…ผ๋ฌธ๋„ ์—ฌ๋Ÿฌ ํ™”ํ•™ ๋„๊ตฌ๋“ค๊ณผ LLM์„ ์—ฐ๊ฒฐํ•ด ๊ณผํ•™์  ์ถ”๋ก ๊ณผ ์‹คํ—˜์ž๋™ํ™”๋ฅผ ์‹œ๋„ํ•˜์—ฌ, ChemCrow ์‹œ์Šคํ…œ๊ณผ ์„ฑ๋Šฅยท์„ค๊ณ„ ์ธก๋ฉด์—์„œ ๋น„๊ต ๊ฐ€์น˜๊ฐ€ ํฌ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
115๋Š” ํ™”ํ•™ ๋˜๋Š” ๊ณผํ•™ ๋ถ„์•ผ๋ฅผ ์œ„ํ•œ ๋‹ค๋ฅธ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ ๋˜๋Š” ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์„ ์ œ์‹œํ•˜์—ฌ ChemDFM๊ณผ ๋Œ€์•ˆ์ ์œผ๋กœ ๋น„๊ต๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ๋ถ„์ž ์ตœ์ ํ™” ๋˜๋Š” ํ™”ํ•™ ๊ณต๊ฐ„ ํƒ์ƒ‰์— ํ™œ์šฉํ•˜๋Š” ์œ ์‚ฌํ•œ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ™”ํ•™ ๋ฐ ์žฌ๋ฃŒ ์„ค๊ณ„์— AI๋ฅผ ์ ์šฉํ•œ ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹จ๋ฐฑ์งˆ ๊ณตํ•™์„ ์œ„ํ•œ ์ƒ์„ฑ ๋ชจ๋ธ์˜ ๋‹ค๋ฅธ ์ƒ˜ํ”Œ๋ง ์ „๋žต์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ œ์•ฝ ์กฐ๊ฑด ๊ธฐ๋ฐ˜ ๋ถ„์ž ์ƒ์„ฑ์„ ์œ„ํ•œ ๋‹ค๋ฅธ ๋”ฅ๋Ÿฌ๋‹ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Augmenting large language models with chemistry tools ๋…ผ๋ฌธ์€ LLM๊ณผ ํ™”ํ•™ ๋„๊ตฌ ํ†ตํ•ฉ์„ ํ†ตํ•œ ์‹ ์•ฝ ์„ค๊ณ„ ๋ฐฉ์‹์˜ ๋˜ ๋‹ค๋ฅธ ๊ตฌํ˜„์„ ๋‹ค๋ฃจ์–ด, ์ž์œจ์  ํ™œ์„ฑ ์˜ˆ์ธก ์ ‘๊ทผ๋ฒ•์— ๋Œ€์•ˆ์  ์‹œ๊ฐ์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์•ฝ๋ฌผ ๋ฐœ๊ฒฌ์„ ์œ„ํ•œ ๋ถ„์ž ๋ฌผ์„ฑ ์˜ˆ์ธก์— LLM์„ ํ™œ์šฉํ•˜๋Š” ์œ ์‚ฌํ•œ ์ ‘๊ทผ๋ฒ•์„ ๋‹ค๋ฃจ๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ๋ถ„์ž ๋ฌผ์„ฑ ์˜ˆ์ธก ๋ฐ ํ™”ํ•™ ์ถ”๋ก ์— ์ ์šฉํ•˜๋Š” ์œ ์‚ฌํ•œ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™”ํ•™ ํ•ฉ์„ฑ ๊ณ„ํš ๋ฐ ์ถ”๋ก ์— ์ ์šฉํ•˜๋Š” ์œ ์‚ฌํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ํ™”ํ•™ ๋„๊ตฌ ํ™•์žฅ LLM ์ ‘๊ทผ(115)์€ 304์˜ ๊ทธ๋ž˜ํ”„ ์‹ ๊ฒฝ๋ง ๊ธฐ๋ฐ˜ ๋ถ„์ž ์˜ˆ์ธก๊ณผ ๊ทผ๋ณธ์ ์œผ๋กœ ๋‹ค๋ฅธ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ์„ ๋ณด์—ฌ์ค€๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ํ™”ํ•™ํ•ฉ์„ฑ ์ž๋™ํ™” ํ”Œ๋žซํผ์˜ ํŠน์ • ๋‹จ๊ณ„(์˜ˆ: ๋ฐ˜์‘ ์˜ˆ์ธก ๋˜๋Š” ๊ทœ๋ชจ ํ™•๋Œ€)๋ฅผ ์‹ฌํ™” ์—ฐ๊ตฌํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
115๋ฒˆ ๋…ผ๋ฌธ์€ LLM์— ์‹ค์ œ ํ™”ํ•™ ๋„๊ตฌ๋ฅผ ์ ‘๋ชฉ์‹œํ‚ค๋Š” ์ „๋žต์„ ๋‹ค๋ฃจ์–ด, OSDA Agent์˜ ๊ณ„์‚ฐํ™”ํ•™ ๊ฒฐํ•ฉ ๋ฐฉ์‹๊ณผ ์ด์–ด์ง‘๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
TxAgent๋Š” ChemCrow์˜ ๋‹ค์ค‘ ํ™”ํ•™ ๋„๊ตฌ-LLM ํ†ตํ•ฉ ๊ฐœ๋…์„ ๋ฐ”์ด์˜ค์˜์•ฝ ๋ฐ ์ž„์ƒ ์ •๋ณด ๊ธฐ๋ฐ˜ ์ •๋ฐ€ ์น˜๋ฃŒ ๋ถ„์•ผ๋กœ ํ™•์žฅํ•˜์—ฌ ์ ์šฉํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ํ™”ํ•™ ๋„๊ตฌ์™€ LLM์„ ๊ฒฐํ•ฉํ•œ ์ ‘๊ทผ๋ฒ•์ด ๋„ํ‚นยท์žฌ๋žญํ‚น์— ์–ด๋–ป๊ฒŒ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ์„์ง€ ๋…ผ์˜ํ•˜๋Š” ์‹ค์šฉ์  ๋งฅ๋ฝ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
LLM ๊ธฐ๋ฐ˜ ๋„ํŠธํŒํŠธ ๋ฐœ๊ฒฌ ์ตœ์ ํ™” ๋…ผ๋ฌธ์€ ChemCrow ์ ‘๊ทผ๋ฒ•์˜ ์‹ค์ œ ์‘์šฉ ์‚ฌ๋ก€๋กœ, ์ƒˆ๋กœ์šด ํ™”ํ•™์  ์ธ์‚ฌ์ดํŠธ ์‹คํ˜„ ์‚ฌ๋ก€๋ฅผ ์ฐธ๊ณ ํ•  ์ˆ˜ ์žˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •