ChemCrow: Augmenting large-language models with chemistry tools

์ €์ž: Andres M Bran, Sam Cox, Oliver Schilter, Carlo Baldassari, Andrew D White, Philippe Schwaller | ๋‚ ์งœ: 2023-04-11 | DOI: N/A 📄 PDF


Essence

Figure 1

๊ทธ๋ฆผ 1: ChemCrow์˜ ๊ฐœ์š” ๋ฐ ๋„๊ตฌ ์ง‘ํ•ฉ. (a) ์ž‘์—… ํ•ด๊ฒฐ ํ”„๋กœ์„ธ์Šค์˜ ๊ฐœ์š”. (b) ๊ตฌํ˜„๋œ 18๊ฐœ์˜ ๋„๊ตฌ ์„ธํŠธ

๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์— 18๊ฐœ์˜ ํ™”ํ•™ ์ „๋ฌธ ๋„๊ตฌ๋ฅผ ํ†ตํ•ฉํ•˜์—ฌ ์œ ๊ธฐํ•ฉ์„ฑ, ์‹ ์•ฝ ๊ฐœ๋ฐœ, ์žฌ๋ฃŒ ์„ค๊ณ„ ๋“ฑ ๋‹ค์–‘ํ•œ ํ™”ํ•™ ์ž‘์—…์„ ์ž์œจ์ ์œผ๋กœ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋Š” ChemCrow ์—์ด์ „ํŠธ๋ฅผ ๊ฐœ๋ฐœํ–ˆ๋‹ค. GPT-4๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋Š” ์ด ์‹œ์Šคํ…œ์€ Thought-Action-Observation ๋ฃจํ”„๋ฅผ ํ†ตํ•ด ํ™”ํ•™ ๋ฌธ์ œ ํ•ด๊ฒฐ์—์„œ LLM์˜ ๊ณ ์งˆ์  ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•œ๋‹ค.

Motivation

Achievement

Figure 2

๊ทธ๋ฆผ 2: ์‹คํ—˜ ๊ฒ€์ฆ. (a) ์‚ฌ์šฉ์ž๊ฐ€ ChemCrow๋ฅผ ์‹œ์ž‘ํ•˜๋Š” ์Šคํฌ๋ฆฝํŠธ ์˜ˆ์‹œ. (b) ํ‹ฐ์˜ค์šฐ๋ ˆ์•„ ์œ ๊ธฐ์ด‰๋งค ์ฟผ๋ฆฌ ๋ฐ ํ•ฉ์„ฑ. (c) IBM Research RoboRXN ํ•ฉ์„ฑ ํ”Œ๋žซํผ. (d) ์‹คํ—˜์œผ๋กœ ๊ฒ€์ฆ๋œ ํ™”ํ•ฉ๋ฌผ๋“ค

Figure 3

๊ทธ๋ฆผ 3: ์‹ ๊ทœ ์ƒ‰์†Œ ๋ฐœ๊ฒฌ์œผ๋กœ ์ด์–ด์ง„ ์ธ๊ฐ„-AI ํ˜‘๋ ฅ. ์ขŒ์ธก: ์ธ๊ฐ„์˜ ์ž…๋ ฅ ๋ฐ ํ–‰๋™. ์šฐ์ธก: ChemCrow์˜ ํ–‰๋™ ๋ฐ ์ตœ์ข… ์ œ์•ˆ

  1. ์ž์œจ ํ™”ํ•™ ํ•ฉ์„ฑ: ChemCrow๋Š” "๊ณค์ถฉ ๊ธฐํ”ผ์ œ ํ•ฉ์„ฑ ๊ณ„ํš ๋ฐ ์‹คํ–‰"์ด๋ผ๋Š” ๋‹จ์ˆœํ•œ ์ž…๋ ฅ์œผ๋กœ๋ถ€ํ„ฐ DEET ๋ฐ 3๊ฐœ์˜ ํ‹ฐ์˜ค์šฐ๋ ˆ์•„ ์œ ๊ธฐ์ด‰๋งค(Schreiner's, Ricci's, Takemoto's)์˜ ํ•ฉ์„ฑ์„ ์ž์œจ์ ์œผ๋กœ ๊ณ„ํšํ•˜๊ณ  ์‹คํ–‰ํ–ˆ๋‹ค. RoboRXN ํ”Œ๋žซํผ์—์„œ 4๊ฐœ์˜ ํ•ฉ์„ฑ์ด ๋ชจ๋‘ ์„ฑ๊ณต์ ์œผ๋กœ ์ˆ˜ํ–‰๋˜์—ˆ์œผ๋ฉฐ, ActionCleaner ๊ธฐ๋Šฅ์„ ํ†ตํ•ด ์œ ํšจํ•˜์ง€ ์•Š์€ ํ•ฉ์„ฑ ์ ˆ์ฐจ๋ฅผ ์ž๋™์œผ๋กœ ๋ฐ˜๋ณต ์ˆ˜์ •ํ•˜์˜€๋‹ค.
  2. ์ธ๊ฐ„-AI ํ˜‘๋ ฅ์„ ํ†ตํ•œ ์‹ ๊ทœ ๋ถ„์ž ๋ฐœ๊ฒฌ: ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ ํ•™์Šต, ๋ฐ์ดํ„ฐ ์ •์ œ, ํŠน์„ฑ ์˜ˆ์ธก์„ ์ž๋™์œผ๋กœ ์ˆ˜ํ–‰ํ•˜์—ฌ ๋ชฉํ‘œ ํŒŒ์žฅ(369nm)์— ๊ทผ์ ‘ํ•œ ์‹ ๊ทœ ์ƒ‰์†Œ(E)-3-methyl-4-(2-(3'-(methylsulfonamido)-[1,1'-biphenyl]-4-yl)vinyl)benzoate๋ฅผ ์ œ์•ˆํ–ˆ์œผ๋ฉฐ, ์‹คํ—˜์  ํ•ฉ์„ฑ๊ณผ ๋ถ„์„์„ ํ†ตํ•ด ๊ฒ€์ฆ(์ธก์ • ํŒŒ์žฅ 336nm)๋˜์—ˆ๋‹ค.
  3. ๊ด‘๋ฒ”์œ„ํ•œ ํ‰๊ฐ€: 14๊ฐœ์˜ ์‚ฌ์šฉ ์‚ฌ๋ก€์—์„œ ChemCrow์™€ ์ˆœ์ˆ˜ GPT-4์˜ ์„ฑ๋Šฅ์„ LLM ๊ธฐ๋ฐ˜ ํ‰๊ฐ€์ž(EvaluatorGPT)์™€ ์ „๋ฌธ๊ฐ€ ์ธ๊ฐ„ ํ‰๊ฐ€๋ฅผ ํ†ตํ•ด ๋น„๊ต ๋ถ„์„ํ–ˆ์œผ๋ฉฐ, ChemCrow์˜ ํ™”ํ•™ ์ž‘์—… ์ž๋™ํ™” ํšจ๊ณผ๋ฅผ ์ž…์ฆํ–ˆ๋‹ค.

How

Figure 4

๊ทธ๋ฆผ 4: ๋‹ค์–‘ํ•œ ํ™”ํ•™ ์ž‘์—… ๋ฒ”์œ„์—์„œ GPT-4์™€ ChemCrow์˜ ๋น„๊ต ์„ฑ๋Šฅ

Figure 5

๊ทธ๋ฆผ 5: ChemCrow๊ฐ€ ์ œ๊ณตํ•˜๋Š” ์•ˆ์ „ ์ง€์นจ ์˜ˆ์‹œ

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ChemCrow๋Š” LLM์„ ํ™”ํ•™ ๋„๊ตฌ์™€ ๋ฌผ๋ฆฌ์  ์‹คํ—˜ ํ”Œ๋žซํผ์— ํšจ๊ณผ์ ์œผ๋กœ ์—ฐ๊ฒฐํ•˜์—ฌ ์ž์œจ ํ™”ํ•™ ํ•ฉ์„ฑ๊ณผ ์‹ ๊ทœ ๋ถ„์ž ๋ฐœ๊ฒฌ์„ ์‹คํ˜„ํ•œ ํš๊ธฐ์  ์—ฐ๊ตฌ๋‹ค. ํŠนํžˆ ์‹คํ—˜ ๊ฒ€์ฆ๊ณผ ์ธ๊ฐ„-AI ํ˜‘๋ ฅ ์‚ฌ๋ก€๋Š” ์„ค๋“๋ ฅ ์žˆ์œผ๋‚˜, LLM ํ‰๊ฐ€์ž์˜ ์‹ ๋ขฐ์„ฑ ๋ฌธ์ œ์™€ ๋„๊ตฌ ์ง‘ํ•ฉ์˜ ์ œํ•œ์„ฑ, ์™„์ „ ์ž๋™ํ™” ๋‹ฌ์„ฑ์˜ ๋ฏธํกํ•จ์€ ํ–ฅํ›„ ๊ฐœ์„ ์ด ํ•„์š”ํ•œ ๊ณผ์ œ๋กœ ๋‚จ๋Š”๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ChemCrow(210)๋Š” LLM์ด ํ™”ํ•™ ๋„๊ตฌ ํ™œ์šฉ๊ณผ ์ „๋ฌธ ์ง€์‹ ํ†ตํ•ฉ์„ ๊ฐ•์กฐํ•˜์—ฌ ChemDFM ๊ธฐ๋ฐ˜ ์ž์œ ๋กœ์šด ํ™”ํ•™ AI ์กฐ์ˆ˜์˜ ์ „์‹  ์—ญํ• ์„ ํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ChemCrow๋Š” LLM์ด ํ™”ํ•™ ๋ฌธํ—Œ์—์„œ ๋ฐ˜์‘ ์ •๋ณด ์ถ”์ถœ ๋ฐ ํ™”ํ•™ ๋ฐ์ดํ„ฐ ๊ตฌ์ถ•์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์— ๋Œ€ํ•œ ์ดˆ๊ธฐ ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
210๋ฒˆ ๋…ผ๋ฌธ์€ LLM์„ ํ™œ์šฉํ•œ ํ™”ํ•™ ์‹คํ—˜ ๋ฐ ํ•ฉ์„ฑ ์ž๋™ํ™”์˜ ๋„๊ตฌ์œตํ•ฉ ์ „๋žต์„ ์ œ์‹œํ•ด, BOLEK์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌยท๋„๋ฉ”์ธ ์œตํ•ฉ ์•„์ด๋””์–ด์— ๋Œ€ํ•œ ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
210 ๋…ผ๋ฌธ์€ LLM์— ๋‹ค์–‘ํ•œ ํ™”ํ•™๋„๊ตฌ ์‚ฌ์šฉ์„ ๊ฒฐํ•ฉ, 138์˜ LLM multi-agent ์‹คํ—˜ ์ž๋™ํ™”์™€ ๋‹ค๋ฅธ ์ „๋žต์  ์ ‘๊ทผ์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ChemToolAgent๋Š” LLM ๊ธฐ๋ฐ˜ ํ™”ํ•™ ์—์ด์ „ํŠธ์˜ ๋„๊ตฌ ์‚ฌ์šฉ ๋ฐฉ์‹์˜ ํ•œ๊ณ„๋ฅผ ํ‰๊ฐ€ํ•˜๋ฉฐ, ChemCrow์™€ ์„ฑ๋Šฅ ๋น„๊ต์— ์ข‹์€ ๋Œ€์ƒ์œผ๋กœ ์‚ผ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
210์€ ํ™”ํ•™ ์ •๋ณด์ฒ˜๋ฆฌ์—์„œ ๋‹ค์–‘ํ•œ ๋„๊ตฌ ํ™œ์šฉ ๊ธฐ๋ฐ˜ LLM ๋ณด์กฐ ์—์ด์ „ํŠธ ์ „๋žต์„ ์ œ์‹œํ•˜์—ฌ, 176์˜ CACTUS ์‹œ์Šคํ…œ๊ณผ ์œ ์‚ฌํ•œ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅธ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ์ ‘๊ทผํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Augmenting large language models with chemistry tools ๋…ผ๋ฌธ์€ ChemCrow์˜ ์›๋ฆฌ์™€ ์œ ์‚ฌํ•˜๊ฒŒ LLM๊ณผ ํ™”ํ•™ ์ „๋ฌธ ๋„๊ตฌ์˜ ํ†ตํ•ฉ ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ์‹ฌ์ธต ๋ถ„์„ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ™”ํ•™ ๋ฐ˜์‘ ๋„์ถœ ๋ฐ ์‹คํ–‰์„ ์œ„ํ•ด LLM๊ณผ ํ™”ํ•™ ๋„๊ตฌ๋ฅผ ๊ฒฐํ•ฉํ•˜๋Š” ChemCrow์˜ ์ ‘๊ทผ์ด retrosynthesis ์ž๋™ํ™”์™€ ๋น„๊ต๋จ.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM๊ณผ ํ™”ํ•™ ๋„๊ตฌ ํ†ตํ•ฉ์„ ํ†ตํ•œ ์›Œํฌํ”Œ๋กœ์šฐ ์ž๋™ํ™” ๊ตฌํ˜„ ๋ฐฉ์‹์— ๋Œ€ํ•œ ๋Œ€์•ˆ์  ์‚ฌ๋ก€ ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™”ํ•™ ๋„๊ตฌ์™€ ๊ฒฐํ•ฉํ•˜์—ฌ ํ•ฉ์„ฑ ์ „๋žต์„ ์ƒ์„ฑํ•˜๋Š” ๋Œ€์•ˆ์  ์ ‘๊ทผ๋ฒ•์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Chemist-X(212)๋Š” 210์˜ ChemCrow LLM+๋„๊ตฌ ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋ฐ˜์‘ ๊ฒฝ๋กœ ์„ค๊ณ„๋กœ ํ™•๋Œ€ ์ ์šฉํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ํ™”ํ•™ ์‹คํ—˜ ์ง€์‹๊ณผ LLM์˜ ํƒ์ƒ‰์  ์‹œ๋„ˆ์ง€๋ฅผ ํ™œ์šฉํ•œ ์ž๋™ํ™”๋œ ํ•ฉ์„ฑ ๋ฐ ์„ค๊ณ„ ์ ์šฉ ์‚ฌ๋ก€๋กœ ChemCrow์˜ ์‹ค์งˆ์  ํ™œ์šฉ์„ ํ™•์žฅํ•จ.
ํ›„์† ์—ฐ๊ตฌ
ChemCrow๋Š” LLM+tool ์ ‘๋ชฉ ๋ฐฉ์‹์œผ๋กœ CRISPR ๋“ฑ ๋ณต์žกํ•œ ์ƒ๋ฌผํ•™ ์‹คํ—˜ ์ž๋™ํ™”์˜ ํ™•์žฅ๊ฐ€๋Šฅ์„ฑ์„ ์‹ค์ œ ์‚ฌ๋ก€๋กœ ๋ณด์—ฌ์ค€๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ChemAgent๋Š” ChemCrow์™€ ์œ ์‚ฌํ•˜๊ฒŒ ํ™”ํ•™ ์ „๋ฌธ๊ฐ€ ๋„๊ตฌ๋ฅผ LLM๊ณผ ํ†ตํ•ฉํ•˜์—ฌ ํ™”ํ•™ ์‹คํ—˜ ๋ฐ ์—ฐ๊ตฌ ์ž๋™ํ™”๋ฅผ ๊ณ ๋„ํ™”ํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์ž์œจ ์‹คํ—˜ ํ”Œ๋žซํผ์„ ํŠน์ • ํ™”ํ•™ ๋ฐ˜์‘ ์ตœ์ ํ™”์— ์ ์šฉํ•œ ์‚ฌ๋ก€ ์—ฐ๊ตฌ์ด๋‹ค
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •