ChemReasoner: Heuristic Search over a Large Language Model's Knowledge Space using Quantum-Chemical Feedback

์ €์ž: Henry W. Sprueill, Carl N. Edwards, Khushbu Agarwal, Mariefel V. Olarte, Udishnu Sanyal | ๋‚ ์งœ: 2024 | DOI: 10.48550/arXiv.2402.10980 📄 PDF


Essence

Figure 1

ChemReasoner๋Š” ๋‹ค์–‘ํ•œ ํ™”ํ•™์  ์ œ์•ฝ๊ณผ ์ธ์ž๋ฅผ ์ˆœ์ฐจ์ ์œผ๋กœ ๊ณ ๋ คํ•˜์—ฌ LLM์˜ ์ง€์‹ ๊ณต๊ฐ„์„ ํƒ์ƒ‰ํ•˜๊ณ , ์–‘์žํ™”ํ•™ ํ”ผ๋“œ๋ฐฑ์œผ๋กœ ๋ณด์ƒ์„ ๊ณ„์‚ฐํ•˜์—ฌ ์ด‰๋งค ๋ฐœ๊ฒฌ์˜ ์ตœ์ ํ•ด๋ฅผ ๋„์ถœํ•œ๋‹ค.

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์˜ ์ž๋™ํ™”๋œ ํœด๋ฆฌ์Šคํ‹ฑ ํƒ์ƒ‰(heuristic search)๊ณผ ์–‘์žํ™”ํ•™ ํ”ผ๋“œ๋ฐฑ์„ ๊ฒฐํ•ฉํ•˜์—ฌ ์ด‰๋งค ๋ฐœ๊ฒฌ์„ ๊ฐ€์†ํ™”ํ•˜๋Š” AI ๊ธฐ๋ฐ˜ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•œ๋‹ค. ์–ธ์–ด ๊ธฐ๋ฐ˜ ์ถ”๋ก ์˜ ์œ ์—ฐ์„ฑ๊ณผ ๊ณ„์‚ฐํ™”ํ•™์˜ ์ •ํ™•์„ฑ์„ ํ†ตํ•ฉํ•˜์—ฌ ์ƒˆ๋กœ์šด ์ด‰๋งค์˜ ๋ฐœ๊ฒฌ ๊ณผ์ •์„ ํ˜์‹ ํ•œ๋‹ค.

Motivation

Achievement

Figure 2

์ดˆ๊ธฐ ์งˆ๋ฌธ์—์„œ ๊ธฐ๋ณธ ํ›„๋ณด๋ฅผ ์ƒ์„ฑํ•œ ํ›„, ์ œ์•ฝ์กฐ๊ฑด์„ ์ถ”๊ฐ€ํ•˜์—ฌ ๋ฐ˜๋ณต์ ์œผ๋กœ ํƒ์ƒ‰ ๋ฒ”์œ„๋ฅผ ์ขํ˜€๋‚˜๊ฐ€๋ฉฐ ์ตœ์  ์ด‰๋งค๋ฅผ ๋ฐœ๊ฒฌํ•˜๋Š” ๊ณผ์ •์„ ๋ณด์—ฌ์ค€๋‹ค.

  1. ํ†ตํ•ฉ ํ”„๋ ˆ์ž„์›Œํฌ ์ œ์•ˆ: LLM ๊ธฐ๋ฐ˜ ํœด๋ฆฌ์Šคํ‹ฑ ํƒ์ƒ‰๊ณผ ์–‘์žํ™”ํ•™ ํ”ผ๋“œ๋ฐฑ์„ ํ†ตํ•ฉํ•˜์—ฌ ์ž์—ฐ์–ธ์–ด ์ถ”๋ก ์— ๋„๋ฉ”์ธ ๊ธฐ๋ฐ˜ ๋ณด์žฅ์„ ์ถ”๊ฐ€ํ•œ ChemReasoner ํ”„๋ ˆ์ž„์›Œํฌ ๊ฐœ๋ฐœ. ๋‹จ์ˆœ ํก์ฐฉ์—๋„ˆ์ง€๋ฟ ์•„๋‹ˆ๋ผ ๋ฐ˜์‘ ๊ฒฝ๋กœ์˜ ์—๋„ˆ์ง€ ์žฅ๋ฒฝ(energy barriers)์„ ํฌํ•จํ•œ ๋ณตํ•ฉ ํ‰๊ฐ€ ๋ฐฉ์‹ ๋„์ž….
  2. ์ž๋™ ๊ณ„ํš์˜ ํšจ๊ณผ ์ž…์ฆ: ์ „๋ฌธ๊ฐ€ ์„ ์ • ํ™”ํ•™ ์„ค๋ช…์ž ๊ธฐ๋ฐ˜ ๊ตฌํ˜„(ChemReasoner-Expert)์„ ์ดˆ๊ณผํ•˜๋Š” ์ˆœ์ˆ˜ LLM ์ž๋™ ๊ณ„ํš ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•(ChemReasoner-Planner) ์„ฑ๋Šฅ ๋‹ฌ์„ฑ. 3๊ฐœ ํ‰๊ฐ€ ๋ฒ”์ฃผ ์ค‘ 2๊ฐœ์—์„œ ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ๋˜๋Š” ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ ์‹œ์—ฐ.
  3. ์žฌํ˜„ ๊ฐ€๋Šฅํ•œ ์˜คํ”ˆ ์‚ฌ์ด์–ธ์Šค: 70๋งŒ ๊ฐœ ์ด์ƒ์˜ ์›์ž ๊ถค์ (atomistic trajectories), ์ด‰๋งค ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ, ์ฝ”๋“œ ๋ฐ ๋ฐ์ดํ„ฐ์…‹ ๊ณต๊ฐœ๋กœ ํ•™์ œ๊ฐ„ ํ˜‘๋ ฅ ์ด‰์ง„.

How

Figure 3

ํ”Œ๋ž˜๋„ˆ ๊ธฐ๋ฐ˜ ํƒ์ƒ‰ ์•ก์…˜ ์ƒ์„ฑ: ์ฟผ๋ฆฌ ์ƒํƒœ๊ฐ€ ์ฃผ์–ด์งˆ ๋•Œ ์ž๋™์œผ๋กœ ์ ์ ˆํ•œ ํ™”ํ•™ ์„ค๋ช…์ž๋ฅผ ์„ ํƒํ•˜๊ณ  ์ƒˆ๋กœ์šด ํƒ์ƒ‰ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๊ณผ์ •.

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ์ด ๋…ผ๋ฌธ์€ LLM์˜ ์ž๋™ํ™”๋œ ๊ณ„ํš๊ณผ ์–‘์žํ™”ํ•™ ๊ธฐ๋ฐ˜ ๋ณด์ƒ์„ ๊ฒฐํ•ฉํ•œ ํ˜์‹ ์ ์ธ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•˜์—ฌ, ์ด‰๋งค ๋ฐœ๊ฒฌ์—์„œ AI์™€ ๊ณ„์‚ฐํ™”ํ•™์˜ ์‹œ๋„ˆ์ง€๋ฅผ ์„ฑ๊ณต์ ์œผ๋กœ ์ž…์ฆํ–ˆ๋‹ค. ์˜คํ”ˆ ์‚ฌ์ด์–ธ์Šค ์ •์‹ ๊ณผ ์žฌํ˜„ ๊ฐ€๋Šฅํ•œ ๊ตฌํ˜„์œผ๋กœ ๋†’์ด ํ‰๊ฐ€๋˜์ง€๋งŒ, ์‹คํ—˜ ๊ฒ€์ฆ ๋ถ€์žฌ์™€ ์ œํ•œ๋œ ์ ์šฉ ๋ฒ”์œ„๊ฐ€ ์•„์‰ฌ์šด ์ ์ด๋‹ค. ํ–ฅํ›„ ์‹ค์ œ ์ด‰๋งค ํ•ฉ์„ฑ๊ณผ ์„ฑ๋Šฅ ๊ฒ€์ฆ์„ ํ†ตํ•ด ๋ฐฉ๋ฒ•๋ก ์˜ ์‹ค์งˆ์  ๊ฐ€์น˜๊ฐ€ ๋”์šฑ ๋ช…ํ™•ํ•ด์งˆ ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
464๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ ๊ตฌ์กฐ์˜ ๋ฐฉ๋ฒ•๋ก  ๋ฐ ์žฅ๋‹จ์ ์„ ์ •๋ฆฌํ•˜์—ฌ, ChemReasoner ํ”„๋ ˆ์ž„์›Œํฌ์˜ ํ‰๊ฐ€์™€ ์„ค๊ณ„์˜ ๋ฐฐ๊ฒฝ์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
461์˜ LLM ๊ธฐ๋ฐ˜ ์—ญํ•ฉ์„ฑ ๊ณ„ํš์€ 213์˜ LLM์„ ํ™œ์šฉํ•œ ํ™”ํ•™ ์ถ”๋ก /ํ•ฉ์„ฑ ์ „๋žต ํƒ์ƒ‰ ๋ฐฉ๋ฒ•๋ก ์—์„œ ์˜๊ฐ์„ ๋ฐ›์•˜์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
213๋ฒˆ ๋…ผ๋ฌธ์€ ํ™”ํ•™ ๋ฌธ์ œ์—์„œ LLM ๊ธฐ๋ฐ˜ ์ถ”๋ก  ๋ฐ ๋„๊ตฌ ๊ฒฐํ•ฉ์˜ ์‹œ๋ฒ” ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•˜์—ฌ, 594๋ฒˆ์˜ ๊ณ„์‚ฐํ™”ํ•™ ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ ์„ค๊ณ„์— ๊ธฐ๋ฐ˜ ๊ฐœ๋…์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
002๋Š” ์žฌ๋ฃŒ/ํ™”ํ•™ ๋ถ„์•ผ์—์„œ LLM ์‘์šฉ ์‚ฌ๋ก€ 34๊ฐ€์ง€๋ฅผ ๋ถ„์„ํ•˜์—ฌ ChemReasoner(213)๊ฐ€ ์ด‰๋งค ๋ฐœ๊ฒฌ ์ž๋™ํ™”์— ์“ด ๋ฐฉ๋ฒ•๊ณผ ๋‹ค์–‘ํ•œ ์˜ต์…˜์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
213 ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์˜ ํ™”ํ•™์  ์ถ”๋ก  ๋ฐ ์—ญํ•ฉ์„ฑ ๊ฒ€์ƒ‰ ์ „๋žต์„ ๊ทœ์น™ ๊ธฐ๋ฐ˜ ํƒ์ƒ‰์œผ๋กœ ์ ‘๊ทผํ•ด, 316 ๋…ผ๋ฌธ์˜ ChemDual LLM ๋ฐ ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• ํ•™์Šต๋ฒ•๊ณผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
213 ๋…ผ๋ฌธ์€ ๋Œ€ํ˜• ์–ธ์–ด๋ชจ๋ธ ๊ธฐ๋ฐ˜ ํ™”ํ•™ ์ถ”๋ก ์—์„œ ํœด๋ฆฌ์Šคํ‹ฑ ๊ฒ€์ƒ‰์„ ๋„์ž…, 209์—์„œ์˜ ๋™์  ๋ฉ”๋ชจ๋ฆฌ ๋ฐ ๊ฒฝํ—˜ํ•™์Šต ๋ฐฉ์‹๊ณผ ์ฐจ๋ณ„์ ์„ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋„๊ตฌ ์ง€์‹ ๊ทธ๋ž˜ํ”„(SciToolKG)๋ฅผ ํ†ตํ•œ ์—์ด์ „ํŠธ ์„ค๊ณ„ ๋Œ€์‹ , ํ™”ํ•™๋ถ„์•ผ์—์„œ LLM ๊ธฐ๋ฐ˜ ํœด๋ฆฌ์Šคํ‹ฑ ํƒ์ƒ‰ ์ ‘๊ทผ์„ ์‹œ๋„ํ•˜์—ฌ ๋ฐฉ๋ฒ•์  ๋‹ค์–‘์„ฑ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Automating Computational Chemistry Workflows ๋…ผ๋ฌธ์€ ๊ณ„์‚ฐ ํ™”ํ•™ ์›Œํฌํ”Œ๋กœ์šฐ์˜ LLM ์ž๋™ํ™” ๋ฐฉ์‹์„ ์ œ์‹œํ•ด ChemReasoner์™€ ๋Œ€์กฐ์ ์œผ๋กœ ์ ‘๊ทผํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ ์ƒ์„ฑ๋Šฅ๋ ฅ์— ํœด๋ฆฌ์Šคํ‹ฑ ํƒ์ƒ‰์„ ๊ฒฐํ•ฉํ•œ ํ™”ํ•™์  ํ›„๋ณด๊ตฐ ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ์„ ๋น„๊ตยท์‘์šฉํ•  ์ˆ˜ ์žˆ์Œ.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ ํœด๋ฆฌ์Šคํ‹ฑ ํ™”ํ•ฉ๋ฌผ ํƒ์ƒ‰ยท์„ค๊ณ„ ๊ธฐ๋Šฅ์„ ํ™œ์šฉํ•œ ์•ฝ๋ฌผ ๋ฐœ๊ตด ์ ‘๊ทผ์œผ๋กœ, ๋ฐ˜๋ณต ๋ฏธ์„ธ์กฐ์ •๊ณผ ์ฐจ๋ณ„์ ์„ ๋ณด์ธ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ChemReasoner๋Š” LLM ๋‚ด ์ž ์žฌ์  ๋ฐ˜์‘ ๊ฒฝ๋กœ ํƒ์ƒ‰์„ ๋‹ค๋ฃจ๋ฏ€๋กœ, Synthegy์˜ ํ™”ํ•™ ์ „๋žต ์ง€์‹œ ๊ธฐ๋ฐ˜ ํ‰๊ฐ€์™€ ๋น„๊ตํ•ด ์ž๋™ ํ•ฉ์„ฑ ๊ฒฝ๋กœ ํ‰๊ฐ€ ์ „๋žต์„ ์ฐธ๊ณ ํ•  ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ํ™”ํ•™ ์‹คํ—˜ ์ง€์‹๊ณผ LLM์˜ ํƒ์ƒ‰์  ์‹œ๋„ˆ์ง€๋ฅผ ํ™œ์šฉํ•œ ์ž๋™ํ™”๋œ ํ•ฉ์„ฑ ๋ฐ ์„ค๊ณ„ ์ ์šฉ ์‚ฌ๋ก€๋กœ ChemCrow์˜ ์‹ค์งˆ์  ํ™œ์šฉ์„ ํ™•์žฅํ•จ.
ํ›„์† ์—ฐ๊ตฌ
CACTUS ๋…ผ๋ฌธ์€ ํ™”ํ•™ ๋ฐ˜์‘ ๊ฒฝ๋กœ ํƒ์ƒ‰๊ณผ ๋„๊ตฌ ์—ฐ๊ณ„ AI ์—์ด์ „ํŠธ๋ฅผ ์ œ์•ˆํ•ด ChemReasoner๊ฐ€ ์ฃผ์žฅํ•˜๋Š” ์ด‰๋งค ํƒ์ƒ‰ ์ž๋™ํ™”์™€ ์—ฐ๊ด€๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
533๋ฒˆ ๋…ผ๋ฌธ์€ ์–ธ์–ด๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์‹คํ—˜ ๋ฐ ์„ค๊ณ„ ์ž๋™ํ™”์˜ ๋ฉ”ํƒ€ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์–‘์ž์ปดํ“จํŒ…์— ์ ์šฉํ•ด, 213๋ฒˆ์˜ ์ด๋ก ๊ณผ ์‹คํ—˜ ์—ฐ๊ณ„ ๊ฐœ๋…์„ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ReviewAgents ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์ถ”๋ก  ์—์ด์ „ํŠธ์˜ ํ‰๊ฐ€์™€ ํ•œ๊ณ„์ ์„ ๋ถ„์„ํ•˜์—ฌ ์‹ค์ œ ์ด‰๋งค ๋ฐœ๊ฒฌ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•์— ์ธ์‚ฌ์ดํŠธ๋ฅผ ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
213๋ฒˆ ๋…ผ๋ฌธ์€ LLM ์‹œ์Šคํ…œ์˜ ๊ตฌ์ƒยทํƒ์ƒ‰์—์„œ ์‹ค์ œ ๊ณผํ•™์  ์‹คํ—˜ ๊ตฌํ˜„๊นŒ์ง€ ์—ฐ๊ณ„๊ฐ€ ์ค‘์š”ํ•จ์„ ์‹ค์ฆ์ ์œผ๋กœ ๊ฐ•์กฐํ•˜์—ฌ, 081๋ฒˆ ์ž…์žฅ์— ๋‹ต๋ณ€์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋Œ€ํ˜• LLM์— ํ™”ํ•™ ๋„๋ฉ”์ธ ํœด๋ฆฌ์Šคํ‹ฑ ์ง€์‹์„ ๊ฒฐํ•ฉํ•œ ํƒ์ƒ‰ยท์ตœ์ ํ™” ๋ฐฉ๋ฒ•์„ ๋”์šฑ ํ™•์žฅํ•จ.
์‘์šฉ ์‚ฌ๋ก€
213๋ฒˆ ๋…ผ๋ฌธ์€ ์–ธ์–ด๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ํƒ์ƒ‰๊ณผ ์–‘์ž๊ณ„์‚ฐ ํ”ผ๋“œ๋ฐฑ์˜ ๊ฒฐํ•ฉ์„ ์ด‰๋งค์„ค๊ณ„์— ์ ์šฉํ•˜์—ฌ 533๋ฒˆ์˜ ๋ฉ”ํƒ€-์‹คํ—˜ ์›๋ฆฌ๋ฅผ ์‹ค์ œ ์—ฐ๊ตฌ์— ์—ฐ๊ฒฐํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •