DrugAgent: Automating AI-aided Drug Discovery Programming through LLM Multi-Agent Collaboration

์ €์ž: Sizhe Liu, Yizhou Lu, Siyu Chen, Xiyang Hu, Jieyu Zhao | ๋‚ ์งœ: 2024 | DOI: 10.48550/arXiv.2411.15692 📄 PDF


Essence

Figure 1

DrugAgent ํ”„๋ ˆ์ž„์›Œํฌ ๊ฐœ์š”: LLM Planner์™€ LLM Instructor์˜ ํ˜‘๋ ฅ์„ ํ†ตํ•ด ์ž์—ฐ์–ธ์–ด๋กœ ํ‘œํ˜„๋œ ์‹ ์•ฝ ๋ฐœ๊ฒฌ ๊ณผ์ œ๋ฅผ ์ž๋™์œผ๋กœ ML ํ”„๋กœ๊ทธ๋ž˜๋ฐ์œผ๋กœ ๋ณ€ํ™˜

LLM ๊ธฐ๋ฐ˜ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ DrugAgent๋Š” ์‹ ์•ฝ ๋ฐœ๊ฒฌ ๋ถ„์•ผ์˜ ์ „๋ฌธ์  ์ง€์‹์„ ํ†ตํ•ฉํ•˜์—ฌ ์ผ๋ฐ˜ ๋ชฉ์  AI ์—์ด์ „ํŠธ์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ณ , DTI(์•ฝ๋ฌผ-ํ‘œ์  ์ƒํ˜ธ์ž‘์šฉ) ์˜ˆ์ธก์—์„œ ReAct ๋Œ€๋น„ 4.92% ํ–ฅ์ƒ๋œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค.

Motivation

Achievement

Figure 2

DAVIS(DTI) ๋ฐ์ดํ„ฐ์…‹์—์„œ ์˜ค๋ฅ˜ ๋ชจ๋“œ ๋ถ„์„: ReAct์™€ ResearchAgent๋Š” ๋„๋ฉ”์ธ ์ง€์‹์ด ํ•„์š”ํ•œ ๋‹จ๊ณ„์—์„œ ์˜ค๋ฅ˜ ๋ฐœ์ƒ ๋น„์œจ์ด ๋†’์ง€๋งŒ, DrugAgent๋Š” ํ•ด๋‹น ์นดํ…Œ๊ณ ๋ฆฌ์—์„œ ์˜ค๋ฅ˜๊ฐ€ ์—†์Œ

  1. ์„ฑ๋Šฅ ์šฐ์œ„: DrugAgent@Top3๋Š” ADMET์—์„œ 0.8206, HTS์—์„œ 0.8257, DTI์—์„œ 0.8950์˜ ROC-AUC ๋‹ฌ์„ฑ. ReAct ๋Œ€๋น„ DTI ๊ณผ์ œ์—์„œ 4.92% ์ƒ๋Œ€ ๊ฐœ์„ ์œจ, ์ „ ๊ณผ์ œ์—์„œ 100% ์œ ํšจ ์ œ์ถœ๋ฅ  ๋‹ฌ์„ฑ(ReAct๋Š” 50-87.5%).
  2. ๋„๋ฉ”์ธ ์ง€์‹ ํ†ตํ•ฉ์˜ ํšจ๊ณผ: ์˜ค๋ฅ˜ ์ถ”์  ๋ถ„์„ ๊ฒฐ๊ณผ DrugAgent๋Š” ๋„๋ฉ”์ธ ์ง€์‹์ด ํ•„์š”ํ•œ ๋‹จ๊ณ„์—์„œ์˜ ์˜ค๋ฅ˜ ๋น„์œจ์ด 0%๋กœ, ์ผ๋ฐ˜ ์—์ด์ „ํŠธ ๋Œ€๋น„ ํ˜„์ €ํžˆ ๋‚ฎ์€ ์˜ค๋ฅ˜์œจ(ReAct, ResearchAgent๋Š” 30-40% ์˜ค๋ฅ˜) ๋‹ฌ์„ฑ.
  3. ์ „๋ฌธ๊ฐ€ ์ˆ˜์ค€ ์„ฑ๋Šฅ: ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€ ๊ธฐ์ค€(Human Baseline)๊ณผ ๋น„๊ตํ•˜์—ฌ competitiveํ•œ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ (DTI์—์„œ ๋™์ผ ์„ฑ๋Šฅ 0.8950).

How

Figure 1

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.25/5

์ดํ‰: DrugAgent๋Š” ์‹ ์•ฝ ๋ฐœ๊ฒฌ ๋ถ„์•ผ์˜ ๋„๋ฉ”์ธ ์ง€์‹์„ LLM ์—์ด์ „ํŠธ์— ์ฒด๊ณ„์ ์œผ๋กœ ํ†ตํ•ฉํ•˜๋Š” ์‹ค์งˆ์  ์ ‘๊ทผ์„ ์ œ์‹œํ•˜๋ฉฐ, ์ผ๋ฐ˜ ๋ชฉ์  ์—์ด์ „ํŠธ ๋Œ€๋น„ ์œ ์˜๋ฏธํ•œ ์„ฑ๋Šฅ ๊ฐœ์„ ๊ณผ ์‹ ๋ขฐ์„ฑ(์œ ํšจ ์ œ์ถœ๋ฅ , ์˜ค๋ฅ˜์œจ)์„ ์ž…์ฆํ–ˆ๋‹ค. ๋‹ค๋งŒ ํ‰๊ฐ€ ๋ฒ”์œ„ ํ™•๋Œ€, ๊ณ„์‚ฐ ๋น„์šฉ ๋ถ„์„, ์‹ค์ œ ์‹ ์•ฝ ๊ฐœ๋ฐœ ํ™˜๊ฒฝ๊ณผ์˜ ๊ฒ€์ฆ์ด ์ถ”๊ฐ€๋˜๋ฉด ์ž„์ƒ ์ ์šฉ์„ฑ์ด ๊ฐ•ํ™”๋  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ReAct(655) ๊ธฐ๋ฐ˜ ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ DrugAgent์˜ reasoning-acting ์‹œ๋„ˆ์ง€ ๋ชจ๋ธ๋ง์—์„œ ๊ทผ๊ฐ„์„ ํ˜•์„ฑํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ์˜๋ฃŒ ์‘์šฉ์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์„ ํ–‰ ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
115(ChemCrow)๋Š” LLM ๊ธฐ๋ฐ˜ ํ™”ํ•™ ์—์ด์ „ํŠธ ์•„ํ‚คํ…์ฒ˜์˜ ์ดˆ๊ธฐ ์‚ฌ๋ก€๋กœ, DrugAgent(290)์˜ ์‹ ์•ฝ๋ฐœ๊ฒฌ ์ž๋™ํ™” ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์ด๋ก ์ ยท๊ตฌํ˜„์  ๊ธฐ๋ฐ˜์ž…๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
290๋ฒˆ ๋…ผ๋ฌธ์€ ์ž๋™ํ™”๋œ ์‹ ์•ฝ๊ฐœ๋ฐœ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์œผ๋กœ, PharmAgents๊ฐ€ ์ถ”๊ตฌํ•˜๋Š” ํ†ตํ•ฉ์  ํŒŒ์ดํ”„๋ผ์ธ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ด๋ฃน๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
DrugAgent ๋…ผ๋ฌธ์€ ์‹ ์•ฝ ์„ค๊ณ„์˜ ํŠน์ • ๋‹จ๊ณ„์—์„œ ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ์™€ ๋„๊ตฌ ํ™œ์šฉ๋ฒ•์„ ์ œ์‹œํ•˜์—ฌ, FROGENT์˜ end-to-end ์ž๋™ํ™” ๊ธฐ๋ฐ˜์„ ๊ตฌ์ถ•ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
DrugAgent๋Š” ์•ฝ๋ฌผ ์„ค๊ณ„ ๊ณผ์ •์˜ LLM ๊ธฐ๋ฐ˜ ์ž๋™ํ™” ์—ฐ๊ตฌ๋กœ, Ara ์—์ด์ „ํŠธ ์›Œํฌํ”Œ๋กœ์šฐ์˜ ๊ธฐ์ˆ ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
DrugAgent๋Š” ์•ฝ๋ฌผ ์žฌ์ฐฝ์ถœ ๋“ฑ ์•ฝ๋ฌผ-์งˆ๋ณ‘ ์ถ”๋ก ์— agent ๊ธฐ๋ฐ˜ ์ ‘๊ทผ์„ ์‚ฌ์šฉํ•˜๋ฏ€๋กœ, DrugCLIP์˜ ๋น„๊ต ๋Œ€์ƒ์œผ๋กœ ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
DrugAgent๋Š” ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ ํ”„๋กœ๊ทธ๋ž˜๋ฐ์„ ์ž๋™ํ™”ํ•˜๋Š” LLM ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์œผ๋กœ, ์œ ์ „์ž ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์ž๋™ํ™”์™€ ์ ‘๊ทผ ๋ฐฉ์‹ ๋น„๊ต์— ๋„์›€์ด ๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‘˜ ๋‹ค ์‹ ์•ฝ ๋ฐœ๊ฒฌ์—์„œ LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ์˜ ํ™œ์šฉ์„ ๋‹ค๋ฃจ์ง€๋งŒ, 290์€ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์ž๋™ํ™”, 651์€ ํˆด ์‚ฌ์šฉ๊ณผ ํ˜‘์—…์„ ๊ฐ•ํ™”ํ•˜๋Š” ์ ์—์„œ ๋น„๊ตํ•  ๋งŒํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
PharmAgents(616)๋Š” ์•ฝ๋ฌผ ๊ฐœ๋ฐœ์šฉ LLM ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, ๋„๊ตฌ ํ†ตํ•ฉ ๋ฐ ํŒŒ์ดํ”„๋ผ์ธ ์ž๋™ํ™”์—์„œ DrugAgent์™€ ๋Œ€๋“ฑํ•œ ๋Œ€์•ˆ์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์‹ ์•ฝ๊ฐœ๋ฐœ์„ ์œ„ํ•œ LLM ๊ธฐ๋ฐ˜ ์ถ”๋ก  ๋ฐ ํŒŒ๋ผ๋ฏธํ„ฐ ์ตœ์ ํ™” ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, ์ œ์•ฝ ์กฐ๊ฑด ๋‚ด ๋…ผ๋ฆฌ์  ๊ณ„ํš ์—ญ๋Ÿ‰์„ ์„œ๋กœ ๋ณด์™„ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
290๋ฒˆ ๋…ผ๋ฌธ์€ ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ์„ ์œ„ํ•œ ํŒŒ๋ผ๋ฏธํ„ฐํ™”๋œ ์ถ”๋ก  ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ๋กœ, ๊ณ„์ธต์ /๊ณผ์ œ ๊ฐ„ ์ผ๋ฐ˜ํ™” ๋ฌธ์ œ์—์„œ ์œ ์‚ฌ ๊ณผ์ œ๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์‹ ์•ฝ ๊ฐœ๋ฐœ์„ ์œ„ํ•œ ๋‹ค๋ฅธ LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•œ ๋Œ€์•ˆ์  ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
DrugAgent ๋…ผ๋ฌธ์€ ์‹ ์•ฝ ๋ฐœ๊ตด ์ž๋™ํ™” ํŒŒ์ดํ”„๋ผ์ธ์—์„œ LLM ๊ธฐ๋ฐ˜ reasoning ๋ฐ ๋ฐ์ดํ„ฐ ํ™œ์šฉ์— ์ดˆ์ ์„ ๋งž์ถ˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
DrugAgent๋Š” ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ ์ž๋™ํ™” ํ”„๋กœ๊ทธ๋ž˜๋ฐ์„ ์ œ์•ˆํ•˜๋ฉฐ, TxAgent์˜ ์น˜๋ฃŒ์  ๋‹ค๋‹จ๊ณ„ ์ถ”๋ก ๊ณผ ์ฐจ๋ณ„์ ์„ ๋‘˜ ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
DrugAgent๋Š” ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์‹ ์•ฝ๊ฐœ๋ฐœ ์ž๋™ํ™”๋ฅผ ์ง€ํ–ฅํ•˜๋ฉฐ, PanMETAI์™€ ๊ฐ™์ด ์ž„์ƒ ๋ฐ ๋ถ„์ž ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ฉํ•ด ์˜ํ•™์  ์ง„๋‹จยท์˜ˆ์ธก์„ ๋…ผ์˜ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM๊ณผ ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ ๊ณผ์ œ ์ž๋™ํ™”๋กœ, ์ •์ฑ… ์ตœ์ ํ™”/์ผ๋ฐ˜ํ™”์˜ ํ•œ๊ณ„๋ฅผ ์—์ด์ „ํŠธ ์„ค๊ณ„ ๊ด€์ ์—์„œ ๋ณด๋‹ค ์‹คํ—˜์ ์œผ๋กœ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
FROGENT ๋…ผ๋ฌธ์€ ์‹ ์•ฝ ์„ค๊ณ„ ์ „ ๊ณผ์ •์„ ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์œผ๋กœ ํ†ตํ•ฉํ•˜์—ฌ DrugAgent์˜ ๋ชจ๋“ˆํ™”๋œ ํŒŒ์ดํ”„๋ผ์ธ์„ ์ด์ฒด์ ์œผ๋กœ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋‘˜ ๋‹ค LLM์„ ํ™œ์šฉํ•œ ์ „์ž„์ƒ ์‹ ์•ฝ๊ฐœ๋ฐœ ์ž๋™ํ™”์ง€๋งŒ, 490(LIDDIA)์ด ๋„๊ตฌ์ฆ๊ฐ•ํ˜• ์—์ด์ „ํŠธ๋ผ๋ฉด 290์€ ๋ฐ์ดํ„ฐ ์ค‘์‹ฌ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์ž๋™ํ™”๋กœ ์„ค๊ณ„ ๊ด€์ ์ด ํ™•์—ฐํžˆ ๋‹ค๋ฆ…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
177์—์„œ ์ œ์‹œํ•œ DO Challenge ๋ฐ Deep Thought์˜ ์‹คํšจ์„ฑ์€ 290 ๋…ผ๋ฌธ์˜ ์ž๋™ํ™”๋œ LLM ๊ธฐ๋ฐ˜ ์‹ ์•ฝ ๋ฐœ๊ฒฌ ์‹œ์Šคํ…œ ์‚ฌ๋ก€์—์„œ ํ™•์žฅ์ ์œผ๋กœ ๊ฒ€ํ† ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI-์ฝ”๋”ฉ ๊ธฐ๋ฐ˜ ๋“œ๋Ÿญ๋””์Šค์ปค๋ฒ„๋ฆฌ ์ž๋™ํ™” pipeline ์—ฐ๊ตฌ๋กœ, ํฌ๊ฒŒ ๋ณด๋ฉด Latent-Y์™€ ์œ ์‚ฌ ๋ชฉํ‘œ์— ๋„๋‹ฌํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Can large language models detect misinformation in scientific news ๋…ผ๋ฌธ์€ LLM ์‘์šฉ์—์„œ ์‹ ๋ขฐ์„ฑ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•์„ ๋‹ค๋ฃจ๋ฉฐ, ์‹ ์•ฝ ๊ฐœ๋ฐœ ์‹คํ—˜์˜ ๊ฒฐ๊ณผ ๊ฒ€์ฆ ๋ฐ ์žฌํ˜„์„ฑ ํ‰๊ฐ€์— ์ฐธ๊ณ ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
290๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์ž๋™ ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ ์—์ด์ „ํŠธ๋ฅผ ๋‹ค๋ฃจ๋ฉฐ ๋ฐ์ดํ„ฐ ์‚ฌ์ด์–ธ์Šค ์—์ด์ „ํŠธ ๊ธฐ์ˆ ์˜ ์‹ค์ œ ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ์‘์šฉ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •