Drugpilot: Llm-based parameterized reasoning agent for drug discovery

์ €์ž: Kun Li, Zhennan Wu, Shoupeng Wang, Jia Wu, Shirui Pan, Wenbin Hu | ๋‚ ์งœ: 2025 | DOI: N/A 📄 PDF


Essence

Figure 2

DrugPilot ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๊ตฌ์กฐ: LLM, ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ๋ฉ”๋ชจ๋ฆฌ ํ’€(PMP), Fe-Fo ๋ฉ”์ปค๋‹ˆ์ฆ˜, AI ๋ชจ๋ธ ์ง‘ํ•ฉ์œผ๋กœ ๊ตฌ์„ฑ๋œ ํ†ตํ•ฉ ์‹œ์Šคํ…œ

๋ณธ ๋…ผ๋ฌธ์€ ์‹ ์•ฝ ๊ฐœ๋ฐœ์˜ ์ „ ๋‹จ๊ณ„๋ฅผ ์ง€์›ํ•˜๋Š” ๋Œ€ํ˜• ์–ธ์–ด๋ชจ๋ธ(LLM) ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ DrugPilot์„ ์ œ์‹œํ•œ๋‹ค. ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ๋ฉ”๋ชจ๋ฆฌ ํ’€(Parameterized Memory Pool, PMP)์„ ํ†ตํ•ด ์ด์งˆ์ ์ธ ์•ฝ๋ฌผ ๋ฐ์ดํ„ฐ๋ฅผ ํ‘œ์ค€ํ™”๋œ ํ‘œํ˜„์œผ๋กœ ๋ณ€ํ™˜ํ•˜๊ณ , ํ”ผ๋“œ๋ฐฑ-ํฌ์ปค์Šค(Fe-Fo) ๋ฉ”์ปค๋‹ˆ์ฆ˜์œผ๋กœ LLM์˜ ์ถ”๋ก  ์˜ค๋ฅ˜๋ฅผ ์‹ค์‹œ๊ฐ„ ๋ชจ๋‹ˆํ„ฐ๋งํ•˜์—ฌ ์ •ํ™•ํ•œ ๋„๊ตฌ ํ˜ธ์ถœ๊ณผ ๋ฉ€ํ‹ฐํ„ด ๋Œ€ํ™”๋ฅผ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•œ๋‹ค.

Motivation

Achievement

Figure 1

DrugPilot์˜ ์‘์šฉ ์‹œ๋‚˜๋ฆฌ์˜ค ๋ฐ ๊ธฐ์กด ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ LLM/์—์ด์ „ํŠธ์™€์˜ ๋น„๊ต: ์ฝ”๋“œ ๋ถˆํ•„์š”(Zero-Code), ํ™•์žฅ ๊ฐ€๋Šฅํ•œ ๋ฐ์ดํ„ฐ ํš๋“, ์กฐ์œจ๋œ ๋ฉ€ํ‹ฐํƒœ์Šคํฌ ์ฒ˜๋ฆฌ, ์ •ํ™•ํ•œ ์‹คํ–‰

  1. ๋ฒค์น˜๋งˆํฌ ์„ฑ๋Šฅ: Berkeley function-calling ๋ฒค์น˜๋งˆํฌ์—์„œ ๋‹จ์ˆœ(Simple), ๋ฉ€ํ‹ฐ-๋„๊ตฌ(Multi-tool), ๋ฉ€ํ‹ฐํ„ด(Multi-turn) ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ๊ฐ๊ฐ 98.0%, 93.5%, 64.0%์˜ ์ž‘์—… ์™„๋ฃŒ์œจ ๋‹ฌ์„ฑ. ReAct ๋Œ€๋น„ 13.2%, 66.1%, 80.3% ํ–ฅ์ƒ
  2. ์‹ ์•ฝ ๋ฐœ๊ฒฌ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•: 8๊ฐœ ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ ์ž‘์—…์„ ์•„์šฐ๋ฅด๋Š” 2,800๊ฐœ์˜ ๊ณ ํ’ˆ์งˆ ์ฃผ์„ ์ƒ˜ํ”Œ๋กœ ์ด๋ฃจ์–ด์ง„ ๋„๊ตฌ ํ˜ธ์ถœ ๋ฒค์น˜๋งˆํฌ(TCDD, Tool-Calling Dataset for Drug Discovery) ์ตœ์ดˆ ์ œ์•ˆ
  3. ์‹ค๋ฌด ์ ์šฉ์„ฑ: ๋ถ„์ž ์ตœ์ ํ™” ์ž‘์—…์—์„œ ๊ธฐ์กด LLM ๋Œ€๋น„ 100-1,000๋ฐฐ ๋งŽ์€ ์ •ํ™•ํ•œ SMILES ํ›„๋ณด(์ˆ˜์‹ญ ๊ฐœ โ†’ ์ˆ˜๋ฐฑ-์ˆ˜์ฒœ ๊ฐœ) ์ƒ์„ฑ ๊ฐ€๋Šฅ

How

Figure 2

PMP์˜ ๊ตฌ์กฐ: ํ‚ค-๊ฐ’ ์Œ์œผ๋กœ ๋ฉ”๋ชจ๋ฆฌ ์ €์žฅ, LLM์€ ๊ฐ„๊ฒฐํ•œ ํ‚ค์™€ ์ƒํ˜ธ์ž‘์šฉํ•˜๊ณ  ๋„๊ตฌ๋Š” ๊ตฌ์กฐํ™”๋œ ๊ฐ’๊ณผ ์ง์ ‘ ์ƒํ˜ธ์ž‘์šฉ

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4.0/5 Significance: 4.5/5 Clarity: 4.0/5 Overall: 4.2/5

์ดํ‰: DrugPilot์€ ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ๋ฉ”๋ชจ๋ฆฌ ํ’€๊ณผ ํ”ผ๋“œ๋ฐฑ-ํฌ์ปค์Šค ๋ฉ”์ปค๋‹ˆ์ฆ˜์ด๋ผ๋Š” ํ˜์‹ ์  ์•„ํ‚คํ…์ฒ˜๋ฅผ ํ†ตํ•ด LLM ๊ธฐ๋ฐ˜ ์‹ ์•ฝ ๊ฐœ๋ฐœ ์—์ด์ „ํŠธ์˜ ์ •ํ™•์„ฑ๊ณผ ์‚ฌ์šฉ์„ฑ์„ ํš๊ธฐ์ ์œผ๋กœ ๊ฐœ์„ ํ–ˆ์œผ๋ฉฐ, ์ฒซ ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ ๋„๊ตฌ ํ˜ธ์ถœ ๋ฒค์น˜๋งˆํฌ ์ œ์‹œ๋กœ ํ•ด๋‹น ๋ถ„์•ผ์˜ ํ•™์ˆ ์  ๊ธฐ์—ฌ๋„๊ฐ€ ๋†’๋‹ค. ๋‹ค๋งŒ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ํšจ์œจ์„ฑ ํ‰๊ฐ€์™€ ์ž„์ƒ ๋‹จ๊ณ„๋กœ์˜ ํ™•์žฅ ๊ฒฝ๋กœ๊ฐ€ ๋ณด์™„๋˜๋ฉด ์‹ค๋ฌด ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์ด ํ•œ์ธต ๋†’์•„์งˆ ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์•ฝ๋ฌผ ๋ฐ์ดํ„ฐ์˜ ํ‘œ์ค€ํ™”๋œ ํ‘œํ˜„ ํ•™์Šต์„ ์œ„ํ•œ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
RAG-Enhanced Collaborative LLM Agents ๋…ผ๋ฌธ์€ ํ˜‘๋™ํ˜• ๋„๊ตฌ ๊ธฐ๋ฐ˜ LLM ์‹ ์•ฝ๊ฐœ๋ฐœ ๊ตฌ์กฐ์— ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜์—ฌ DrugPilot์˜ ์•„ํ‚คํ…์ฒ˜ ์„ค๊ณ„์— ์ฐธ๊ณ ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Drugpilot ๋…ผ๋ฌธ์—์„œ ํŒŒ๋ผ๋ฏธํ„ฐํ™”๋œ ์ถ”๋ก  ๊ธฐ๋ฐ˜์˜ ์—์ด์ „ํŠธ๋ฅผ ์ œ์•ˆํ•˜์—ฌ, ๋น„๋ฏธ๋ถ„ ๋ณด์ƒ ํ•จ์ˆ˜ ์ตœ์ ํ™”์— ๊ด€ํ•œ ๋ฐฉ๋ฒ•๋ก ์  ์‹œ์‚ฌ์ ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ์˜ ๋ฉ”๋ชจ๋ฆฌ ๋ฐ ์ถ”๋ก  ๋ฉ”์ปค๋‹ˆ์ฆ˜์— ๋Œ€ํ•œ ๊ธฐ์ดˆ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์‹ ์•ฝ ๊ฐœ๋ฐœ์„ ์œ„ํ•œ ๋‹ค๋ฅธ LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•œ ๋Œ€์•ˆ์  ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Drugpilot ๋…ผ๋ฌธ์€ ์•ฝ๋ฌผ ์žฌ์ฐฝ์ถœ์„ parameterized reasoning agent๋กœ ํ’€์–ด, DrugCLIP์˜ ๋Œ€์กฐํ•™์Šต ๊ฐ•ํ™” ์ ‘๊ทผ๊ณผ ๋Œ€์กฐ์ ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
DrugPilot์€ ์‹ ์•ฝ๊ฐœ๋ฐœ ์ „์ฒด ๋‹จ๊ณ„์— ๋Œ€์‘ํ•˜๋Š” LLM ์—์ด์ „ํŠธ๋กœ์„œ, ์•ฝ๋ฌผ ๋ฐ˜์‘ ์ถ”๋ก  ๋ฐ ํ‰๊ฐ€์—์„œ DeepCRE์™€ ๊ธฐ๋ฒ•์  ์ฐจ๋ณ„์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
PharmAgents ๋…ผ๋ฌธ์€ ๋น…ํŒŒ๋งˆ ๊ฐ€์ƒํ™” ๋ฐ ๋ฉ€ํ‹ฐ๋„๊ตฌ ์—์ด์ „ํŠธ ํ˜‘์—…์ฒด๊ณ„๋ฅผ ์ œ์‹œํ•ด Drugpilot ์„ค๊ณ„์™€ ์•ฝ๋ฌผ ๊ฒ€์ƒ‰/ํ‰๊ฐ€ ํŒŒ์ดํ”„๋ผ์ธ์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
TxAgent์™€ ๊ฐ™์ด DrugPilot์€ LLM ๊ธฐ๋ฐ˜ ์•ฝ๋ฌผ๊ฐœ๋ฐœ ๋„๊ตฌ ์œตํ•ฉ ๋ฐ ๋ฉ”๋ชจ๋ฆฌ ํ’€ ํ™œ์šฉ, ์‹ค์‹œ๊ฐ„ ํ”ผ๋“œ๋ฐฑ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๋“ฑ ์‹ ์•ฝ ํƒ์ƒ‰ AI์—์„œ ๋ฒค์น˜๋งˆํ‚น ์š”์†Œ๊ฐ€ ๋งŽ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ํŒŒ๋ผ๋ฏธํ„ฐํ™”๋œ ์•ฝ๋ฌผ ์ถ”๋ก (agentic reasoning) ์‚ฌ๋ก€๋กœ, ํ™˜์ž ํ•˜์œ„๊ตฐ๋ณ„ ์ •๋ฐ€ ์•ฝ๋ฌผ ๊ฐœ๋ฐœ ์—ฐ๊ตฌ์˜ ์‘์šฉ ํšจ๊ณผ๋ฅผ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
292๋Š” LLM ๊ธฐ๋ฐ˜ ํŒŒ๋ผ๋ฏธํ„ฐ ์ถ”๋ก ๊ณผ ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ ๋“ฑ ๋‹ค์–‘ํ•œ ์ƒ๋ช…๊ณผํ•™ ๋ฌธ์ œ์— ๋Œ€ํ•œ ์‹ค์งˆ์  ์ ์šฉ์‚ฌ๋ก€๋ฅผ ๋ณด์ธ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
FROGENT ๋…ผ๋ฌธ์€ ์•ฝ๋ฌผ์„ค๊ณ„ ๊ณผ์ •์—์„œ ์ƒ์„ฑ์  ๋‹ค์ค‘์—์ด์ „ํŠธ ๊ตฌ์กฐ๋ฅผ ํ™œ์šฉํ•œ ์‹ค์ œ ์ ์šฉ ์‚ฌ๋ก€๋กœ, DrugPilot์ด ์ œ์•ˆํ•œ ์˜์‚ฌ๊ฒฐ์ • ๊ตฌ์กฐ์™€ ํ˜„์—… ์‘์šฉ ์—ฐ๊ฒฐ๊ณ ๋ฆฌ๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
292 ๋…ผ๋ฌธ์€ ๋‹จ๋ฐฑ์งˆ ๊ตฌ์กฐ ๋ฐ ๊ธฐ๋Šฅ ์˜ˆ์ธก์—์„œ ๊ตฌ์กฐ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ์„ ํ™œ์šฉํ•˜์—ฌ, 241์˜ ๊ตฌ์กฐ ์ค‘์‹ฌ ๋ถ„์„ ํŒจ๋Ÿฌ๋‹ค์ž„์˜ ์ƒ๋ช…๊ณผํ•™ ์ ์šฉ์„ฑ์„ ๋…ผ์˜ํ•  ์ˆ˜ ์žˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์•ฝ๋ฌผ ํƒ์ƒ‰ ๋ฐ ํ™”ํ•™ ๊ตฌ์กฐ ์ถ”๋ก ์—์„œ LLM ๊ธฐ๋ฐ˜ ํŒŒ๋ผ๋ฏธํ„ฐ ์ถ”๋ก ํ˜• agent ์ „๋žต์ด MolQuest์˜ ์‹ค์ œ ํ™”ํ•™ ์ž‘์—… ์‘์šฉ ์‚ฌ๋ก€๋กœ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •