The Virtual Biotech: A Multi-Agent AI Framework for Therapeutic Discovery and Development
์ ์: | ๋ ์ง: 2026-02-23 | URL: https://www.biorxiv.org/content/10.64898/2026.02.23.707551v1 📄 PDF
Essence
Figure 1: Overview of the Virtual Biotech AI agents, tools, and orchestration. (A) The multi-agent AI sys-
์ด ๋
ผ๋ฌธ์ ์ธ๊ฐ ๋ฐ์ด์คํ
์กฐ์ง ๊ตฌ์กฐ๋ฅผ ๋ชจ์ฌํ ๋ค์ค ์์ด์ ํธ AI ์์คํ
์ธ Virtual Biotech์ ์ ์ํ๋ฉฐ, Chief Scientific Officer ์ค์ผ์คํธ๋ ์ดํฐ ์ค์ฌ์ผ๋ก 11๊ฐ์ ํนํ๋ scientist ์์ด์ ํธ๋ค์ด ํ๋ ฅํ์ฌ ์ฝ๋ฌผ ๊ฐ๋ฐ์ ์ ๋จ๊ณ์์ ์ฆ๊ฑฐ ๊ธฐ๋ฐ ๋ถ์์ ์ํํ๋ค. 37,000๊ฐ ์ด์์ ์์์ํ ์์ด์ ํธ๊ฐ 55,984๊ฑด ์์์ํ์ ๋ถ์ํ์ฌ ์ธํฌํ ํน์ด์ ์ ์ ์๋ฅผ ํ์ ํ๋ ์ฝ๋ฌผ์ด ์์ ์ฑ๊ณต๋ฅ ๊ณผ ์์ฅ ์ง์ถ ๊ฐ๋ฅ์ฑ์ด ํ์ ํ ๋์์ ๋ฐ๊ฒฌํ๋ค.
Motivation
- Known: ์ฝ๋ฌผ ๊ฐ๋ฐ์ ๋ค์ํ ์๋ฌผํ์ ๊ท๋ชจ์ ๋ฐ์ดํฐ ์์์ ๊ฑธ์น ์ฆ๊ฑฐ ํตํฉ์ด ํ์์ด๋, ํ์ฌ ๋ฐ์ดํฐยท๋๊ตฌยท์ ๋ฌธ์ฑ์ด ์กฐ์ง ๊ฐ ๋จํธํ๋์ด ์๊ณ , LLM ๊ธฐ๋ฐ AI ์์ด์ ํธ๊ฐ ๊ณผํ ์์
์๋ํ์ ์ฌ์ฉ๋๊ณ ์๋ค. ์ผ๋ถ ์์ด์ ํธ ์์คํ
์ ์ ์ ์ ํธ์ง, ์ค๋ฏน์ค ๋ถ์, ๋๋
ธ๋ฐ๋ ๋์์ธ ๋ฑ ์ข์ ๋ฒ์์ ๊ณผ์ ์ ์ ์ฉ๋์๋ค.
- Gap: ๊ธฐ์กด ์์ด์ ํธ ์์คํ
์ ์ฌ์ ์ ์๋ ์ํฌํ๋ก์ฐ ์คํ์ด๋ ํน์ ๋ถ์ ์ค๊ณ ๊ฐ์ ์ ํ์ ์์
์ ์ด์ ์ด ๋ง์ถฐ์์ผ๋ฉฐ, ์์์ํ ๋ฐ์ดํฐ๋ฅผ ํฌํจํ ๋ค์ํ ์๋ฌผํ์ ์ฆ๊ฑฐ๋ฅผ ์น๋ฃ R&D ํ์ดํ๋ผ์ธ ์ ์ฒด์ ๊ฑธ์ณ ์ฒด๊ณ์ ์ผ๋ก ํตํฉํ๋ ๋ค์ค ์์ด์ ํธ ์ค์ผ์คํธ๋ ์ด์
์ ๊ทผ๋ฒ์ ๋ถ์ฌํ๋ค.
- Why: ์ฝ๋ฌผ ๊ฐ๋ฐ์ 90% ์ด์์ด ์์์ํ์์ ์คํจํ๋ฉฐ, ์ด๋ ์ฆ๊ฑฐ ๋จํธํ, ์๋ ๋ถ์์ ๋นํจ์จ์ฑ, ๊ฐ์ฌ ์ถ์ ์ฑ ๋ถ์กฑ, ๋๊ท๋ชจ ์๋ฌผํ์ ๋ฐ์ดํฐ ๋ถ์์ ์ด๋ ค์์ผ๋ก ์ธํด ๋ฐ์ํ๋ค. ๋ฐ๋ผ์ ๋ค์ํ ๋ฐ์ดํฐ ์์ค๋ฅผ ํตํฉํ๊ณ ํฌ๋ช
ํ๊ณ ์ฌํ ๊ฐ๋ฅํ ๋ค์ค๊ท๋ชจ ๋ถ์์ ์๋ํํ๋ ์์คํ
์ด ํ์์ ์ด๋ค.
- Approach: Virtual Biotech๋ Chief Scientific Officer ์ค์ผ์คํธ๋ ์ดํฐ๊ฐ ์ฌ์ฉ์ ์ฟผ๋ฆฌ๋ฅผ ๋ถํดํ์ฌ 11๊ฐ์ ํนํ๋ scientist ์์ด์ ํธ์ ํ ๋นํ๋ฉฐ, ๊ฐ ์์ด์ ํธ๋ human genetics, functional genomics, single-cell biology, clinical trials ๋ฑ ํน์ ์ฝ๋ฌผ R&D ๋ถ์ผ์ ๋ง์ถคํ๋ system prompt, skill, domain-specific tool์ ๋ณด์ ํ๋ค. 100๊ฐ ์ด์์ ๋๊ตฌ์ MCP server๋ฅผ ํตํด GWAS, ClinicalTrials.gov, CELLxGENE, Reactome ๋ฑ ๋ค์ํ ์๋ฌผํ์ ยท์์ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ์ ๊ทผํ๋ฉฐ, CSO๋ ์ฌ์ฉ์ ์๋ ๋ช
ํํ ํ ๋ณ๋ ฌ ์ฒ๋ฆฌ์ ๋ค์ค ์ฆ๊ฑฐ ํตํฉ์ ํตํด ์ต์ข
๊ฒฐ๋ก ์ ๋๋ฌํ๋ค.
Achievement
Figure 2: Large-scale clinical trial data extraction using the Virtual Biotech. (A) Overview of the data
๋๊ท๋ชจ ์์์ํ ๋ถ์: 37,000๊ฐ ์ด์์ ์์์ํ ์์ด์ ํธ๊ฐ 55,984๊ฑด ์์์ํ์ ์์จ ๋ถ์ํ์ฌ ๊ตฌ์กฐํ๋ ๊ฒฐ๊ณผ ๋ฐ ๋ค์ค ์ค๋ฏน์ค ์ฃผ์ ์์ฑ. ์ฝ๋ฌผ ํ์ ์ฑ๊ณต ์์ธก: ์ธํฌํ ํน์ด์ ์ ์ ์๋ฅผ ํ์ ํ๋ ์ฝ๋ฌผ์ Phase IโPhase II ์งํ๋ฅ 40% ์ฆ๊ฐ, Phase IV(์์ฅ) ๋๋ฌ ํ๋ฅ 48% ์ฆ๊ฐ, ๋ถ์์ฉ ๋ฐ์๋ฅ 32% ๊ฐ์. ์ค์ ์์ ์ฌ๋ก ๋ถ์: B7-H3 ํ์ ํ์ ํ๊ฐ์์ ํญ์ฒด-์ฝ๋ฌผ ์ผค๋ ์ ๋ต ์ ์ ๋ฐ ์ฐจ๋ณํ ๊ธฐํ ์๋ณ. OSMRฮฒ ๊ถค์์ฑ ๋์ฅ์ผ ์ํ ์ข
๋ฃ ์์ธ ๋ถ์ ๋ฐ ์ ๋ฐ์ํ ๊ธฐ๋ฐ ํ์ ์ ๋ณ ์ ๋ต ์ ์.
How
Figure 1: Overview of the Virtual Biotech AI agents, tools, and orchestration. (A) The multi-agent AI sys-
- CSO ์ค์ผ์คํธ๋ ์ดํฐ๊ฐ ์ฌ์ฉ์ ์ฟผ๋ฆฌ๋ฅผ ์์ฐ์ด ์ฒ๋ฆฌํ์ฌ ๊ด๋ จ follow-up ์ง๋ฌธ์ผ๋ก ์๋ ๋ช
ํํ
- Chief of Staff ์์ด์ ํธ๊ฐ ๋ณ๋ ฌ๋ก ์ต๊ทผ ๋ฐ์ , ๋ฐ์ดํฐ ๊ฐ์ฉ์ฑ, ๋ถ์ผ ๋งฅ๋ฝ ํฌํจ ๋ธ๋ฆฌํ ์ค๋น
- 11๊ฐ scientist ์์ด์ ํธ๊ฐ Statistical Genetics, Target Biology, Functional Genomics, Single-Cell Atlas, Clinical Trials, Biological Pathways, Pharmacology, FDA Safety ๋ฑ์ ์ญํ ๋ถ๋ด
- MCP server๋ฅผ ํตํ 100๊ฐ ์ด์์ ๋๊ตฌ ํ์ฉ์ผ๋ก ๋ฐ์ดํฐ ์ถ์ถยท๋ถ์ยทํตํฉ ์๋ํ
- Scientific Reviewer ์์ด์ ํธ๊ฐ ์์ฑ๋, ๋ฐฉ๋ฒ๋ก , ์ถ๋ก ๋
ผ๋ฆฌ ๊ฒ์ฆํ์ฌ ์ต์ข
๋ฆฌํฌํธ ์์ฑ
Originality
- ์ธ๊ฐ ๋ฐ์ด์คํ
์กฐ์ง ๊ตฌ์กฐ๋ฅผ ๋ช
์์ ์ผ๋ก ๋ชจ์ฌํ ๋ค์ค ์์ด์ ํธ ์ค์ผ์คํธ๋ ์ด์
์ค๊ณ๋ก ๊ธฐ์กด ์์ด์ ํธ ์์คํ
๊ณผ ์ฐจ๋ณํ
- ์์์ํ ๋ฐ์ดํฐ๋ฅผ ํฌํจํ ๋ค์ํ ์๋ฌผํ์ ์ฆ๊ฑฐ(human genetics, functional genomics, single-cell, spatial, clinicogenomic)๋ฅผ ์น๋ฃ R&D ํ์ดํ๋ผ์ธ ์ ์ฒด์ ํตํฉํ๋ ์ต์ด ์๋
- 37,000๊ฐ์ ๋
๋ฆฝ์ ์ธ clinical-trialist ์์ด์ ํธ๋ฅผ ํ์ฉํ ๋๊ท๋ชจ ๋ณ๋ ฌ ์์์ํ ๋ถ์ ๋ฐ ๊ตฌ์กฐํ ์ฒ๋ฆฌ์ ํ์ ์ ํ์ฅ์ฑ
- ๋จ์ ๋ฐ์ดํฐ ๋ถ์์ ๋์ด ์ธํฌํ ํน์ด์ฑ(cell-type-specificity) ๊ธฐ๋ฐ์ ์ฝ๋ฌผ ํ์ ์ฑ๊ณต ์์ธก์ด๋ผ๋ ์๋ก์ด ํต์ฐฐ
Limitation & Further Study
- ๋๊ท๋ชจ LLM ์ธํ๋ผ ๋ฐ ๊ณ์ฐ ๋น์ฉ์ ์ค์ง์ ์ฅ๋ฒฝ์ ๋ํ ๋
ผ์ ๋ถ์กฑ
- ์์ด์ ํธ์ ์์ฌ๊ฒฐ์ ๊ณผ์ ์์ LLM์ hallucination, bias, ์ ๋ขฐ๋ ํ๊ฐ ๋ฉ์ปค๋์ฆ์ด ๋ช
ํํ์ง ์์
- ์ธํฌํ ํน์ด์ ์ ์ ์ ํ์ ์ฑ๊ณต ๋ฐ๊ฒฌ์ ์ธ๊ณผ์ฑ(causation) ํ๋ฆฝ ๋ถ์กฑ์ผ๋ก, ์๊ด์ฑ(correlation) ์์ค์ ๋ถ์์ผ ๊ฐ๋ฅ์ฑ
- ์ค์ ์ ์ฝํ์ฌ์ ๊ธฐ์กด ์ํฌํ๋ก์ฐ์์ ํตํฉ, ๋น์ฉ-ํธ์ต ๋ถ์, ๊ท์ ์น์ธ ๊ฒฝ๋ก ๋ช
ํํ ํ์
- ์ธ ๊ฐ์ง ์ค์ ์ฌ๋ก ๋ถ์๋ง ์ ์๋์์ผ๋ฉฐ, ๋๊ท๋ชจ ์์์ํ ๋ถ์ ๊ฒฐ๊ณผ์ ์ธ๋ถ ๊ฒ์ฆ ๋ฐ ์ฌํ์ฑ ์
์ฆ ํ์
- ํ์ ์ฐ๊ตฌ๋ก๋ (1) LLM ๊ธฐ๋ฐ ์์ด์ ํธ์ ์ ๋ขฐ๋ ์ ๋ํ ๋ฐ uncertainty quantification, (2) ์ ์ฝ ์
๊ณ์ ํ๋ ฅํ prospective validation, (3) ์์ด์ ํธ ์์ฌ๊ฒฐ์ ์ ํฌ๋ช
์ฑ ๊ฐํ
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 5/5 Clarity: 4/5 Overall: 4/5
์ดํ: ์ด ๋
ผ๋ฌธ์ ๋ค์ค ์์ด์ ํธ AI ์์คํ
์ ์ฝ๋ฌผ ๊ฐ๋ฐ์ ๋ณต์กํ ๋ค์ค๊ท๋ชจ ์ฆ๊ฑฐ ํตํฉ ๋ฌธ์ ์ ์ฐฝ์์ ์ผ๋ก ์ ์ฉํ์ฌ, ์ธํฌํ ํน์ด์ ์ ์ ์ ํ์ ์ฝ๋ฌผ์ ์์ ์ฑ๊ณต๋ฅ ์ ์ ๋ํํ๋ ์๋ก์ด ํต์ฐฐ์ ์ ์ํ๋ค. ๋๊ท๋ชจ ์์์ํ ๋ฐ์ดํฐ ๋ถ์๊ณผ ์ค์ ์ฝ๋ฌผ ๊ฐ๋ฐ ์ฌ๋ก ์ ์ฉ์ผ๋ก ์ค์ฉ์ฑ์ ์
์ฆํ์์ผ๋, LLM ๊ธฐ๋ฐ ์์ด์ ํธ์ ์ ๋ขฐ๋ ํ๊ฐ, ์ธ๊ณผ์ฑ ํ๋ฆฝ, ์ธ๋ถ ๊ฒ์ฆ ๋ฑ์ด ํฅํ ๊ฐ์ ๊ณผ์ ์ด๋ค. ์ฝ๋ฌผ ๊ฐ๋ฐ ๋ถ์ผ์์์ AI ์๋ํ์ ํฌ๋ช
์ฑ ์ฆ์ง์ ์ค์ํ ์ ๋ก๋ฅผ ์ ์ํ๋ ๊ณ ์ํฉํธ ์ฐ๊ตฌ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
033์ LLM ๊ธฐ๋ฐ ์์จ์์ด์ ํธ ์ฐ๊ตฌ์ ์ฃผ์ ์ง์ ๊ณผ ๋์ ๊ณผ์ ๋ฅผ ํฌ๊ดํ์ฌ, 3258 ๊ฐ์ ๋ค์ค ์์ด์ ํธ ์์คํ
์ ์ดํด์ ํ๊ฐ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
616์ LLM ๊ธฐ๋ฐ ๊ฐ์ ์ ์ฝ์ฌ ๊ตฌ์ถ์ ์ํ ํ๋ ์์ํฌ๋ฅผ ์ ์, 3258์ ์ด๋ฅผ ์ง์ผ๋ณด์์ผ ์ค์ ๋ค์ค ์์ด์ ํธ ํ์
์ด๊ดํ ๋ชจ๋ธ์ ๊ตฌํํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
351์ ๋ค์ค ์์ด์ ํธ ๊ธฐ๋ฐ ์ ์ฝ ์ค๊ณ ์ ์ฒด ํ๋ก์ธ์ค ์๋ํ๋ฅผ ๋ค๋ฃจ์ด, 3258์ Virtual Biotech ๊ตฌ์กฐ์ ํ๋กํ ์ฝ ์์ค์์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ ๋
ผ๋ฌธ ๋ชจ๋ LLM ๋ฐ multi-agent ์์คํ
์ ํ์ฉํด ์คํ ์ค๊ณ๋ถํฐ ๊ฒฐ๊ณผ ํด์๊น์ง ์๋ํํ๋ ํ๋ ์์ํฌ๋ฅผ ๋ค๋ฃจ๋, ํ ์ชฝ์ ์ฝ๋ฌผ, ํ ์ชฝ์ ๊ฒฐ์ ๊ตฌ์กฐ์ ์ด์ ์ ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ ๋ค ์ฝ๋ฌผ ๊ฐ๋ฐ ์๋ํ๋ผ๋ ๋ชฉํ๋ ๊ฐ์ผ๋, 3258์ ์ธ์ ์กฐ์ง ๊ตฌ์กฐ ๋ชจ๋ฐฉ๊ณผ ์์์ํ ์ค์ฌ์ธ ๋ฐ๋ฉด, 3234๋ ๋จ๋ฐฑ์ง-๊ธฐ์ ๋ถ์ ํ๋กํ
์ค๋ฏน์ค ์ค์ฌ ๊ตฌํ์
๋๋ค.
์์ฉ ์ฌ๋ก
The Virtual Biotech ๋
ผ๋ฌธ์ AI ์์ด์ ํธ ํ ๊ธฐ๋ฐ์ ๋ฐ์ด์คํ
ํฌ ์ ์ฝ ํ๋ ์์ํฌ๋ฅผ ์ ์ฉํ์ฌ Virtual Lab์ ํ ํ์
์ ๊ทผ๋ฒ์ ์ค์ ์น๋ฃ์ ์ค๊ณ์ ํ์ฅ ์ ์ฉํ๋ค.
์์ฉ ์ฌ๋ก
Virtual Biotech ๋
ผ๋ฌธ์ ์ค์ ์ ์ฝ ํ์์์ ๋ค์ค ์์ด์ ํธ ๊ธฐ๋ฐ ํ๋ ์์ํฌ๋ก agentic protein design์ ์ค์ ์ ์ฉ ์์๋ฅผ ๋ณด์ฌ์ค๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์