Accelerating drug discovery with artificial: a whole-lab orchestration and scheduling system for self-driving labs
์ ์: Ali Abdollahi, Mohammad Amin Rezaei, Xi Wang, Sunan He, Seyed Moein Ayyoubzadeh, Yuxiang Nie, Hao Chen | ๋ ์ง: 2025 | URL: https://arxiv.org/abs/2504.00986 📄 PDF
Essence
Figure 1 illustrates a modular and scalable Artificial Orches-
๋ณธ ๋
ผ๋ฌธ์ ์๋ํ๋ ์ฝ๋ฌผ ๋ฐ๊ฒฌ์ ์ํด ์์จ ์คํ์ค์ ๋ณต์กํ ์ํฌํ๋ก์ฐ๋ฅผ ์กฐ์จํ๊ณ AI ๋ชจ๋ธ์ ํตํฉํ๋ ์ข
ํฉ์ ์ธ ํ๋ซํผ Artificial์ ์ ์ํ๋ค. NVIDIA BioNeMo์ ๊ฐ์ AI/ML ๋ชจ๋ธ์ ํ์ฉํ์ฌ ๋ถ์ ์ํธ์์ฉ ์์ธก๊ณผ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์์ฌ๊ฒฐ์ ์ ์๋ํํจ์ผ๋ก์จ ์ฝ๋ฌผ ๋ฐ๊ฒฌ ํ๋ก์ธ์ค๋ฅผ ๊ฐ์ํํ๋ค.
Motivation
- Known: ์์จ ์คํ์ค๊ณผ AI๋ฅผ ๊ฒฐํฉํ ์ฝ๋ฌผ ๋ฐ๊ฒฌ ๊ฐ์ํ๋ ์ด๋ฏธ ์๋ ค์ง ๊ฐ๋
์ด๋ฉฐ, virtual screening, molecular simulations, ๊ทธ๋ฆฌ๊ณ machine learning ๊ธฐ๋ฐ ๋ฐ์ดํฐ ๋ถ์์ด ์ฝ๋ฌผ ๋ฐ๊ฒฌ์ ํ์ฉ๋๊ณ ์๋ค. ๊ทธ๋ฌ๋ ๋ฐ์ดํฐ ์ฌ์ผ๋ก, ๋ค์ํ ๊ธฐ๊ธฐ ํตํฉ, ๊ทธ๋ฆฌ๊ณ AI ๋ชจ๋ธ ๋ฐฐํฌ์ ์ด๋ ค์์ด ์ฃผ์ ๋์ ๊ณผ์ ๋ก ๋จ์ ์๋ค.
- Gap: ๊ธฐ์กด ์ฐ๊ตฌ๋ ๊ฐ๋ณ AI ๋ชจ๋ธ์ด๋ ์๋ํ ๋๊ตฌ์ ์ด์ ์ ๋ง์ถ๊ณ ์์ผ๋, ์์จ ์คํ์ค ์ ์ฒด๋ฅผ ํตํฉ์ ์ผ๋ก ์กฐ์จํ๋ ์ข
ํฉ ํ๋ซํผ, ํนํ ์๋ก ๋ค๋ฅธ ๊ธฐ๊ธฐ, ์ํํธ์จ์ด ์์คํ
, AI ๋ชจ๋ธ์ seamlessly ์ฐ๊ฒฐํ๋ ์ค์ผ์คํธ๋ ์ด์
์์คํ
์ ๋ํ ์ฐ๊ตฌ๋ ๋ถ์กฑํ๋ค.
- Why: ์ฝ๋ฌผ ๋ฐ๊ฒฌ์ ๋์ ๋น์ฉ, ๊ธด ๊ฐ๋ฐ ๊ธฐ๊ฐ, ๋์ ์คํจ์จ์ ํด๊ฒฐํ๊ธฐ ์ํด ์๋ํ์ AI ํตํฉ์ด ํ์์ ์ด๋ฉฐ, ์ด๋ฅผ ์ํด์๋ ๋ฐ์ดํฐ ์ฌ์ผ๋ก๋ฅผ ํด์ํ๊ณ ๋ค์ํ ์์คํ
์ ํตํฉํ๋ ํ๋ซํผ์ด ์ ๋์ ์ผ๋ก ํ์ํ๋ค. ์ด๋ฌํ ์ข
ํฉ์ ์ค์ผ์คํธ๋ ์ด์
์ด ๊ฐ๋ฅํ๋ฉด ์คํ ํจ์จ์ฑ ์ฆ๋, ์ฌํ์ฑ ํฅ์, ์ฝ๋ฌผ ๋ฐ๊ฒฌ ๊ฐ์ํ๋ฅผ ๋์์ ๋ฌ์ฑํ ์ ์๋ค.
- Approach: Artificial ํ๋ซํผ์ ๋ชจ๋์ ์ค๊ณ๋ก Web Apps(Labs, Assistants, Workflows, LabOps, Digital Twin), Services(Orchestration, Scheduler/Executor, Data Records), Lab API, Adapters ๋ฑ์ผ๋ก ๊ตฌ์ฑ๋์ด ์๋ค. NVIDIA BioNeMo NIMs๋ฅผ ํ์ฉํ ์์จ virtual screening ์ํฌํ๋ก์ฐ์ proof-of-concept ์ฌ๋ก ์ฐ๊ตฌ๋ฅผ ํตํด ์์คํ
ํจ๊ณผ๋ฅผ ์
์ฆํ๋ค.
Achievement
Figure 2: The self-driving cycle.
โข ์์จ ์คํ์ค์ ์ ์ฒด ํตํฉ ํ๋ซํผ ๊ตฌํ: Web Apps ๊ธฐ๋ฐ user interface์ Services ๊ธฐ๋ฐ backend์ ๋ชจ๋์ ์ํคํ
์ฒ ์ ์
โข ๋ค์ํ ํ๋กํ ์ฝ ์ง์: GraphQL, gRPC, REST๋ฅผ ํตํ hardware-software ํตํฉ
โข AI ๋ชจ๋ธ ์๋ ๋ฐฐํฌ: NVIDIA BioNeMo NIMs๋ฅผ ํ์ฉํ ์ปจํ
์ด๋ํ๋ AI ๋ชจ๋ธ ํตํฉ ๋ฐ ์๋ํ
โข Virtual screening ์ํฌํ๋ก์ฐ ์๋ํ: Proof-of-concept ์ฌ๋ก ์ฐ๊ตฌ๋ก ์ฝ๋ฌผ ํ๋ณด ๋ฐ๊ตด ๊ฐ์ํ ์
์ฆ
โข ๋ฐ์ดํฐ ํตํฉ ๋ฐ ๊ด๋ฆฌ: LIMS, ELN ๋ฑ ๊ธฐ์กด informatics ์์คํ
๊ณผ์ seamless ์ฐ๋
How
Figure 2: The self-driving cycle.
โข Python ๊ธฐ๋ฐ simplified dialect ๋๋ graphical interface๋ฅผ ํตํ ์ํฌํ๋ก์ฐ ์ ์
โข Scheduler/Executor๊ฐ heuristics, constraints, batching์ ํ์ฉํ์ฌ ์์ ํ ๋น ์ต์ ํ
โข GraphQL, gRPC, REST ๋ฑ ๋ค์ค ํ๋กํ ์ฝ API๋ก ๊ธฐ๊ธฐ ๋ฐ ์ํํธ์จ์ด ์ฐ๋
โข HTTPS, gRPC(SiLA ํฌํจ), Local APIs(SciKit, TensorFlow/Keras, PyTorch)๋ฅผ ํตํ ์์ ํ ํต์
โข Real-time monitoring ๋ฐ 3D Digital Twin์ผ๋ก ์คํ ๊ณผ์ ์๊ฐํ ๋ฐ ์๋ฎฌ๋ ์ด์
Originality
โข ์์จ ์คํ์ค ์ ์ฒด๋ฅผ ์กฐ์จํ๋ ํตํฉ ์ค์ผ์คํธ๋ ์ด์
ํ๋ซํผ์ผ๋ก์์ novelty
โข NVIDIA BioNeMo ๊ฐ์ ์ฌ์ ํ์ต๋ AI ๋ชจ๋ธ(NIMs)์ ์คํ์ค ์ํฌํ๋ก์ฐ์ ์ง์ ํตํฉํ๋ ์ ๊ทผ
โข Digital Twin ๊ธฐ๋ฐ 3D ์๊ฐํ ๋ฐ ์๋ฎฌ๋ ์ด์
์ ํตํ ์คํ ์ต์ ํ
โข Python ๊ธฐ๋ฐ ๊ฐ๋จํ ์คํฌ๋ฆฝํ
์ธ์ด์ graphical interface์ ์ด์ค ์ ๊ณต์ผ๋ก ์ ๊ทผ์ฑ ํฅ์
Limitation & Further Study
โข ์ ํ๋ ํ๊ฐ: Proof-of-concept์ด dry lab(virtual screening) ์ค์ฌ์ด๋ฉฐ, wet lab ์ ์ฉ ์ฌ๋ก ๋ฏธ์ ์
โข ๋ฐ์ดํฐ ๊ฒ์ฆ ๋ถ์กฑ: ์ ์๋ ์ฌ๋ก ์ฐ๊ตฌ์์ ์ ๋์ ์ฑ๋ฅ ์งํ(์๋ ํฅ์, ๋น์ฉ ์ ๊ฐ ๋ฑ) ๋ช
์ ๋ถ์กฑ
โข ํ์ฅ์ฑ ๊ฒ์ฆ ๋ฏธํก: ๋๊ท๋ชจ ๋ค์ค ํ๋ก์ ํธ ํ๊ฒฝ์์์ scalability ๋ฐ bottleneck ๋ถ์ ๋ฏธ์ ์
โข ๋ณด์ ๋ฐ ๋ฐ์ดํฐ ์ฌ์ผ๋ก ํด๊ฒฐ์ฑ
๋ฏธํก: ๋ฐ์ดํฐ ์ฌ์ผ๋ก ๋ฌธ์ ๋ฅผ ์ ๊ธฐํ์ผ๋ ๊ตฌ์ฒด์ ํด๊ฒฐ ๋ฉ์ปค๋์ฆ ๋ถ์กฑ
โข ํ์ ์ฐ๊ตฌ: Wet lab ํ๊ฒฝ์์์ ์ค์ ๋ก๋ด ํตํฉ ์ฌ๋ก, ๋ ๋ณต์กํ ์ํฌํ๋ก์ฐ์ ๋ํ ๊ฒ์ฆ ํ์
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 3/5 Overall: 3/5
์ดํ: Artificial ํ๋ซํผ์ ์์จ ์คํ์ค์ ์ค์ผ์คํธ๋ ์ด์
๊ณผ AI ํตํฉ์ด๋ผ๋ ์ค์ํ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๋ ์ค์ง์ ์ธ ์๋ฃจ์
์ ์ ์ํ๋ฉฐ, ๋ชจ๋์ ์ค๊ณ์ ๋ค์ํ ํ๋กํ ์ฝ ์ง์์ผ๋ก ์ฐ์
์ ์ฉ ๊ฐ๋ฅ์ฑ์ด ๋๋ค. ๊ทธ๋ฌ๋ ํ์ฌ๋ proof-of-concept ์์ค์ dry lab ์ฌ๋ก๋ง ์ ์๋์๊ณ , ์ ๋์ ์ฑ๋ฅ ํ๊ฐ์ wet lab ๊ฒ์ฆ์ด ๋ถ์ฌํ์ฌ ๊ธฐ์ ์ ์ฐ์์ฑ๊ณผ ์ํฉํธ๋ฅผ ํ์คํ ์
์ฆํ์ง ๋ชปํ๊ณ ์๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
851๋ฒ ๋
ผ๋ฌธ์ ์คํ์ค ์๋ํ ๋ฐ ์ํฌํ๋ก์ฐ ์ต์ ํ์ LangGraph ๊ธฐ๋ฐ ์์คํ
์ ์ค๋ช
ํ๋ฉฐ, 3371๋ฒ์ orchestration ๊ธฐ์ ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
AI ๊ธฐ๋ฐ ์ฝ๋ฌผ๋ฐ๊ฒฌ์ ์คํ์ค ์ ์ฒด ์ค์ผ์คํธ๋ ์ด์
๊ด์ ์์ ๋ค๋ฃจ๊ธฐ ๋๋ฌธ์, ๊ฐ๊ฐ์ ์์ธก/์ค๊ณ ์ฑ๋ฅ ํ๊ฐ ๋ฐฉ๋ฒ์ ๋ํ ๊ธฐ๋ณธ์ ๋
ผ์๊ฐ ์ฐ๊ฒฐ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
744๋ฒ ๋
ผ๋ฌธ์ ์ฌ๋ฃยทํํ ๋ถ์ผ์ ์์ ์๋ํ ์คํ์ค ๊ตฌํ์ ์ค์ ์ฌ๋ก๋ก ๋ค๋ฃจ๋ฉฐ, 3371๋ฒ ๋
ผ๋ฌธ์ whole-lab orchestration ํ๋ซํผ๊ณผ ๋น๊ต๊ฐ ๊ฐ๋ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
3371์ ์ฝ๋ฌผ ๋ฐ๊ฒฌ ๋ถ์ผ์ SDL ๊ฐ๋
์ ์ค์ง์ ์ผ๋ก ์ ์ฉํ์ฌ 744์์ ๋งํ๋ SDL ๊ธฐ์ ๋ฐ ์์ฉ ์ฌ๋ก๋ฅผ ์ฌํ์ํจ๋ค.
ํ์ ์ฐ๊ตฌ
3371๋ฒ ๋
ผ๋ฌธ์ ์คํ์ค ์๋ํ์ AI ํตํฉ ์กฐ์จ์ ํตํ ์ฝ๋ฌผ ๋ฐ๊ฒฌ ๊ฐ์ํ ํ๋ซํผ์ ์ ์ํ์ฌ, 851๋ฒ์ ๋ณ๋ชฉ ํ์ง ๋ฐ ์คํ์ค ์ต์ ํ ํ๋ ์์ํฌ๋ฅผ ์ค์ง์ ์ผ๋ก ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
๋ํ ์ธ์ด๋ชจ๋ธ์ ํ์ฉํ ์๋ํ ์ฐ๊ตฌ์์ ์๋ํ(Automation)์ ์์จ์ฑ(Autonomy)์ ๊ตฌ๋ถ ๋ฐ ์งํ ๋ฐฉํฅ์ ๋ถ์ํ์ฌ [3371]์ ํ๋ซํผ ๊ณ ๋ํ์ ์์ฌ์ ์ ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
๋ณธ ๋
ผ๋ฌธ๊ณผ ์ ์ฌํ๊ฒ ์์จ ์คํ์ค์์ LLM ๊ธฐ๋ฐ ์์ด์ ํธ๊ฐ ์คํ์ค ์ํฌํ๋ก์ฐ๋ฅผ ์๋ํํ๋ ๋ฐฉ๋ฒ์ ๋ค๋ฃจ์ง๋ง, ๊ตฌ์ฒด์ ์ผ๋ก ๊ณต๊ธฐ ๊ฐ์ง ๋ถ์ผ์ ์ ์ฉํ์ฌ ์ค์ ์์คํ
๊ตฌํ์ ํ์ฅํฉ๋๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์