The Virtual Lab: AI Agents Design New SARS-CoV-2 Nanobodies with Experimental Validation

์ €์ž: Kyle Swanson, Wesley Wu, Nash L. Bulaong, J. Pak, James Y. Zou | ๋‚ ์งœ: 2024 | DOI: 10.1101/2024.11.11.623004 📄 PDF


Essence

Figure 1

๊ทธ๋ฆผ 1: Virtual Lab ์•„ํ‚คํ…์ฒ˜. (a) PI ์—์ด์ „ํŠธ๋ฅผ ์ค‘์‹ฌ์œผ๋กœ ๋‹ค์–‘ํ•œ ๊ณผํ•™์ž ์—์ด์ „ํŠธ๋“ค์ด ํŒ€์„ ์ด๋ฃจ๋Š” ๊ตฌ์กฐ, (b) ํŒ€ ๋ฏธํŒ…์˜ ๋‹ค์ค‘ ๋ผ์šด๋“œ ํ† ๋ก  ํ๋ฆ„, (c) ๊ฐœ๋ณ„ ๋ฏธํŒ…์˜ ๋ฐ˜๋ณต์  ํ”ผ๋“œ๋ฐฑ ๊ณผ์ •

๋ณธ ์—ฐ๊ตฌ๋Š” ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM) ๊ธฐ๋ฐ˜์˜ ๋‹ค์ค‘ ์ „๋ฌธ๊ฐ€ AI ์—์ด์ „ํŠธ ํŒ€์ด ์ธ๊ฐ„ ์—ฐ๊ตฌ์ž์™€ ํ˜‘๋ ฅํ•˜์—ฌ ํ•™์ œ๊ฐ„ ๊ณผํ•™ ์—ฐ๊ตฌ๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” "Virtual Lab" ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•œ๋‹ค. ์ด๋ฅผ SARS-CoV-2 ๋‚˜๋…ธ๋ฐ”๋”” ์„ค๊ณ„์— ์ ์šฉํ•˜์—ฌ 92๊ฐœ์˜ ์‹ ๊ทœ ๋‚˜๋…ธ๋ฐ”๋””๋ฅผ ์„ค๊ณ„ํ•˜๊ณ  ์‹คํ—˜์  ๊ฒ€์ฆ์„ ํ†ตํ•ด ์œ ๋งํ•œ ๊ฒฐํ•ฉ ํŠน์„ฑ์„ ๊ฐ€์ง„ ํ›„๋ณด๋ฅผ ๋ฐœ๊ตดํ–ˆ๋‹ค.

Motivation

Achievement

Figure 2

๊ทธ๋ฆผ 2: ๋‚˜๋…ธ๋ฐ”๋”” ์„ค๊ณ„๋ฅผ ์œ„ํ•œ Virtual Lab์˜ ์ ์šฉ ์›Œํฌํ”Œ๋กœ์šฐ

  1. novel nanobody design pipeline ๊ฐœ๋ฐœ: ESM(๋‹จ๋ฐฑ์งˆ ์–ธ์–ด ๋ชจ๋ธ), AlphaFold-Multimer(๋‹จ๋ฐฑ์งˆ ํด๋”ฉ), Rosetta(๊ณ„์‚ฐ ์ƒ๋ฌผํ•™ ์†Œํ”„ํŠธ์›จ์–ด)๋ฅผ ํ†ตํ•ฉํ•œ ์ƒˆ๋กœ์šด ๊ณ„์‚ฐ ํŒŒ์ดํ”„๋ผ์ธ์„ ์ž๋™์œผ๋กœ ์„ค๊ณ„. SARS-CoV-2 ์›๋ž˜ ๊ท ์ฃผ์˜ RBD(์ˆ˜์šฉ์ฒด ๊ฒฐํ•ฉ ์˜์—ญ)์— ๊ฒฐํ•ฉํ•˜๋Š” ๊ธฐ์กด ๋‚˜๋…ธ๋ฐ”๋””๋ฅผ ์ตœ์‹  ๋ณ€์ด์ฃผ์— ๋งž๋„๋ก ๋Œ์—ฐ๋ณ€์ด ์œ ๋„.
  2. ๋†’์€ ์„ค๊ณ„ ์„ฑ๊ณต๋ฅ : 92๊ฐœ์˜ ์„ค๊ณ„๋œ ๋‚˜๋…ธ๋ฐ”๋”” ์ค‘ 90% ์ด์ƒ์ด ๋ฐœํ˜„๋˜๊ณ  ๊ฐ€์šฉ์„ฑ์„ ๋ณด์ž„. ํŠนํžˆ JN.1 ๋˜๋Š” KP.3 ๋ณ€์ด์ฃผ์— ํ–ฅ์ƒ๋œ ๊ฒฐํ•ฉ๋ ฅ์„ ๋ณด์ด๋ฉด์„œ๋„ ์›์กฐ ๋ฐ”์ด๋Ÿฌ์Šค ์ŠคํŒŒ์ดํฌ ๋‹จ๋ฐฑ์งˆ์— ๊ฐ•ํ•œ ๊ฒฐํ•ฉ๋ ฅ์„ ์œ ์ง€ํ•˜๋Š” 2๊ฐœ์˜ ์œ ๋ง ํ›„๋ณด ๋ฐœ๊ตด.
  3. ์‹ค์ œ ๊ณผํ•™ ๋ฐœ๊ฒฌ์˜ ์ฆ๋ช…: ์ˆœ์ˆ˜ ๊ณ„์‚ฐ๋งŒ์ด ์•„๋‹Œ ์‹คํ—˜์  ๊ฒ€์ฆ์„ ํ†ตํ•ด AI-์ธ๊ฐ„ ํ˜‘๋ ฅ์˜ ์‹ค์ œ ์˜ํ–ฅ๋ ฅ์„ ์ž…์ฆํ•œ ์ฒซ ์‚ฌ๋ก€ ์ค‘ ํ•˜๋‚˜.

How

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋‹ค์ค‘ ์ „๋ฌธ๊ฐ€ ์—์ด์ „ํŠธ๊ฐ€ ์ธ๊ฐ„ ์—ฐ๊ตฌ์ž์™€ ํ˜‘๋ ฅํ•˜์—ฌ ์‹ค์ œ ํ•™์ œ๊ฐ„ ๊ณผํ•™ ๋ฌธ์ œ(๋‚˜๋…ธ๋ฐ”๋”” ์„ค๊ณ„)๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ  ์‹คํ—˜์ ์œผ๋กœ ๊ฒ€์ฆํ•œ ์„ ๋„์  ์‚ฌ๋ก€๋กœ, ํ–ฅํ›„ AI ์ง€์› ๊ณผํ•™ ์—ฐ๊ตฌ์˜ ํŒจ๋Ÿฌ๋‹ค์ž„ ์ „ํ™˜์„ ์‹œ์‚ฌํ•œ๋‹ค. ๋‹ค๋งŒ ๋Œ€๊ทœ๋ชจ ์ ์šฉ ์‹œ ๋น„์šฉ๊ณผ ํ™•์žฅ์„ฑ, ๊ทธ๋ฆฌ๊ณ  ์—์ด์ „ํŠธ ํŒ€ ์ตœ์ ํ™” ๋ฐฉ๋ฒ•๋ก ์˜ ์ถ”๊ฐ€ ๊ฐœ๋ฐœ์ด ์š”๊ตฌ๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๋‹ค๋ฅธ ์ ‘๊ทผ
Autonomous chemical research with large language models ๋…ผ๋ฌธ์€ ํ™”ํ•™ ์‹คํ—˜ ์ž๋™ํ™”๋ฅผ ์ค‘์ ์œผ๋กœ, Virtual Lab์˜ ๋‹ค์ข… ์ „๋ฌธ๊ฐ€ ํ˜‘๋ ฅ ๋ฐฉ์‹๊ณผ ๋‹ฌ๋ฆฌ ๋‹จ์ผ ๋ถ„์•ผ LLM ์‘์šฉ์„ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
068๋ฒˆ AgentMD๋Š” ์˜ํ•™์  ๋ฆฌ์Šคํฌ ์˜ˆ์ธก์„ ์œ„ํ•œ ๋žญ๊ท€์ง€ ์—์ด์ „ํŠธ๋ฅผ ๋‹ค๋ค„, 806๋ฒˆ์ด ๋‹ค๋ฃจ๋Š” ์‹คํ—˜์  ์ž๋™ํ™” ์—์ด์ „ํŠธ์™€ ์˜๋ฃŒ ๋ถ„์•ผ ํŠนํ™” ์ ์šฉ์˜ ๋Œ€์•ˆ์  ์ ‘๊ทผ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‘˜ ๋‹ค AI ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ 'virtual lab'์„ ํ™œ์šฉํ•œ ์ƒ์˜ํ•™ ์—ฐ๊ตฌ ์ž๋™ํ™”๋ฅผ ๋‹ค๋ฃจ์ง€๋งŒ, 806์€ ๋‚˜๋…ธ๋ฐ”๋”” ์„ค๊ณ„, 868์€ ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ์‹คํ—˜ ๊ฐ€์†ํ™”๋ผ๋Š” ๋‹ค๋ฅธ ์‘์šฉ ์‚ฌ๋ก€์— ์ดˆ์ ์„ ๋‘ก๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
806๋ฒˆ ๋…ผ๋ฌธ์€ ๋‹ค์–‘ํ•œ ์ „๋ฌธ ๋ถ„์•ผ์˜ AI ์—์ด์ „ํŠธ ํ˜‘๋ ฅ ํ”„๋ ˆ์ž„์›Œํฌ(Virtual Lab)๋ฅผ ์ œ์‹œํ•˜๋ฉฐ, 793๋ฒˆ ๋…ผ๋ฌธ์˜ ์‚ฌ์šฉ์ž ์ƒํ˜ธ์ž‘์šฉ ์—ฐ๊ตฌ์™€ ๋‹ฌ๋ฆฌ ์‹ค์ œ ๊ณผํ•™ ์—ฐ๊ตฌ์—์˜ ์ ์šฉ์„ ์ค‘์ ์œผ๋กœ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
The Virtual Lab ๋…ผ๋ฌธ์€ AI ์—์ด์ „ํŠธ๋“ค์ด SARS-CoV-2 ๋‚˜๋…ธ๋ฐ”๋”” ์„ค๊ณ„ ๋ฐ ์‹คํ—˜์„ ์ˆ˜ํ–‰ํ•œ ์‹ค์ œ ์‚ฌ๋ก€๋ฅผ ๋ณด๋‹ค ์ƒ์„ธํ•˜๊ฒŒ ๋ถ„์„ยทํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
816๋ฒˆ ๋…ผ๋ฌธ์€ ์ž…์ž ๊ฐ€์†๊ธฐ ์‹คํ—˜์˜ ์™„์ „ ์ž๋™ํ™”๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, 806๋ฒˆ์˜ Virtual Lab์—์„œ ์ œ์‹œํ•˜๋Š” ๋žฉ ์ž๋™ํ™” AI ์—์ด์ „ํŠธ ๋…ผ์˜๋ฅผ ์‹คํ—˜๋ฌผ๋ฆฌ ๋ถ„์•ผ๋กœ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
3171 ๋…ผ๋ฌธ์€ 806๊ณผ ์œ ์‚ฌํ•˜๊ฒŒ ์‹œ์Šคํ…œ ์ƒ๋ฌผํ•™ ์—ฐ๊ตฌ์˜ ์ž๋™ํ™”๋ฅผ ์œ„ํ•ด ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜์—ฌ ์‹ค์ œ ๊ณ ์ฐจ์› ์ƒ๋ช… ๊ณผํ•™ ๋ฌธ์ œ๋กœ์˜ ํ™•์žฅ ์‘์šฉ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
The Virtual Lab ๋…ผ๋ฌธ์€ LLM ์—์ด์ „ํŠธ๋ฅผ ํ™œ์šฉํ•œ ์ƒ๋ฌผํ•™์  ์‹คํ—˜ ํ”„๋กœํ† ์ฝœ ์ž๋™ํ™” ์‚ฌ๋ก€๋ฅผ ๋‹ค๋ฃจ๋ฏ€๋กœ, BioProBench์˜ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ์‹ค์ œ ์‹คํ—˜ ์ž๋™ํ™”์— ์–ด๋–ป๊ฒŒ ์—ฐ๊ฒฐ๋˜๋Š”์ง€ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
LangGraph ๊ธฐ๋ฐ˜ ๊ฐ€์ƒ ์‹คํ—˜์‹ค ์—์ด์ „ํŠธ๊ฐ€ SARS-CoV-2 nanobody ์„ค๊ณ„ ๋“ฑ ์‹ค์ œ ๋žฉ ํ”„๋กœ์„ธ์Šค ๊ฐœ์„ ์— ์–ด๋–ป๊ฒŒ ์ ์šฉ๋˜๋Š”์ง€ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
The Virtual Lab ๋…ผ๋ฌธ์€ AI Scientist๊ฐ€ ์‹ค์ œ ๊ณผํ•™์  ํƒ๊ตฌ ๊ณผ์ •(์˜ˆ์‹œ: ๋‚˜๋…ธ๋ฐ”๋”” ์„ค๊ณ„)์— ์“ฐ์ธ ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•ด EAIRA์˜ ํ‰๊ฐ€๋ฐฉ๋ฒ• ์‹ค์ „ ์ ์šฉ ์˜ˆ์‹œ๋กœ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์ž์œจ๊ณผํ•™ ์‹คํ—˜ ๋ฐ AI ์—์ด์ „ํŠธ ๋„คํŠธ์›Œํ‚น์˜ ์‹ค์ œ ํ™œ์šฉ ์˜ˆ์‹œ๋กœ, SCP ํ”„๋กœํ† ์ฝœ๊ณผ ์—ฐ๊ณ„๋œ ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ์˜คํ”ˆ ์‹คํ—˜ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
The Virtual Biotech ๋…ผ๋ฌธ์€ AI ์—์ด์ „ํŠธ ํŒ€ ๊ธฐ๋ฐ˜์˜ ๋ฐ”์ด์˜คํ…Œํฌ ์‹ ์•ฝ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ ์šฉํ•˜์—ฌ Virtual Lab์˜ ํŒ€ ํ˜‘์—… ์ ‘๊ทผ๋ฒ•์„ ์‹ค์ œ ์น˜๋ฃŒ์ œ ์„ค๊ณ„์— ํ™•์žฅ ์ ์šฉํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •