PerTurboAgent: A Self-Planning Agent for Boosting Sequential Perturb-seq Experiments

์ €์ž: Minsheng Hao, Yongju Lee, Hanchen Wang, Gabriele Scalia, Aviv Regev | ๋‚ ์งœ: 2025 | DOI: 10.1101/2025.05.25.656020 📄 PDF


Essence

Figure 1

PerTurboAgent ๊ฐœ์š”: ์ž๊ธฐ ๊ณ„ํš ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ˜ LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ๊ฐ€ ์ˆœ์ฐจ์  ์‹คํ—˜ ๋ผ์šด๋“œ๋ฅผ ํ†ตํ•ด ํ‘œ์  ํŽ˜๋†€ํƒ€์ž…์— ์˜ํ–ฅ์„ ๋ฏธ์น˜๋Š” ์œ ์ „์ž ์„ญ๋™์„ ์‹๋ณ„

๋Œ€๊ทœ๋ชจ ์œ ์ „์ž ์„ญ๋™ ์‹คํ—˜(Perturb-seq)์—์„œ ์ œํ•œ๋œ ์‹คํ—˜ ์ž์› ๋‚ด์—์„œ ์ตœ๋Œ€์˜ ์ •๋ณด ์ˆ˜์ง‘์„ ์œ„ํ•ด, ์ž๊ธฐ ๊ณ„ํš ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ˜ LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ(PerTurboAgent)๋ฅผ ๊ฐœ๋ฐœํ•˜์—ฌ ์ˆœ์ฐจ์  ์œ ์ „์ž ์„ ํƒ ๋ฌธ์ œ๋ฅผ ์ž๋™ํ™”ํ•˜๊ณ  ๊ธฐ์กด ๋Šฅ๋™ํ•™์Šต(active learning) ๋ฐฉ๋ฒ•๋“ค์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค.

Motivation

Achievement

Figure 2

๋ผ์šด๋“œ๋ณ„ Hit ๋ˆ„์  ๊ณก์„ : PerTurboAgent๊ฐ€ ๊ธฐ์กด ๋Šฅ๋™ํ•™์Šต ๋ฐฉ๋ฒ•(GeneDisco, DiscoBAX, Iterpert)๊ณผ ๋‹ค๋ฅธ LLM ์—์ด์ „ํŠธ(BioDiscoveryAgent)๋ฅผ ์ผ๊ด€๋˜๊ฒŒ ๋Šฅ๊ฐ€

  1. ์„ฑ๋Šฅ ์šฐ์›”์„ฑ: 11๊ฐœ ํ‘œํ˜„ํ˜• ๊ณผ์ œ์—์„œ PerTurboAgent๊ฐ€ ๊ธฐ์กด ํ™œ์„ฑํ•™์Šต ๋ฐฉ๋ฒ•๋“ค(GeneDisco, DiscoBAX, Iterpert)๊ณผ ์ตœ๊ทผ BioDiscoveryAgent๋ฅผ ์ผ๊ด€๋˜๊ฒŒ ๋Šฅ๊ฐ€ํ•˜๋ฉฐ, ํŠนํžˆ ์ดˆ๊ธฐ ๋ผ์šด๋“œ์—์„œ ๋” ๋น ๋ฅด๊ฒŒ hit ์œ ์ „์ž๋ฅผ ์‹๋ณ„
  2. ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ๊ณผ ํˆฌ๋ช…์„ฑ: ์„ ํƒ๋œ ํ–‰๋™์˜ ๋นˆ๋„ ๋ถ„์„๊ณผ ๋‚ด๋ถ€ ๋ฉ”๋ชจ๋ฆฌ ์ถ”์ ์„ ํ†ตํ•ด ์—์ด์ „ํŠธ์˜ ์ถ”๋ก  ๊ณผ์ •์„ ๋ช…ํ™•ํžˆ ๊ฐ€์‹œํ™”ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๊ตฌ์ฒด์ ์ธ ํ–‰๋™ ๋กœ๊ทธ(Figure 4)๋ฅผ ํ†ตํ•ด ์˜์‚ฌ๊ฒฐ์ • ๊ทผ๊ฑฐ๋ฅผ ์ถ”์  ๊ฐ€๋Šฅ
  3. ๋ชจ๋ธ ํ˜ธํ™˜์„ฑ: ํ์‡„ํ˜•(GPT-4) ๋ฐ ๊ฐœ๋ฐฉํ˜•(Llama) ๋ชจ๋ธ ๋ชจ๋‘์—์„œ ์ž‘๋™ํ•˜๋ฉฐ, ๋” ๊ณ ๊ธ‰ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ• ์ˆ˜๋ก ์„ฑ๋Šฅ์ด ํ–ฅ์ƒ๋˜๋Š” ํŠน์„ฑ์„ ๋ณด์ž„

How

Figure 3

PerTurboAgent ํ–‰๋™ ๋ถ„์„: (a) ๋ฒ”์ฃผ๋ณ„ ํ–‰๋™ ์ˆ˜ ๋ถ„ํฌ (์ถ”๋ก , ML ์ถ”๋ก , ๋ถ„์„) (b) ๋ผ์šด๋“œ๋ณ„ ํ–‰๋™ ๋นˆ๋„ ๋ณ€ํ™”

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 3.5/5 Overall: 4/5

์ดํ‰: PerTurboAgent๋Š” ์ž๊ธฐ-๊ณ„ํš LLM ์—์ด์ „ํŠธ๋ฅผ ํ†ตํ•ด ๊ณ ๋น„์šฉ ์œ ์ „์ž ์„ญ๋™ ์‹คํ—˜์˜ ํšจ์œจํ™”๋ผ๋Š” ํ˜„์‹ค์  ๋ฌธ์ œ๋ฅผ ์ฐฝ์˜์ ์œผ๋กœ ํ•ด๊ฒฐํ•˜๋Š” ์—ฐ๊ตฌ๋กœ, ๊ธฐ์กด ํ™œ์„ฑํ•™์Šต ๋ฐฉ๋ฒ•๋“ค์„ ์ผ๊ด€๋˜๊ฒŒ ๋Šฅ๊ฐ€ํ•˜๋Š” ๊ฒฝํ—˜์  ์„ฑ๊ณผ๋ฅผ ๋ณด์ž…๋‹ˆ๋‹ค. ๋‹ค๋งŒ ADG ์ •์˜์˜ ์ž๋™ํ™”, ์‹ค์ œ ์‹คํ—˜์‹ค ํ™˜๊ฒฝ ๊ฒ€์ฆ, ์ด๋ก ์  ๊ธฐ์ดˆ์˜ ๊ฐ•ํ™”๊ฐ€ ์ด๋ฃจ์–ด์ง„๋‹ค๋ฉด ํ›จ์”ฌ ๋” ๊ฐ•๋ ฅํ•œ ๊ธฐ์—ฌ๊ฐ€ ๋  ์ˆ˜ ์žˆ์„ ๊ฒƒ์œผ๋กœ ํŒ๋‹จ๋ฉ๋‹ˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
scBaseCamp ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์œ ์ „์ž ์„ญ๋™ ์‹คํ—˜ ๋ฐ์ดํ„ฐ์˜ ํ‘œ์ค€ํ™”์™€ ์ž๋™ํ™” ๋ถ„์„ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•ด, Perturb-seq ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์‹คํ—˜ ๋””์ž์ธ ๋ฐฉ๋ฒ•๋ก ์˜ ๊ธฐ์ดˆ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
483๋ฒˆ ๋…ผ๋ฌธ์€ ์œ ์ „์ž ์กฐ์ ˆ ์š”์†Œ ์˜ˆ์ธก์„ ์œ„ํ•œ ๋ฐ์ดํ„ฐ ํ™œ์šฉ๋ฒ•์„ ์ œ์•ˆํ•ด, PerTurboAgent์˜ ์œ ์ „์ž ์„ ํƒ ๋ฐ ์‹คํ—˜ ์„ค๊ณ„์— ์ด๋ก ์  ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์•กํ‹ฐ๋ธŒ ๋Ÿฌ๋‹๊ณผ foundation model์„ ์œตํ•ฉํ•œ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ฐ€์ƒ ์„ธํฌ ๋ชจ๋ธ์—์„œ ์œ ์ „์ž ๊ต๋ž€ ํšจ๊ณผ๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•œ๋‹ค
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹จ์ผ์„ธํฌ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์•ฝ๋ฌผ ๋ฐ˜์‘ ์˜ˆ์ธก์˜ ์ œ๋กœ์ƒท ์ผ๋ฐ˜ํ™”๋ฅผ ์œ„ํ•œ ์œ ์‚ฌํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋‹ค๋ฃจ๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
DeepCRE ๋…ผ๋ฌธ์€ AI ๊ธฐ๋ฐ˜ ์•ฝ๋ฌผ ๋ฐ˜์‘ ์‹คํ—˜ ๋””์ž์ธ ํšจ์œจํ™” ๋ฐฉ์•ˆ์„ ๋‹ค๋ฃจ๋ฏ€๋กœ, ์ˆœ์ฐจ์  ์œ ์ „์ž ์„ ํƒ๊ณผ ์ •๋ณด ๊ทน๋Œ€ํ™” ๋ฌธ์ œ์— ๋Œ€ํ•œ ๋Œ€์•ˆ์  ์ „๋žต์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ์ œ๋„คํ‹ฑ ๋ถ„์„์ด ์•„๋‹Œ, gene-set ๋ถ„์„์„ ์œ„ํ•œ self-verification language agent ์ ‘๊ทผ์„ ์ œ์‹œํ•˜๋ฏ€๋กœ ๋‹ค๋ฅธ ๋ฐฉ์‹์˜ ์œ ์ „์ž ๋ถ„์„ ์ž๋™ํ™”์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
PerTurboAgent ๋…ผ๋ฌธ์€ ์—ฐ์†์ ์ธ ์‹คํ—˜ ์ตœ์ ํ™” ๋ฐ ์†Œ์ˆ˜ ํ•™์Šต ๊ธฐ๋ฐ˜ ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ์„ AI๋กœ ์ž๋™ํ™”ํ•˜์—ฌ, ์œ ์‚ฌ ๋ฌธ์ œ์— ๋Œ€ํ•œ ๋‹ค์–‘ํ•œ ์ ‘๊ทผ๋ฐฉ์‹์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
259๋ฒˆ ๋…ผ๋ฌธ์€ ์ƒ๋ช…๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์ž๋™ํ™” ๋ฐ ๋ฐ์ดํ„ฐ ์ค‘์‹ฌ ์‹คํ—˜ ์ตœ์ ํ™”๋ฅผ ์ถ”๊ตฌํ•˜์—ฌ, PerTurboAgent์™€ ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ๋Œ€๊ทœ๋ชจ ์‹ค์ฆ ์—ฐ๊ตฌ์— ์ ์šฉํ•œ ์‚ฌ๋ก€๋กœ, LLM ๊ธฐ๋ฐ˜ ์‹คํ—˜ ์ž๋™ํ™” ๊ธฐ๋ฒ•์˜ ์‹ค์ œ์  ์˜ํ–ฅ๋ ฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๋กœ๋ด‡ ๊ธฐ๋ฐ˜ ๋‹จ๋ฐฑ์งˆ์ฒด ๋ณ€ํ˜• ์‹คํ—˜ ๋ฐ ์—์ด์ „ํŠธ ์ž๋™ํ™”๋ฅผ ๋Œ€๊ทœ๋ชจ๋กœ ์‹คํ˜„ํ•œ ์‹ค์ œ ์‘์šฉ ์‚ฌ๋ก€์ด๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •