Sparks: Multi-Agent Artificial Intelligence Model Discovers Protein Design Principles

์ €์ž: Alireza Ghafarollahi, Markus J. Buehler | ๋‚ ์งœ: 2025 | DOI: 10.48550/arXiv.2504.19017 📄 PDF


Essence

Figure 1

Sparks ๋‹ค์ค‘์—์ด์ „ํŠธ AI ๋ชจ๋ธ์˜ ๊ฐœ์š”: (a) ๊ธฐ์กด AI ์‹œ์Šคํ…œ๊ณผ์˜ ์ฐจ์ด์ , (b) ์ž๋™ํ™”๋œ ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ ๊ฒ€์ฆ ํ”„๋กœ์„ธ์Šค

Sparks๋Š” ๊ธฐ์กด AI ์‹œ์Šคํ…œ์˜ ํ›ˆ๋ จ ๋ถ„ํฌ ๋‚ด ํŒจํ„ด ์ธ์‹์„ ๋„˜์–ด ์™„์ „ํžˆ ์ž๋™ํ™”๋œ ๊ณผํ•™์  ๋ฐœ๊ฒฌ ์‚ฌ์ดํด์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋‹ค์ค‘๋ชจ๋‹ฌ ๋‹ค์ค‘์—์ด์ „ํŠธ AI ๋ชจ๋ธ์ด๋‹ค. ๋ณธ ์—ฐ๊ตฌ๋Š” ๋‹จ๋ฐฑ์งˆ ๊ณผํ•™์—์„œ ์ด์ „์— ์•Œ๋ ค์ง€์ง€ ์•Š์€ ๋‘ ๊ฐ€์ง€ ํ˜„์ƒ์„ ๋ฐœ๊ฒฌํ•จ์œผ๋กœ์จ ์ง„์ •ํ•œ ์ž๋™ํ™”๋œ ๊ณผํ•™ ๋ฐœ๊ฒฌ์˜ ๊ฐ€๋Šฅ์„ฑ์„ ์ž…์ฆํ•œ๋‹ค.

Motivation

Achievement

Figure 4

๊ธธ์ด ์˜์กด์  ๋‚˜์„ -์‹œํŠธ ๊ธฐ๊ณ„์  ๊ต์ฐจ์  ๋ฐœ๊ฒฌ: (a) ์‚ฌ์šฉ์ž ์ž…๋ ฅ ์ฟผ๋ฆฌ, (b-d) ๋‹ค์–‘ํ•œ ํŽฉํƒ€์ด๋“œ ๊ธธ์ด์—์„œ ์•ŒํŒŒ ๋‚˜์„ ๊ณผ ๋ฒ ํƒ€ ์‹œํŠธ ๊ตฌ์กฐ์˜ ๊ธฐ๊ณ„์  ํŠน์„ฑ ๋น„๊ต

  1. ๊ธธ์ด ์˜์กด์  ๊ธฐ๊ณ„์  ๊ต์ฐจ์ (Length-dependent mechanical crossover): ๋ฒ ํƒ€ ์‹œํŠธ ํŽธํ–ฅ ํŽฉํƒ€์ด๋“œ๊ฐ€ 80๊ฐœ ์ž”๊ธฐ(residue)๋ฅผ ์ดˆ๊ณผํ•˜๋Š” ๊ธธ์ด์—์„œ ์•ŒํŒŒ ๋‚˜์„  ๊ตฌ์กฐ๋ฅผ ๋Šฅ๊ฐ€ํ•˜๋Š” ์ „๊ฐœ๋ ฅ(unfolding force)์„ ๋‚˜ํƒ€๋ƒ„. ์ด๋Š” ๋‹จ๋ฐฑ์งˆ ์—ญํ•™ ์„ค๊ณ„์˜ ์ƒˆ๋กœ์šด ์›๋ฆฌ๋ฅผ ํ™•๋ฆฝํ•จ.
  2. ์‡„ ๊ธธ์ด/์ด์ฐจ ๊ตฌ์กฐ ์•ˆ์ •์„ฑ ๋งตํ•‘: ๋ฒ ํƒ€ ์‹œํŠธ๊ฐ€ ํ’๋ถ€ํ•œ ๊ตฌ์กฐ์˜ ์˜ˆ์ƒ ์™ธ ๊ฒฌ๊ณ ์„ฑ๊ณผ ํ˜ผํ•ฉ ์•ŒํŒŒ/๋ฒ ํƒ€ ํด๋“œ์—์„œ์˜ "์ขŒ์ ˆ ์˜์—ญ(frustration zone)" ๋ฐœ๊ฒฌ. ์ค‘๊ฐ„ ๊ธธ์ด์˜ ํ˜ผํ•ฉ ๊ตฌ์กฐ์—์„œ ๋†’์€ ๊ตฌ์กฐ์  ๋ถ„์‚ฐ(conformational variance)์„ ๋ณด์ž„.

How

Figure 2

Sparks์˜ ์ „์ฒด ํ”„๋กœ์„ธ์Šค: ์•„์ด๋””์–ด ์ƒ์„ฑ๋ถ€ํ„ฐ ์ตœ์ข… ๋ฌธ์„œ๊นŒ์ง€์˜ ์ž๋™ํ™”๋œ ํ๋ฆ„

1) ์•„์ด๋””์–ด ์ƒ์„ฑ(Idea Generation): ์‚ฌ์šฉ์ž ์ฟผ๋ฆฌ, ์ด์šฉ ๊ฐ€๋Šฅ ๋„๊ตฌ, ์‹คํ—˜ ์ œ์•ฝ์กฐ๊ฑด์œผ๋กœ๋ถ€ํ„ฐ ์ƒˆ๋กญ๊ณ  ๊ฒ€์ฆ ๊ฐ€๋Šฅํ•œ ๊ฐ€์„ค ์ƒ์„ฑ

2) ์•„์ด๋””์–ด ๊ฒ€์ฆ(Idea Testing): ๊ฐ€์„ค์„ Python ์Šคํฌ๋ฆฝํŠธ๋กœ ๊ตฌํ˜„, ๋„๊ตฌ ์‹คํ–‰, ๊ฒฐ๊ณผ๋ฅผ JSON ํ˜•์‹์œผ๋กœ ์ €์žฅ

3) ๊ฐœ์„ (Refinement): ๊ฒฐ๊ณผ ํ•ด์„ ๋ฐ ํ›„์† ์‹คํ—˜ ์„ค๊ณ„๋กœ ์ดˆ๊ธฐ ์‹คํ—˜์˜ ์ดˆ์ ์„ ๊ฐ•ํ™”

4) ๋ฌธ์„œํ™”(Documentation): ๋ชฉํ‘œ, ๋ฐฉ๋ฒ•๋ก , ์ฃผ์š” ๋ฐœ๊ฒฌ, ํ•จ์˜, ํ–ฅํ›„ ๋ฐฉํ–ฅ์„ ํฌํ•จํ•œ ์ตœ์ข… ๋ณด๊ณ ์„œ ์ž‘์„ฑ

Originality

Limitation & Further Study

Evaluation

Novelty: 4.8/5 Technical Soundness: 4.5/5 Significance: 4.6/5 Clarity: 4.3/5 Overall: 4.5/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ AI ์‹œ์Šคํ…œ์ด ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹จ์ˆœํžˆ ์žฌํ˜„ํ•˜๋Š” ์ˆ˜์ค€์„ ๋„˜์–ด ์ง„์ •ํ•œ ๊ณผํ•™์  ๋ฐœ๊ฒฌ์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Œ์„ ์ตœ์ดˆ๋กœ ์ž…์ฆํ•œ ํš๊ธฐ์  ์—ฐ๊ตฌ์ด๋‹ค. ์ƒ์„ฑ-๋ฐ˜์‚ฌ ๊ตฌ์กฐ์˜ ๋Œ€๋ฆฝ์  ์„ค๊ณ„์™€ ์™„์ „ ์ž๋™ํ™”๋œ ์‹คํ—˜ ์‚ฌ์ดํด์€ ํ–ฅํ›„ AI ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋ฐœ๊ฒฌ์˜ ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์ œ์‹œํ•˜๋‚˜, ์‹คํ—˜์  ๊ฒ€์ฆ ๋ถ€์กฑ๊ณผ ๋‹ค๋ฅธ ์˜์—ญ์œผ๋กœ์˜ ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ ๊ฒ€ํ† ๊ฐ€ ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
SAMPLE ํ”Œ๋žซํผ์€ ๋‹ค์ค‘์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ๋‹จ๋ฐฑ์งˆ ํƒ์ƒ‰ ์ž๋™ํ™”์˜ ๋Œ€ํ‘œ์  ๊ธฐ๋ฐ˜ ์‚ฌ๋ก€๋กœ Sparks์˜ ๋ฐœ์ „์  ํ† ๋Œ€๊ฐ€ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋‹ค์ค‘์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ์‹ ์•ฝ/๋‹จ๋ฐฑ์งˆ ์„ค๊ณ„ ์ž๋™ํ™” ๊ฐœ๋…์ด protein discovery์— ๋™์  AI ํ™œ์šฉ ๋ฐฉ๋ฒ•์˜ ๊ทผ๋ณธ์  ์ดํ•ด๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
764 ๋…ผ๋ฌธ์˜ ๋‹ค์ค‘์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์˜ alignment์™€ ํ˜‘๋™ ๋ฌธ์ œ๋Š” 800 ๋…ผ๋ฌธ์ด ๋‹ค๋ฃจ๋Š” LLM alignment์˜ ์ˆจ์€ ์ฐจ์›๊ณผ ๋ฐ€์ ‘ํžˆ ์—ฐ๊ด€๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Sparks ๋…ผ๋ฌธ์€ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜์˜ ๋‹จ๋ฐฑ์งˆ ๋ฐœ๊ฒฌ์„ ๋‹ค๋ฃจ๋ฉฐ, ๋‹จ๋ฐฑ์งˆ ์„ค๊ณ„์˜ ์ž๋™ํ™” ํŒจ๋Ÿฌ๋‹ค์ž„์—์„œ ์ƒํ˜ธ ๋ณด์™„์  ๊ด€์ ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ProtAgents ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋‹จ๋ฐฑ์งˆ ๋‹ค์ค‘์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์„ ํ†ตํ•ด ๋‹จ๋ฐฑ์งˆ ๋ฐœ๊ฒฌ ์ž๋™ํ™” ๋ถ„์•ผ์˜ ๋Œ€์ฒด์  ๊ตฌํ˜„ ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
de novo ๋‹จ๋ฐฑ์งˆ ์„ค๊ณ„๋ฅผ ์œ„ํ•œ ์œ ์‚ฌํ•œ ์ƒ์„ฑ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์„ ์‚ฌ์šฉํ•˜๋Š” ๋Œ€์•ˆ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Sparks ์—ฐ๊ตฌ๋Š” ๋‹ค์ค‘ ์—์ด์ „ํŠธ ๋ฐ RAG ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์‹ ์•ฝ ๋ฐœ๊ฒฌ ์‹คํ—˜์— ์ ์šฉํ•œ ์‚ฌ๋ก€๋กœ ์ ‘๊ทผ ๋ฐฉ๋ฒ• ์ƒ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Sparks๋Š” protein design์˜ ๋‹ค์ค‘์—์ด์ „ํŠธ AI ์ ์šฉ์„ ํ†ตํ•ด SAMPLE ์‹œ์Šคํ…œ์˜ ํ•œ๊ณ„๋ฅผ ๋„˜์–ด ์™„์ „ ์ž๋™ ๊ณผํ•™ ๋ฐœ๊ฒฌ์„ ์‹คํ˜„ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
The AI Scientist ๋…ผ๋ฌธ์€ Sparks์™€ ์œ ์‚ฌํ•˜๊ฒŒ ์™„์ „ ์ž๋™ํ™”๋œ ๊ณผํ•™์ž AI ์‹œ์Šคํ…œ์˜ ์‹คํ˜„ ๊ฐ€๋Šฅ์„ฑ์„ ๋‹ค์–‘ํ•œ ๊ณผํ•™ ๋ถ„์•ผ์—์„œ ์ถ”๊ฐ€๋กœ ์ž…์ฆํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Advances and Challenges in Foundation Agents ๋…ผ๋ฌธ์€ Sparks์™€ ๊ฐ™์€ ๋‹ค์ค‘์—์ด์ „ํŠธ ๊ณผํ•™ ๋ชจ๋ธ์˜ ์„ค๊ณ„, ์ง„ํ™”, ํ˜‘๋ ฅ ์›๋ฆฌ๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ์ •๋ฆฌํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋‹ค์ค‘์—์ด์ „ํŠธ ๋ชจ๋ธ์˜ ๊ณ„ํš/ํƒ์ƒ‰ ๊ฐ•ํ™”๋กœ ๊ณผํ•™ ํƒ๊ตฌ์˜ ์ž๋™ํ™” ํšจ์œจ์„ฑ์„ ๋†’์ด๋Š” ๋ฐฉ๋ฒ•๋ก ์  ๋ฐœ์ „์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
764์˜ ์™„์ „ ์ž๋™ํ™” AI ์‚ฌ์ด์–ธํ‹ฐ์ŠคํŠธ ๊ฐœ๋…์€ 805์˜ ๋ฐ”์ด์˜ค ๋‚˜๋…ธ๋ฐ”๋”” ๋””์ž์ธ virtual lab๊ณผ ์‹คํ˜„ ๊ด€์ ์—์„œ ํ†ตํ•ฉ์ ์œผ๋กœ ์ฐธ๊ณ ํ•  ๋งŒํ•˜๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋‹ค์ค‘ AI ์—์ด์ „ํŠธ๊ฐ€ ํ˜‘๋™์ ์œผ๋กœ ํ™”ํ•™/์ƒ๋ช…๊ณผํ•™ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ์ตœ์‹  ์‘์šฉ ์‚ฌ๋ก€๋กœ MAC-AMP์™€ ์ž๋™ ํ•ญ๊ท ํŽฉํƒ€์ด๋“œ ์„ค๊ณ„์˜ ์ ‘์ ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Towards AI for science: developing a conceptual basis ๋…ผ๋ฌธ์€ ์™„์ „ ์ž๋™ํ™”๋œ ๊ณผํ•™ ๋ฐœ๊ฒฌ์˜ ์ฒ ํ•™์  ๋ฐ ์ด๋ก ์  ๊ฐœ๋… ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Sparks ๋…ผ๋ฌธ์€ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ์ธ๊ณต์ง€๋Šฅ์ด ์‹ค์ œ๋กœ ์ƒ๋ช…๊ณผํ•™(๋‹จ๋ฐฑ์งˆ ์„ค๊ณ„ ๋“ฑ)์—์„œ ์‹ค์งˆ์  ํ˜์‹ ์„ ์ด๋Œ ์ˆ˜ ์žˆ์Œ์„ ๋ณด์ž…๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
ProteinMPNN ๋“ฑ ๋‹จ๋ฐฑ์งˆ ์„œ์—ด-๊ตฌ์กฐ ์„ค๊ณ„ ์‹ ๊ฒฝ๋ง์ด Sparks ๋ชจ๋ธ์˜ AI ๊ธฐ๋ฐ˜ ์ž๋™ ๋ฐœ๊ฒฌ ์‚ฌ์ดํด์˜ ์‹ค์ œ ๊ธฐ๋ฐ˜์ด ๋˜์—ˆ์Œ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Sparks ๋…ผ๋ฌธ์—์„œ๋Š” ๊ณผํ•™์  ๋ฐœ๊ฒฌ ๊ณผ์ •์—์„œ LLM์ด ๋ฐฉ์ •์‹ ์ถ”๋ก ๊ณผ ๊ฒ€์ฆ ์ž‘์—…์„ ์‹ค์ œ๋กœ ์ˆ˜ํ–‰ํ•˜๋Š” ์‚ฌ๋ก€๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •