Essence
Fig. 1. Workflow of developing the end-to-end protein generation model based on dynamics signature, featuring an
VibeGen์ language diffusion model์ ์ฌ์ฉํ์ฌ ์ง์ ๋ normal mode ์ง๋์ ๊ธฐ๋ฐ์ผ๋ก ๋จ๋ฐฑ์ง์ de novo๋ก ์ค๊ณํ๋ agentic ์ด์ค ๋ชจ๋ธ ํ๋ ์์ํฌ๋ก, protein designer์ protein predictor๊ฐ ํ๋ ฅํ์ฌ ์ ํํ๊ณ ๋ค์ํ ์ค๊ณ๋ฅผ ์คํํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ๋จ๋ฐฑ์ง ์ค๊ณ์ dynamics ์ ๋ณด๋ฅผ ์ง์ ํตํฉํ ํ์ ์ ์ธ end-to-end ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, language diffusion model๊ณผ agentic ํ๋ ฅ ๊ตฌ์กฐ๋ฅผ ํตํด de novo ๋จ๋ฐฑ์ง ์์ฑ์์ sequence-dynamics ๊ด๊ณ์ ์๋ฐฉํฅ ๋งคํ์ ์ฑ๊ณต์ ์ผ๋ก ๊ตฌํํ๋ค. ์ค๊ณ๋ ๋จ๋ฐฑ์ง๋ค์ด MD ๊ฒ์ฆ์ ํตํด ๋ชฉํ dynamics๋ฅผ ์ ํํ ์ฌํํ๋ฉด์๋ ์งํ ์ ์ฝ์ ๋ฒ์ด๋ ์์ ์ ๊ท sequence์์ ์
์ฆํ ์ ์์ ๋จ๋ฐฑ์ง ์์ง๋์ด๋ง์ ์๋นํ ๊ธฐ์ฌ๋ฅผ ํ๋, ์๋ฌผํ์ ๊ธฐ๋ฅ ์คํ ๊ฒ์ฆ๊ณผ ๋ณตํฉ dynamics ์ค๊ณ๊น์ง ํ์ฅํ๋ ๊ฒ์ด ํฅํ ๊ณผ์ ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Agentic End-to-End De Novo Protein Design ๋
ผ๋ฌธ์์๋ ๋จ๋ฐฑ์ง ์ค๊ณ ์๋ํ ์ ์ฒด ํ์ดํ๋ผ์ธ์ ์ ์ํ๋ฉฐ, ProtAgents์ ํดยท์๋ฎฌ๋ ์ด์
ํตํฉ ์ ๊ทผ๊ณผ ๋ฐ์ ํ๊ฒ ์ฐ๊ฒฐ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋จ๋ฐฑ์ง de novo ์ค๊ณ ์๊ณ ๋ฆฌ์ฆ ๋ฐ ์ฑ๋ฅ ํ๊ฐ์์ ํต์ฌ ์ฐธ๊ณ ์๋ฃ๋ก, VibeGen์ ๋จ๋ฐฑ์ง ์ค๊ณ ๋ฐฉ๋ฒ๋ก ๊ฐ๋ฐ์ ํ์ฉ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ถ์ ๋์ญํ ๊ถค์ ์์ฑ์ ์ํ ๋ฅ๋ฌ๋ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค
๊ธฐ๋ฐ ์ฐ๊ตฌ
์์ด์ ํธ ๊ธฐ๋ฐ de novo ๋จ๋ฐฑ์ง ์ญ์ค๊ณ ์ฐ๊ตฌ๋ก, LLM ๊ธฐ๋ฐ ์ญ์ค๊ณ ์ํฌํ๋ก์ฐ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ ๋ฐ ์ค์ง์ design pipeline ์ ๋ต์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ฐํํ์ต ๊ธฐ๋ฐ ์์จ ์คํ ์ ์ด์ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค
๋ค๋ฅธ ์ ๊ทผ
638์ ๋ค์ค LLM ๊ธฐ๋ฐ ํ๋กํด ๋์์ธ ๋ฉํฐ์์ด์ ํธ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ, 065์ VibeGen๊ณผ ์ ์ฌํ์ง๋ง ์ค๊ณ ์ ๋ต์ด ๋ค๋ฆ
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Agentic End-to-End De Novo Protein Design ๋
ผ๋ฌธ์ ๋จ๋ฐฑ์ง ๋์์ธ ์๋ํ์ ์ด์ ์ ๋ง์ถ์ด, AutoProteinEngine์ LLM ๊ธฐ๋ฐ ์๋ํ ์ ๊ทผ๊ณผ ๋น๊ต์ ๊ด์ ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
de novo ๋จ๋ฐฑ์ง ์ค๊ณ๋ฅผ ์ํ ์ ์ฌํ ์์ฑ ๋ชจ๋ธ ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ ์ฌ์ฉํ๋ ๋์ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
065๋ฒ ๋
ผ๋ฌธ์ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์ค๊ณ๋ฅผ ์ํ ์์ด์ ํธ์ ์ ๊ทผ์ ๋ค๋ฃจ๊ณ , 594๋ฒ OSDA Agent์ ์ ๊ธฐ๊ตฌ์กฐ์งํฅ์ ๋ฐ๊ฒฌ ํ๋ ์์ํฌ์ ์ฐจ๋ณ์ ์ ํ์ธํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง ์์ด ์์ฑ์ ์ํ ์ธ์ด ๋ชจ๋ธ ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ ๋ํ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง ๋์ญํ ๋๋ ๊ตฌ์กฐ ์ค๊ณ๋ฅผ ์ํ ์ ์ฌํ AI ๊ธฐ๋ฐ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง ์ค๊ณ์ ์์ด์ ํฑ ๋๋ ๋ค์ค ๋ชจ๋ธ ํ๋ ฅ ์ ๊ทผ๋ฒ์ ์ ์ฉํ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง์ ๋ฌผ๋ฆฌ์ ํน์ฑ์ ๋ชฉํ๋ก ํ de novo ์ค๊ณ๋ฅผ ๋ค๋ฃจ๋ ์ ์ฌํ ๋ฐฉ๋ฒ๋ก ์ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
065 ๋
ผ๋ฌธ์ ์์ด์ ํธ ๊ธฐ๋ฐ de novo ๋จ๋ฐฑ์ง ๋์์ธ์ ๋ค๋ฃจ๋ฏ๋ก, 3025์ ์์ฑํ LSTM ๋ชจ๋ธ๊ณผ ํ๋ ์์ํฌ ์์ค์ ๋ค์ํ ์ค๊ณ ์ ๊ทผ์ ๋น๊ตํด๋ณผ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์ฑ์ ๊ธฐ๋ฐ ๋๋
ธ๋ณด ๋จ๋ฐฑ์ง ์ค๊ณ ๋ชจ๋ธ๋ก, ๋จ๋ฐฑ์ง ๋์ญํยท์ง๋ ํน์ฑ์ ๋ค๋ฅด๊ฒ ๊ณ ๋ คํ๋ ์ ๊ทผ ๋ฐฉ์์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
065๋ฒ ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ de novo ๋จ๋ฐฑ์ง ์ค๊ณ๋ฅผ ๋ค๋ฃจ๋ฉฐ, 3262๋ฒ์ ์์ฑํ AI๋ฅผ ํตํ ์๋ฏธ๋
ธ์ฐ ์ฌ์ค๊ณ์ ๋น์ทํ๋ ๋ค๋ฅธ ์ค๊ณ ํ๋ ์์ํฌ๋ฅผ ์ฌ์ฉํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
065๋ ์์ด์ ํฑ ๋ฐฉ์์ de novo ๋จ๋ฐฑ์ง ์ค๊ณ ์๋ํ๋ฅผ ์งํฅํ๋ฉฐ, 3263์ ์ปดํ์ผ๋ฌ-๊ฒ์ฆ ๊ธฐ๋ฐ ๊ณผํ ํ๋กํ ์ฝ ์คํ๊ณผ ๋ชฉ์ ์ด ์ ์ฌํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์ด์ ํธ ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์ค๊ณ ํ๋ ์์ํฌ๋ก, Genie 3๊ณผ ๊ฐ์ SE(3)-๋๋ณ์ฑ ํ์ฐ ๋ชจ๋ธ๊ณผ์ ๋น๊ต/๋์กฐ๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
VibeGen์ ํต์ฌ ๊ธฐ๋ฐ ๊ธฐ์ ์ธ ๋จ๋ฐฑ์ง ์ค๊ณ ๋๋ ์ธ์ด ํ์ฐ ๋ชจ๋ธ์ ์ง์ ์ ์ผ๋ก ํ์ฅํ๊ฑฐ๋ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
VibeGen๊ณผ ์ ์ฌํ๊ฒ protein-ligand ๋ชจ๋ธ๋ง์ ์ํด geometric foundation models๋ฅผ ์ ์ฉํ ์ฌ๋ก๋ก, ๋จ๋ฐฑ์ง ์ค๊ณ์ ์ค์ ์ ์ฉ์ ๋ณด์ฌ์ค๋ค.
ํ์ ์ฐ๊ตฌ
Agentic End-to-End De Novo Protein Design์ ์์ด์ ํธ ๊ธฐ๋ฐ์ผ๋ก ๋จ๋ฐฑ์ง ๋ค์ด๋๋ฏน์ค ์์ฑํ ์ค๊ณ ์๋ํ ๋ฐฉ๋ฒ์ ์ ์ํ์ฌ, 3112์ ์ํธ๋ณด์์ ์ด๋ค.
์์ฉ ์ฌ๋ก
์์ด์ ํธ ๊ธฐ๋ฐ de novo ๋จ๋ฐฑ์ง ์ค๊ณ ํ๋ ์์ํฌ๋ก ์ค์ ์ค๊ณ ์ ๋ต ์ ์ฉ์ ๊ดํ ์ฐ๊ฒฐ๊ณ ๋ฆฌ๋ฅผ ์ ๊ณตํ๋ค.