์ ์: Nathaniel R. Bennett, Joseph L. Watson, Robert J. Ragotte, Andrew J. Borst, DรฉJenaรฉ L. See, Connor Weidle, Riti Biswas, Yutong Yu, Ellen L. Shrock, Russell Ault, Philip J. Y. Leung, Buwei Huang, Inna Goreshnik, John Tam, Kenneth D. Carr, Benedikt Singer, Cameron Criswell, Basile I. M. Wicky, Dionne Vafeados, Mariana Garcia Sanchez, Ho Min Kim, Susana Vรกzquez Torres, Sidney Chan, Shirley M. Sun, Timothy Spear, Yi Sun, Keelan O'Reilly, John M. Maris, Nikolaos G. Sgourakis, Roman A. Melnyk, Chang C. Liu, David Baker | ๋ ์ง: 2025-02-28 | DOI: 10.1101/2024.03.14.585103 📄 PDF
Essence
๋ณธ ์ฐ๊ตฌ๋ RFdiffusion ์ ๊ฒฝ๋ง์ ํญ์ฒด ํนํ ๋ฏธ์ธ์กฐ์ ์ ํตํด ์์ ์์ค์ ์ ํ๋๋ก ์ฌ์ฉ์๊ฐ ์ง์ ํ ์ํผํ ํ(epitope)์ ๊ฒฐํฉํ๋ ํญ์ฒด ๊ฐ๋ณ ์์ญ(VHH, scFv)์ ์์ ํ ์ปดํจํฐ ๊ธฐ๋ฐ์ผ๋ก ์ค๊ณํ ์ ์์์ ์ฒ์์ผ๋ก ์
์ฆํ๋ค. ์ด๊ธฐ ๊ณ์ฐ ์ค๊ณ๋ถํฐ ํจ์จ์ฑ ์ฑ์(affinity maturation)๊น์ง ์ฒด๊ณํ๋ ํ์ดํ๋ผ์ธ์ ์ ์ํ๊ณ ํฌ๋ผ์ด์ค-EM ๊ตฌ์กฐ ๊ฒ์ฆ์ผ๋ก ์ค๊ณ ์ ํ๋๋ฅผ ํ์ธํ๋ค.
How
Figure 1: RFdiffusion ํญ์ฒด ์ค๊ณ ๊ฐ์. (A) ๋ฏธ์ธ์กฐ์ ๊ณผ์ ์์ ํญ์ฒด ๋ณตํฉ์ฒด ๊ตฌ์กฐ๋ฅผ ๋
ธ์ด์งํ์ฌ ํ์ต, (B) ์ถ๋ก ์ ํ๋ ์์ํฌ ์์ด๊ณผ ๊ตฌ์กฐ๋ฅผ ์ ๊ณต, (C) ์ ์ญ ํ๋ ์ ๋ถ๋ณ์ฑ์ ํตํด ๊ฐ์ฒด ์์น ์ํ๋ง ๊ฐ๋ฅ, (D) ํ์ ์ํผํ ํ ์ง์ ์ ์ํ ํซ์คํ(hotspot) ํน์ง ์ ์
RFdiffusion ๋ฏธ์ธ์กฐ์ ๋ฐฉ๋ฒ
- ๋คํธ์ํฌ ๊ตฌ์กฐ ์ ์ง: AlphaFold2/RF2์ frame representation(๊ฐ ์๊ธฐ์ Cฮฑ ์ขํ ๋ฐ N-Cฮฑ-C ๊ฐ์ฒด ๋ฐฉํฅ)์ ์ฌ์ฉํ๋ ํ์ฐ ๋ชจ๋ธ ๊ตฌ์กฐ ์ ์ง
- ๋
ธ์ด์ง ๋ฐ ํ์ต: 3D ๊ฐ์ฐ์์ ๋
ธ์ด์ฆ๋ก ์ขํ ๋ถํจ, SO(3) ๋ธ๋ผ์ด ์ด๋์ผ๋ก ๋ฐฉํฅ ๋ถํจ. ๊ฐ ํ์์คํ
์์ ์์ธก ๊ตฌ์กฐ(pX0)์ ์ค์ ๊ตฌ์กฐ(X0) ๊ฐ์ ํ๊ท ์ ๊ณฑ ์ค์ฐจ(MSE) ์์ค ์ต์ํ
- ํญ์ฒด ํนํ ํ๋ จ: ํญ์ฒด ๋ณตํฉ์ฒด ๊ตฌ์กฐ์ ์ฐ์ ์ ์ผ๋ก ๋ฏธ์ธ์กฐ์ ํ๋, ํญ์ฒด ๊ตฌ์กฐ๋ง ๋ถํจ์ํค๊ณ ํ์ ๊ตฌ์กฐ๋ ๋ณด์กด. ํ๋ ์์ํฌ ๊ตฌ์กฐ๋ฅผ 2D ๊ฑฐ๋ฆฌ ๋ฐ ์ด๋ฉด๊ฐ ํ๋ ฌ๋ก template track์ ์ ๊ณตํ์ฌ ์ ๋์ 3D ์์น๋ ์ค๊ณ ๋์์ผ๋ก ๋จ๊น
- CDR ๋ฃจํ ์ค์ฌ ์ค๊ณ: ํซ์คํ ํน์ง์ ์ ์ํ์ฌ CDR ๋ฃจํ๊ฐ ์ํธ์์ฉํ ํ์ ์๊ธฐ ์ง์ . ์ด๋ฅผ ํตํด ๊ฐ์ฒด ์์น์ CDR ๋ฐฐ์น ๋์ ์ค๊ณ
- ์์ด ์ค๊ณ: RFdiffusion ๊ตฌ์กฐ ์์ฑ ํ ProteinMPNN์ ์ฌ์ฉํ์ฌ CDR ๋ฃจํ ์์ด ์ค๊ณ
RoseTTAFold2 ๋ฏธ์ธ์กฐ์ ๋ฐฉ๋ฒ
- ํญ์ฒด-ํญ์ ๊ตฌ์กฐ ์์ธก ํนํ: RF2 ๋คํธ์ํฌ๋ฅผ ํญ์ฒด ๊ตฌ์กฐ์ ๋ฏธ์ธ์กฐ์ ํ๋, ํ์ต ์ ํ์ ๊ตฌ์กฐ์ ์ํผํ ํ ์์น ์ ๋ณด ์ ๊ณต. ์ด๋ฅผ ํตํด CDR ์์ธก ์ ํ๋ ๋ฐ ํญ์ฒด-ํ์ ๊ฒฐํฉ ๋ฐฉํฅ ์์ธก ๊ฐ์
- ์์ฒด ์ผ๊ด์ฑ(self-consistency) ํํฐ๋ง: RFdiffusion์ด ์์ฑํ ์ค๊ณ ๊ตฌ์กฐ๋ฅผ ๋ฏธ์ธ์กฐ์ RF2๋ก ์ฌ์์ธกํ์ฌ ์ค๊ณ ๊ตฌ์กฐ์์ ์ ์ฌ๋ ํ๊ฐ. ๋์ ์ ๋ขฐ๋๋ก ์๋ํ ๋ฐฉ์์ผ๋ก ๊ฒฐํฉ ์์ธก๋๋ VHH๋ฅผ ์ ์
- ๊ต์ฐจ ๋ฐ์์ฑ ๋ถ์: ๋น๊ด๋ จ ๋จ๋ฐฑ์ง์ ๋ํ ์์ธก ๊ฒฐํฉ์ ํ๊ฐํ์ฌ ์๋ํ์ง ์์ ๊ฒฐํฉ ์ต์ํ
- ์ธํฐํ์ด์ค ํ์ง ํ๊ฐ: Rosetta ddG๋ก ๊ณ์ฐ๋ ์ธํฐํ์ด์ค ํ์ง ์ธก์
์คํฌ๋ฆฌ๋ ๋ฐ ์นํ๋ ์ฑ์
- Yeast display ์คํฌ๋ฆฌ๋: ๊ณ์ฐ ์ค๊ณ๋ VHH/scFv๋ฅผ yeast display ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก ๋ฐํํ์ฌ ํ์ ์ํผํ ํ์ ๋ํ ๊ฒฐํฉ์ฒด ์ ๋ณ
- OrthoRep ๊ธฐ๋ฐ ์นํ๋ ์ฑ์: ๋ฌด์์ ๋ฎคํ ๋ก๋ ์ฌ์กฐํฉ ํ๋ผ์ค๋ฏธ๋(pOrtho)๋ฅผ ์ฌ์ฉํ์ฌ VHH CDR ์์ด์ ์งํ์ ์ต์ ํ. ๋์ ๋์ฐ๋ณ์ด์จ(mutation rate)๋ก ์ ์ํ ์นํ๋ ๊ฐ์
๊ตฌ์กฐ ๊ฒ์ฆ
Figure 3: ๋ de novo ์ค๊ณ VHH์ ํฌ๋ผ์ด์ค-EM ๊ตฌ์กฐ ํน์ฑํ. ์์ ์์ค์ ์ค๊ณ ์ ํ๋ ํ์ธ
- ํฌ๋ผ์ด์ค-EM ๋ฐ์ดํฐ ์์ง ๋ฐ ์ฒ๋ฆฌ: ์ค๊ณ๋ VHH ๋๋ scFv์ ํญ์์ ๋ณตํฉ์ฒด์ ๋ํ ๊ณ ํด์๋ ๊ตฌ์กฐ ๊ฒฐ์
- ๊ตฌ์กฐ ๋น๊ต: ์ค๊ณ ๋ชจ๋ธ ๊ตฌ์กฐ์ ์คํ์ ์ผ๋ก ๊ฒฐ์ ๋ ๊ตฌ์กฐ์ RMSD ๊ณ์ฐ ๋ฐ ๋น๊ต
- CDR ๋ฃจํ ์ ํ๋: ๊ฐ๋ณ CDR ๋ฃจํ(H1, H2, H3 ๋ฐ scFv์ ๊ฒฝ์ฐ L1, L2, L3)์ ๋ฐฐ์น ์ ํ์ฑ ๊ฒ์ฆ
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋จ๋ฐฑ์ง de novo ์ค๊ณ ์๊ณ ๋ฆฌ์ฆ ๋ฐ ์ฑ๋ฅ ํ๊ฐ์์ ํต์ฌ ์ฐธ๊ณ ์๋ฃ๋ก, VibeGen์ ๋จ๋ฐฑ์ง ์ค๊ณ ๋ฐฉ๋ฒ๋ก ๊ฐ๋ฐ์ ํ์ฉ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
112๋ de novo ํญ์ฒด ์ค๊ณ๋ฅผ ์ํ LLM ์ ๊ทผ์ ๋ค๋ฃจ๋ฉฐ, 459์์ ์ ์ํ ์๋ฌผํ ์ ํธ ์กฐ๊ฑด DNA ์์ฑ ํ๋ ์์ํฌ์ ์์ฒ ๊ธฐ์ ์ ๊ทผ๊ฑฐ๊ฐ ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
RFdiffusion ๋ฐ ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ ์ ๋ถ์ ๊ฒฐํฉ ๋จ๋ฐฑ์ง ์ค๊ณ ์ ๊ทผ๋ฒ์ด ์ ์ฌํ๋ฉฐ ๋ฐ์ดํฐ ๋ฐ ์คํ ๊ฒ์ฆ ์ ๋ต์์ ํฐ ์ํฅ์ ๋ฐ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
112 ๋
ผ๋ฌธ์ RFdiffusion ๊ธฐ๋ฐ ํญ์ฒด ์ค๊ณ์ ์ด๋ก ์ ์๋ฆฌ๋ฅผ ์ ์ํด, Latent-Y(3150)์ LLM/AI ์๋ํ ํญ์ฒด ์ค๊ณ์ ๊ธฐ์ ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
112๋ฒ ๋
ผ๋ฌธ์ RFdiff์์ ํญ์ฒด de novo ๋์์ธ์ ์ต์ ๊ธฐ์ ์ ๋ค๋ฃจ๋ฉฐ DualGPT-AB์ ์คํ ๊ฒ์ฆ๊ณผ ๊ตฌ์กฐ ์์ฑ ์ ๊ทผ ๋ฐฉ์์ ๊ทผ๊ฑฐ๋ฅผ ๋ณด๊ฐํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณ์ฌ์ฌ ์์ค์ ๋จ๋ฐฑ์ง de novo ์ค๊ณ์์ RFdiffusion ๋ฑ ์ต์ AI ์ค๊ณ ํจ๋ฌ๋ค์์ ๊ธฐ๋ฐ์ด ๋๋ ๋
ผ๋ฌธ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
RFdiffusion๊ณผ ๋์ผํ ๊ตฌ์กฐ ๊ธฐ๋ฐ ํญ์ฒด ์ค๊ณ์ด์ง๋ง, OptMAVEn-2.0 ๋์ RoseTTAFold ๊ธฐ๋ฐ ์์ฑ๋ฒ์ ์ ์ฉํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
RFdiffusion์ ๊ธฐ๋ฐ์ผ๋ก ํ de novo ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์ค๊ณ ๋
ผ๋ฌธ์ผ๋ก, ํญ์ฒด๊ฐ ์๋ ์ผ๋ฐ ๋จ๋ฐฑ์ง๋ก ์ ์ฉ๋๋ ๋ฉ์ปค๋์ฆ ๋ฐ ์ฑ๋ฅ ๋น๊ต์ ์ฐธ๊ณ ๊ฐ ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ํผํ ํ ํน์ด์ ํญ์ฒด ์ค๊ณ๋ฅผ ์ํ ๊ณ์ฐ์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ฌํ ๊ด์ ์์ ๊ฐ๋ฐํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
3017์ ๋๋ค๋ฅธ ๋จ๋ฐฑ์ง-ํญ์ฒด ๊ฒฐํฉ/๋ฐฑ์ ํ๋ณด ์ค๊ณ ๋ฐ ์์ธก ๋ฌธ์ ๋ฅผ ์ธ์ค๋ฆฌ์ฝ ๋ฐฉ๋ฒ์ผ๋ก ํด๊ฒฐํ๋ฉฐ, 112๊ณผ์ ๊ธฐ์ ์ ์ฐจ์ด์ ์ฑ๊ณผ ๋น๊ต๊ฐ ๊ฐ๋ฅํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
RFdiffusion ๋
ผ๋ฌธ์ de novo ๋จ๋ฐฑ์ง ๋ฐ ํญ์ฒด ์ค๊ณ์ ํนํ๋ ๋ฐฉ๋ฒ์ผ๋ก, ๋จ๋ฐฑ์ง ์ด๋ฏธ์ง ์์ฑ์ด ์๋ ๊ตฌ์กฐ ์ค๊ณ๋ฅผ ๋ค๋ฃน๋๋ค.
ํ์ ์ฐ๊ตฌ
RFdiffusion ๋๋ ์ ์ฌ ์์ฑ ๋ชจ๋ธ์ ๋จ๋ฐฑ์ง ์ค๊ณ์ ํน์ ์์ฉ ๋ถ์ผ์ ํ์ฅ ์ ์ฉํ๋ค.
ํ์ ์ฐ๊ตฌ
112๋ RFdiffusion์ ํญ์ฒด ์ค๊ณ๋ก ํ์ฅ ์ ์ฉํ ๋
ผ๋ฌธ์ผ๋ก, 256์ ๋จ๋ฐฑ์ง ์์ฑ ๋ชจ๋ธ ์ ๊ทผ์ ๊ตฌ์ฒด์ ์๋ช
๊ณผํ ์์ฉ์ผ๋ก ์ฌํํ๋ค.
ํ์ ์ฐ๊ตฌ
ํญ์-ํญ์ฒด ์์ด-ํน์ด์ฑ ์์ธก์ ํนํ๋ ๋ฅ๋ฌ๋ ๊ธฐ๋ฒ์ ์๊ฐํ์ฌ, ์์์ ์ ํ๋ ํญ์ฒด ์ค๊ณ์ ํ์ ๋ฐ์ ์ฐ๊ตฌ์ ์์ด๋์ด๋ฅผ ์ ๊ณตํฉ๋๋ค.
์์ฉ ์ฌ๋ก
372๊ฐ ์ ์ํ ๋๊ท๋ชจ ์์ ์๋ฎฌ๋ ์ด์
ํ๋ ์์ํฌ๋ฅผ ํญ์ฒด ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์ค๊ณ ๋ฑ ์๋ช
๊ณผํ์ ์ด๋ป๊ฒ ์ ์ฉํ ์ ์๋์ง 112๋ฒ ๋
ผ๋ฌธ๊ณผ ๋น๊ตํ๋ฉฐ ๋
ผ์ํ ์ ์๋ค.
์์ฉ ์ฌ๋ก
RFdiffusion์ ํตํ ๋จ๋ฐฑ์ง/๋ถ์ ๊ตฌ์กฐ ์์ธก ๋ฐ ์ค๊ณ๊ฐ, GNN ๊ธฐ๋ฐ ์์ ์์ค ์์ธก ์ฑ๋ฅ ๋ฒค์น๋งํน์ ํ์ฉ๋ ์ ์์ต๋๋ค.
๋ฐ๋ก /๋นํ
๋จธ์ ๋ฌ๋ ๊ธฐ๋ฐ ํฉํ์ด๋ ๋์์ธ์์ ๊ตฌ์กฐ์ ๋ฐ์ด์ด์ค ๋ฌธ์ ๋ฅผ ๋ถ์ํ์ฌ, RFdiffusion ํญ์ฒด ์ค๊ณ์ ํ๊ณ์ ๊ฐ์ ์ ์ ๋นํ์ ์ผ๋ก ์ดํด๋ณผ ์ ์์ต๋๋ค.