์ ์: Joseph L. Watson, David Juergens, Nathaniel R. Bennett, Brian L. Trippe, Jason Yim, Helen E. Eisenach, Woody Ahern, Andrew J. Borst, Robert J. Ragotte, Lukas F. Milles, Basile I. M. Wicky, Nikita Hanikel, Samuel J. Pellock, Alexis Courbet, William Sheffler, Jue Wang, Preetham Venkatesh, Isaac Sappington, Susana Vรกzquez Torres, Anna Lauko, Valentin De Bortoli, Emile Mathieu, Sergey Ovchinnikov, Regina Barzilay, Tommi S. Jaakkola, Frank DiMaio, Minkyung Baek, David Baker | ๋ ์ง: 2023-08-31 | DOI: 10.1038/s41586-023-06415-8 📄 PDF
Essence
Fig. 1 | Protein design using RFdiffusion. a, Diffusion models for proteins are
RFdiffusion์ RoseTTAFold ๊ตฌ์กฐ ์์ธก ๋คํธ์ํฌ๋ฅผ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ denoising ์์
์ผ๋ก fine-tuningํ์ฌ ๋ค์ํ ๋จ๋ฐฑ์ง ์ค๊ณ ๋ฌธ์ (de novo binder, ๋์นญ ์ฌ๋ฆฌ๊ณ ๋จธ, ํจ์ scaffolding ๋ฑ)๋ฅผ ํด๊ฒฐํ๋ ์์ฑํ diffusion model์ด๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: RFdiffusion์ ๊ตฌ์กฐ ์์ธก ๋คํธ์ํฌ์ ๊ฐ๋ ฅํ ํํ๋ ฅ์ generative diffusion model๋ก ์ ํํ์ฌ ๋จ๋ฐฑ์ง ์ค๊ณ์ ๋ค์ํ ๋์ ์ ํต์ผ์ ์ผ๋ก ํด๊ฒฐํ๋ ํ๊ธฐ์ ๋ฐฉ๋ฒ๋ก ์ด๋ฉฐ, ๊ด๋ฒ์ํ ์คํ์ ๊ฒ์ฆ๊ณผ cryo-EM ๊ตฌ์กฐ ํ์ธ์ผ๋ก ๊ทธ ์ค์ฉ์ฑ๊ณผ ์ ํ์ฑ์ ์
์ฆํ ๋งค์ฐ ์ค์ํ ๊ธฐ์ฌ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
344๋ ์๋ฌผ์ ๋ณดํ ๋ถ์ผ์์์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๊ฐ๊ด์๋ก, 256์ ๋จ๋ฐฑ์ง ์ค๊ณ diffusion ๋ชจ๋ธ์ ๊ธฐ์ ์ ๋ฐ ์ด๋ก ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
RFdiffusion ๊ธฐ๋ฐ์ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ๋ฐ ๊ธฐ๋ฅ ์ค๊ณ ์ฐ๊ตฌ๋ ๊ธฐ์กด ์กฐ์ฑ ์ค์ฌ ํด๋ฆฌ์คํฑ์ ๋์ด ๋ถ์ ๋ ๋ฒจ์ ๊ตฌ์กฐ-๊ธฐ๋ฅ ์๊ด๊ด๊ณ๋ฅผ ํ๊ตฌํ๋ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ตฌ์กฐ ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง ์ค๊ณ(RFdiffusion)์ ๊ดํ ์ฐ๊ตฌ๋ก, ํด์ ๊ฐ๋ฅ์ฑ๊ณผ generative ๊ธฐ๋ฒ์ด ์ด๋ป๊ฒ ๊ฒฐํฉ๋๋์ง ์ค๋ช
ํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
RFdiffusion์ ํ์ฉํ de novo ๋จ๋ฐฑ์ง/ํฉํ์ด๋ ์ค๊ณ ์ฐ๊ตฌ๋ก, ์ง์ ์ ์ด๋ก ์ ๊ธฐ๋ฐ์
๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
256 ๋
ผ๋ฌธ์ RFdiffusion ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง์ de novo ๊ตฌ์กฐ ๋ฐ ๊ธฐ๋ฅ ์ค๊ณ์ ์ต์ ์ด๋ก ๋ฐ ์ ์ฉ์ ๋ค๋ค, 3028์ ๋ฒค์น๋งํฌ ํญ๋ชฉ์ ์ฃผ์ํ ์ด๋ก ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
RFdiffusion ํ์ฉ de novo ๋จ๋ฐฑ์งยท๋ฆฌ๊ฐ๋ ๊ฒฐํฉ ์ค๊ณ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ผ๋ก, ์คํ์ ์ค๊ณ ๋ฐฉ๋ฒ๋ก ์ ์ฌํํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
RFdiffusion ๊ธฐ๋ฐ de novo ๋จ๋ฐฑ์ง ์ค๊ณ ๋
ผ๋ฌธ์ ๋์ฐ๋ณ์ด ๊ฐ๊ฑด์ฑ ๋ฑ ๋จ๋ฐฑ์ง ์์ด-๊ตฌ์กฐ ๊ด๊ณ ์ฐ๊ตฌ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
de novo ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์์ธก ๋ฐ ์ค๊ณ์ ๊ธฐ๋ณธ์ ์๊ณ ๋ฆฌ์ฆ๊ณผ ๋ฒค์น๋งํน ๋ฐฉ๋ฒ๋ก ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
AF2 ๋ฐ RFdiffusion ๋ฑ ๊ตฌ์กฐ ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง-๋ฆฌ๊ฐ๋ ๊ฒฐํฉ ์์ธก์ ์ต์ ์ฃผ์ ๋ฐฉ๋ฒ๋ก ์ ๋ํ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
256๋ฒ ๋
ผ๋ฌธ์ RFdiffusion ๊ธฐ๋ฐ de novo ๋จ๋ฐฑ์ง ์ค๊ณ ํ์ดํ๋ผ์ธ์ ์ ์, IARA๊ฐ ์ฌ์ ํ๊ฐํ ์์ฑ ๊ฒฐ๊ณผ์ ๋ํ์ ์์๋ก ์ฐธ๊ณ ๊ฐ๋ฅํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
256๋ฒ ๋
ผ๋ฌธ์ de novo ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์ค๊ณ๋ฅผ ์ํ RFdiffusion ์ ๊ทผ๋ฒ์ ์ ๊ณตํด small-molecule binding protein ์ค๊ณ workflow์ธ CLAIRE์ ๊ทผ๋ณธ์ ์ผ๋ก ์ฐ๊ฒฐ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
de novo ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ๋ฐ ๊ธฐ๋ฅ ์ค๊ณ LLM ๊ธฐ๋ฐ ์ ๊ทผ์ผ๋ก ๋ณธ ๋
ผ๋ฌธ์ ์์ฑํ ๋จ๋ฐฑ์ง ์ค๊ณ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
256๋ฒ ๋
ผ๋ฌธ(RFdiffusion ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ/function ์์ฑ)๊ณผ 3097์ Genie 3 ๋จ๋ฐฑ์ง ํ์ฐ ๋ชจ๋ธ์ ์ต์ ๊ตฌ์กฐ์์ฑ๋ฒ์ผ๋ก ์ํธ ์ฐธ์กฐ๊ฐ ์ ์ตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
256์ RFdiffusion ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ/๊ธฐ๋ฅ ์ค๊ณ๋ฅผ ๋ค๋ฃจ์ด, DNA ์์ด ์ค๊ณ ์ค์ฌ 459์ ๋น๊ต๋๋ ๋ํ์ ์ธ ๋ถ์ ์์ฑ ์ ๊ทผ๋ฒ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
RFdiffusion์ ๊ธฐ๋ฐ์ผ๋ก ํ de novo ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์ค๊ณ ๋
ผ๋ฌธ์ผ๋ก, ํญ์ฒด๊ฐ ์๋ ์ผ๋ฐ ๋จ๋ฐฑ์ง๋ก ์ ์ฉ๋๋ ๋ฉ์ปค๋์ฆ ๋ฐ ์ฑ๋ฅ ๋น๊ต์ ์ฐธ๊ณ ๊ฐ ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
RFdiffusion ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์ค๊ณ ๋ชจ๋ธ๋ก, CryoNet.Refine์ one-step diffusion ๋ฐฉ์๊ณผ iterative ์์ฑ๊ตฌ์กฐ refinement์ ์ฐจ๋ณ์ ์ ๋น๊ตํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
State Space Model์ ํ์ฉํ ์์ฒด๋ถ์ ์๊ณ์ด ๋ชจ๋ธ๋ง์ ๋์์ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค
๋ค๋ฅธ ์ ๊ทผ
De novo protein design์ RFdiffusion ๊ธฐ๋ฐ์ผ๋ก ์ ๊ทผํ์ฌ, RL ์๋ diffusion ๊ธฐ๋ฐ ์์ฑ์ ์ฑ๊ณผ๋ฅผ ๋น๊ตํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
De novo design of protein structure and function with RFdiff๋ ์๋ฌผํ์ ๊ธฐ๋ฅ ๋จ๋ฐฑ์ง de novo ์ค๊ณ๋ฅผ ๋ค๋ฃจ๋, 3114์ ์๋์ง ๋ฌผ์ง ์ ์ด ํ์ต ์์ฑ AI์๋ ์ ์ฉ ๋๋ฉ์ธ์ด ๋ค๋ฅด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง binder ์ค๊ณ ๋๋ ํจ์ scaffolding์ ์ํ ๊ณ์ฐ์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
2990 ๋
ผ๋ฌธ์ de novo ๋จ๋ฐฑ์ง ์ค๊ณ ๋ฌธ์ ๋ฅผ ์ ๊ฒฝ-๊ธฐํธ์ ๋ฐฉ๋ฒ๋ก ์ผ๋ก ์ ๊ทผํ๋ฉฐ, RFdiffusion์ pure neural generative approach์ ๋์กฐ์ ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฎฌ๋ ์ด์
์์ ์คํ ํ๊ฒฝ์ผ๋ก์ ์ ์ด ํ์ต์ ํ์ฉํ๋ ์์จ ๊ณผํ ์คํ์ ๋์์ ์ ๊ทผ์ด๋ค
๋ค๋ฅธ ์ ๊ทผ
RFdiffusion์ ํ์ฉํ ์ ๋ก์ท ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์์ฑ ์ ๊ทผ๋ฒ์ผ๋ก, AlphaFold ๋ด๋ถ ํ์ฑํ ์กฐ์๊ณผ๋ ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
De novo design of protein structure with RFdiff ๋
ผ๋ฌธ์ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์ค๊ณ์ ์๋ก์ด ๊ธฐ๊ณํ์ต ๊ธฐ๋ฐ์ ์ ์ํ์ฌ ProteinMPNN๊ณผ ๋น๊ต๋ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
RFdiffusion ๋
ผ๋ฌธ์ de novo ๋จ๋ฐฑ์ง ์ค๊ณ์ ๊ตฌ์กฐ์์ธก ๋ฐ ์์ฑํ ๋ชจ๋ธ ์ ๊ทผ์ ๊ณ ์นํ๋ ํญ์ฒด ์ค๊ณ์ ํ์ฅํ ์ฌ๋ก์ด๋ค.
ํ์ ์ฐ๊ตฌ
VibeGen์ ํต์ฌ ๊ธฐ๋ฐ ๊ธฐ์ ์ธ ๋จ๋ฐฑ์ง ์ค๊ณ ๋๋ ์ธ์ด ํ์ฐ ๋ชจ๋ธ์ ์ง์ ์ ์ผ๋ก ํ์ฅํ๊ฑฐ๋ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
112๋ RFdiffusion์ ํญ์ฒด ์ค๊ณ๋ก ํ์ฅ ์ ์ฉํ ๋
ผ๋ฌธ์ผ๋ก, 256์ ๋จ๋ฐฑ์ง ์์ฑ ๋ชจ๋ธ ์ ๊ทผ์ ๊ตฌ์ฒด์ ์๋ช
๊ณผํ ์์ฉ์ผ๋ก ์ฌํํ๋ค.
ํ์ ์ฐ๊ตฌ
Latent-Y ๋
ผ๋ฌธ์ de novo ํญ์ฒด๋ฅผ ์ํ ์์จ ์์ด์ ํธ ์ค๊ณ ๋ฐฉ๋ฒ์ ์ ์ํ๋ฉฐ, RFdiffusion ๋ชจ๋ธ์ ์คํ์ ํ์ฅ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ค๋ค.
ํ์ ์ฐ๊ตฌ
2988 ๋
ผ๋ฌธ์ RFdiffusion ๋ฑ ์์ฑ ๋จ๋ฐฑ์ง ๋ชจ๋ธ์ ๊ฒฐํฉ ๋ถ์ ์์ธก ์ ํ๋ ๊ฐ์ ์ ๋ชฉ์ ์ผ๋ก ์ฌ์ ํ๊ฐํ๋ GAT ๊ธฐ๋ฐ ๋ชจ๋ธ์ ์ ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
RFdiffusion ๊ธฐ๋ฐ de novo ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ๋ฐ ๊ธฐ๋ฅ ์ค๊ณ ๋
ผ๋ฌธ์ผ๋ก, ์ธ๋ฐํ ์
์ฒด์ ํ์ฑ์ด๋ ์ด๋งค-๊ธฐ์ง ์ค๊ณ ์์ธก์ ์ค์ ์ ์์ฉ ์์๊ฐ ๋ฉ๋๋ค.