์ ์: Minkyung Baek, Frank DiMaio, Ivan Anishchenko, Justas Dauparas, Sergey Ovchinnikov, Gyu Rie Lee, Jue Wang, Qian Cong, Lisa N. Kinch, R. Dustin Schaeffer, Claudia Millรกn, Hahnbeom Park, Carson Adams, Caleb R. Glassman, Andy DeGiovanni, Jose H. Pereira, Andria V. Rodrigues, Alberdina A. Van Dijk, Ana C. Ebrecht, Diederik J. Opperman, Theo Sagmeister, Christoph Buhlheller, Tea Pavkov-Keller, Manoj K. Rathinaswamy, Udit Dalwadi, Calvin K. Yip, John E. Burke, K. Christopher Garcia, Nick V. Grishin, Paul D. Adams, Randy J. Read, David Baker | ๋ ์ง: 2021-08-20 | DOI: 10.1126/science.abj8754 📄 PDF
Essence
Fig. 1. Network architecture and performance.
3-ํธ๋ ์ ๊ฒฝ๋ง ์ํคํ
์ฒ๋ฅผ ์ด์ฉํ์ฌ 1D ์์ด, 2D ๊ฑฐ๋ฆฌ ์ง๋, 3D ์ขํ ์ ๋ณด๋ฅผ ๋์์ ์ฒ๋ฆฌํจ์ผ๋ก์จ AlphaFold2์ ๊ทผ์ ํ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์์ธก ์ ํ๋๋ฅผ ๋ฌ์ฑํ๊ณ ๋จ๋ฐฑ์ง-๋จ๋ฐฑ์ง ๋ณตํฉ์ฒด ๋ชจ๋ธ๋ง์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: RoseTTAFold๋ AlphaFold2์ ํต์ฌ ๊ฐ๋
์ 3-ํธ๋ ์ํคํ
์ฒ๋ก ์ฐฝ์์ ์ผ๋ก ์ฌ๊ตฌ์ฑํ์ฌ ๊ฒฝ์๋ ฅ ์๋ ์ฑ๋ฅ์ ๋ฌ์ฑํ์ผ๋ฉฐ, ํนํ ๊ณต๊ฐ ๋ฐฉ์์ผ๋ก ์ ๊ณต๋จ์ผ๋ก์จ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์์ธก์ ๋ฏผ์ฃผํ์ ๊ตฌ์กฐ์๋ฌผํ ์ฐ๊ตฌ ๊ฐ์ํ์ ํฌ๊ฒ ๊ธฐ์ฌํ๋ ํ๊ธฐ์ ์ธ ์ฐ๊ตฌ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์์ธก์ ์ด๋ก ์ ยท๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ ํ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
383์ geometry-informed tokenization ํ๋ ์์ํฌ๋ ๋จ๋ฐฑ์ง-๋ฆฌ๊ฐ๋ ์ํธ์์ฉ ๋ชจ๋ธ ํ์ต์ ์ ์ฒ๋ฆฌ ๋ฐ ํผ์ฒ ์ค๊ณ์ ์ด๋ก ์ ๊ทผ๊ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
AlphaFold2 ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง-๋ฆฌ๊ฐ๋ ๋ณตํฉ์ฒด ์์ธก ์ํคํ
์ฒ ๋ฐ ์ ํ๋ ํฅ์ ์ฐ๊ตฌ๊ฐ BOS-Lig dataset ๊ตฌ์ถ ๋ฐ ์ ์ฉ์ ๊ธฐ์ ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋จ๋ฐฑ์ง ๊ตฌ์กฐ ๋ถ์์ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ด ๋๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ ๋
ผ๋ฌธ ๋ชจ๋ AlphaFold2(403) ๋ฐ ๊ทธ ๋ณํ(1060)์ผ๋ก ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์์ธก์ ์ด๊ณ ์ ํ์ฑ ๋ฌ์ฑ์ ๋ค๋ฃจ์ง๋ง, ๋คํธ์ํฌ ๊ตฌ์กฐ ๋ฐ multi-track ์ฌ์ฉ๋ฒ์ ์ฐจ์ด๋ฅผ ๋น๊ตํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์์ธก์ ์ํ ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ผ๋ก ๋์ผํ ๋ฌธ์ ๋ฅผ ๋ค๋ฅธ ๋ฐฉ์์ผ๋ก ํด๊ฒฐํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง-๋ฆฌ๊ฐ๋ ์ํธ์์ฉ ๋ชจ๋ธ๋ง์ ์ํ ๋ค๋ฅธ ๋ํน ์ ๊ทผ๋ฒ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์์ธก ๋ฐ ๋ณตํฉ์ฒด ๋ชจ๋ธ๋ง ๋ฌธ์ ๋ฅผ ๋ค๋ฅธ ์ ๊ทผ๋ฒ์ผ๋ก ํด๊ฒฐํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง ๊ธฐ๋ฅ ์์ธก ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋ค๋ฅธ ๋ฐฉ์์ผ๋ก ํ๊ฐํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง ๊ตฌ์กฐ์ ๊ธฐ๋ฅ์ ๋จ์ ๋ถํ ๋ฐ ํํ ํ์ต์ ๋ํ ๋์์ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
์ ํํ ๋จ๋ฐฑ์ง-๋ฆฌ๊ฐ๋ ๋ณตํฉ์ฒด ์์ธก ํ ํด๋น ๋ฆฌ๊ฐ๋์ ์ ํ ์์ธก ๋ฐ ๊ธฐ๋ฅ์ ๋ถ๋ฅ(BOS-Lig Dataset)๋ก ์ฐ๊ณ๋๋ ๋ถ์ ํ์ดํ๋ผ์ธ์ ํ์ธํ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
๋ถ์๊ฒฐ์ ๊ตฌ์กฐ ์์ธก์ ๋ชฉํ๋ก ํ๋ Flow ๊ธฐ๋ฐ ์์ฑ ๋ชจ๋ธ(3173)์ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์์ธก์ ์ต์ ์์ฑ AI ํ๋ฆ๊ณผ ๋ง๋ฟ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
3019๋ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์์ธก์ ํ๋กํ
์ด ์ค์ผ์ผ๋ก ํ์ฅํ์ฌ, 1060์ 3-track ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ ๊ตฌ์กฐ ์์ธก ๋ฐฉ๋ฒ์ ๋ํ ๋ฐ์ดํฐ์ ์ ์ฉ์ํจ ์์
๋๋ค.
ํ์ ์ฐ๊ตฌ
์์ฒด๋ถ์์ ์ ์์ ๋ถํฌ ํ์ต๊ณผ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ์์ธก์ ์ต์ฒจ๋จ ๋ชจ๋ธ์ด ์ค์ ์ํธ๋ณด์์ ๋ฐฉ๋ฒ์์ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
RoseTTAFold์ ๋ฐฉ๋ฒ๋ก ์ ํ์ฅํ๊ฑฐ๋ ์์ฉํ ํ์ ์ฐ๊ตฌ์ด๋ค.