Essence
Fig. 1 Overview of EnzyGen2 and the curated protein-ligand dataset.
EnzyGen2๋ ๋จ๋ฐฑ์ง-๋ฆฌ๊ฐ๋ ์ํธ์์ฉ์ ๋ช
์์ ์ผ๋ก ๊ณ ๋ คํ์ฌ ์์ด๊ณผ ๊ตฌ์กฐ๋ฅผ ๋์์ ์ค๊ณํ๋ 7์ต 3์ฒ๋ง ํ๋ผ๋ฏธํฐ์ ๋จ๋ฐฑ์ง ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ด๋ค. 720,993๊ฐ์ ๋จ๋ฐฑ์ง-๋ฆฌ๊ฐ๋ ์์ผ๋ก ํ์ตํ์ฌ ํด๋ก๋ํ๋์ฝ ์์ธํธํธ๋์คํผ๋ผ์ ๋ฑ ๋ค์ค ํจ์์์ 51.6% ์์ด ๋์ผ์ฑ์ผ๋ก๋ ์์ฐ ํจ์ ์์ค ์ด์์ ์ด๋งค ํ์ฑ์ ๊ฐ๋ ์ ๊ท ํจ์๋ฅผ ์์ฑํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 5/5 Significance: 5/5 Clarity: 5/5 Overall: 5/5
์ดํ: EnzyGen2๋ ๋จ๋ฐฑ์ง-๋ฆฌ๊ฐ๋ ์ํธ์์ฉ์ ๋ช
์์ ์ผ๋ก ํตํฉํ ๊ฐ๋ ฅํ ํ์ด๋ฐ์ด์
๋ชจ๋ธ๋ก, ๊ด๋ฒ์ํ ํ์ต ๋ฐ์ดํฐ์ ํ์ ์ ์ํคํ
์ฒ๋ก ๋จ๋ฐฑ์ง ์ค๊ณ ๋ถ์ผ์ ์ค์ง์ ๋ํ๊ตฌ๋ฅผ ์ ์ํ๋ฉฐ, ๋ค์ค ํจ์ ํจ๋ฐ๋ฆฌ์ ๊ฑธ์น ์คํ ๊ฒ์ฆ์ผ๋ก ๋์ ์ ๋ขฐ์ฑ์ ํ๋ณดํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ ๋ถ์ผ์์ ๋ํ ์ธ์ด๋ชจ๋ธ(Galactica ๋ฑ)์ ๊ตฌ์กฐ์ ์๋ฌผ์ ๋ณด ์์ฉ๊ณผ ๋ถ์ ์์ฑ ๋ฅ๋ ฅ์ ๋ํ ํฌ๊ด์ ์ฌ๋ก๋ฅผ ์ ์ํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
de novo ํจ์ ์ค๊ณ์ sequence-structure ๋์ ์ค๊ณ ๋ฐ ๋ฒค์น๋งํน ๋ฃจํด์ด LAFA ์์คํ
๊ณผ ๋ณํํ ๋งํ ๋น๊ต ์ง์ ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํํ ๋ฐ์ ์์ธก ๋ฐ ํ๋ณด ๋ถ์ ๋์ถ์ LLM์ ํ์ฉํ ์ ๊ทผ๋ฒ์ ๋ณด์ฌ์ฃผ์ด, ๋จ๋ฐฑ์ง ์ค๊ณ์ AI ์ ์ฉ ์ธ์ฐ์ ๋ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง-๋ฆฌ๊ฐ๋ ์ค๊ณ ์ธ์๋ ๋๋
ธ์์ฌ ๋ฑ ๊ตฌ์ฑ์์์ ๋ฉํฐ๋ชจ๋ฌ ์ ๋ณด ์ถ์ถ ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง/๋๋
ธ๋ฌผ์ง ์์ฑ ์์
์ ํนํ๋ ์์ด์ ํธ ์ฐ๊ตฌ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
3059๋ de novo ๋จ๋ฐฑ์ง ํจ์ ์ค๊ณ์ ๋ํ ๋ค๋ฅธ ์์ฑํ ์ ๊ทผ๋ฒ์ ์ ๊ณตํ๋ฏ๋ก, 3249์ ฮฒ-ํค์ดํ ํฉํ์ด๋ ์ค๊ณ ๋ฐฉ๋ฒ๊ณผ ๋น๊ตํด๋ณผ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง-๋ฆฌ๊ฐ๋ ๋ณตํฉ์ฒด์ 3D๊ตฌ์กฐ ๋ฐ์ดํฐ ์์ธก์ ๊ฐ์กฐํ๋ AlphaFold Database์๋ ๋ฌ๋ฆฌ ๊ตฌ์กฐ-์์ด ๋์ ์ค๊ณ๋ฅผ ์๋ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
de novo ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ๋ฐ ๊ธฐ๋ฅ ์ค๊ณ์์ ์์ฑํ AI์ ์ค์ ์คํ ์ ์ฉ์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
3059๋ de novo ํจ์ ์ค๊ณ์ PPI ์์ธก์ ์ ์ฉํ๋ ๋ฅ๋ฌ๋ ํ๋ ์์ํฌ์ฌ์, ๋๊ท๋ชจ PPI ์์ธก์ ์ฃผ์ ๋ก ํ๋ 3155์ ์ํธ ๋ณด์์ ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
de novo ํจ์ ์ค๊ณ์์ ์์ด-๊ตฌ์กฐ ๋์ ์ค๊ณ ๋ฐฉ๋ฒ์ด FLIP2 ๋ฑ๊ณผ ๋ฌ๋ฆฌ ๊ตฌ์ฒด์ ์ ๊ฒฝ๋ง ์ต์ ํ ๋ฐฉ๋ฒ์ ์ ์ฉํ๋ฉฐ, multimodal ๋จ๋ฐฑ์ง ์ค๊ณ ์ ๊ทผ๋ฒ ๋น๊ต์ ์ ์ฉํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
de novo ๋จ๋ฐฑ์ง ์ค๊ณ ๋ฐ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๊ธฐ๋ฐ ์๋ก์ด ๋จ๋ฐฑ์ง ์์ฑ์ ์ฃผ์ ๋ก, ๋ค์ํ ์๋ ์ค๊ณ ๋ฐฉ์์ ๋น๊ต์ ์ฐจ๋ณ์ ์ ํ์
ํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
de novo ํจ์/๋จ๋ฐฑ์ง ์ค๊ณ๋ฅผ ํตํด ๋นํ์ค ์๋ฏธ๋
ธ์ฐ ํ์ฉ ๋ฑ ์๋ช
๊ณตํ ํ์ฅ์ฑ์ ํ๊ตฌํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
de novo enzyme ์ค๊ณ ๋ฐ ์๋ํ ์คํ ์ ๊ทผ์ ๊ดํ ๋
ผ๋ฌธ์ผ๋ก, ๋ฐ์๋ ํ๋กํ
์ค๋ฏน์ค ๋ก๋ณดํฑ์ค ์์คํ
๊ณผ ๋น๊ตํ์ฌ ๋ณผ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
์์ฒด๋ถ์ ์ํธ์์ฉ์ ์ ์์ ๋ถํฌ๋ฅผ ์์ฑ์ ์ผ๋ก ๋ชจ๋ธ๋งํ๋ ๋ฐฉ์์ด de novo ํจ์ ์ค๊ณ ๊ธฐ๋ฒ๊ณผ ๊ตฌ์กฐ์ ์ผ๋ก ์ฐ๊ฒฐ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์์ฑ ์ ๊ฒฝ-๊ธฐํธ ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง ์์ด ๋์์ธ ๊ธฐ๋ฒ์ผ๋ก, EnzyGen2์ approach๋ฅผ ๋ณด์ํ๊ฑฐ๋ ํ์ฅํ ์ ์๋ค.
์์ฉ ์ฌ๋ก
3059๋ de novo ๋จ๋ฐฑ์ง ๋ฐ ๋ถ์ ์ค๊ณ ๋ฌธ์ ์ ์๋ ๊ณ์ฐ ์ํฌํ๋ก ๋ฐ ์์ด์ ํธ ์์คํ
์ ์ ์ฉํ์ฌ, 864์ ์๋ํ ํ๋ ์์ํฌ๋ฅผ ์ค์ ์์ฌ, ํํ ์ค๊ณ์ ์ ์ฉํ ์ฌ๋ก์
๋๋ค.