์ ์: | ๋ ์ง: 2026-04-23 | URL: https://www.biorxiv.org/content/10.64898/2026.04.23.720319v1 📄 PDF
Figure 1: Mining embedding space using PLM-clust: providing access to novel enzymes with minimal
๋จ๋ฐฑ์ง ์ธ์ด๋ชจ๋ธ ESM2์ ํ๊ท ํ๋ง ์๋ฒ ๋ฉ(MPE)๊ณผ k-means ํด๋ฌ์คํฐ๋ง์ ๊ฒฐํฉํ PLM-clust ์๊ณ ๋ฆฌ์ฆ์ ์ ์ํ์ฌ, ์ด๊ธฐ ์๋ ค์ง ํจ์๋ก๋ถํฐ ์์ํด ๋ฐ๋ณต์ ์คํ์ ํตํด ๋ชฉํ ๊ธฐ๋ฅ์ ๊ฐ์ง ์ ๊ท ํจ์๋ฅผ ๋ฐ๊ฒฌํ๋ ๋ฌด๊ฐ๋ ํ์ต ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. ์์ผ๋ผ๋์ ์ ์ด๋ฏผํ์ํจ์์์ 100๋ฐฐ ์ด์์ ํ์ฑ ๋๋ ์ด๋งค ๋ค์์ฑ ํฅ์์ ๋ฌ์ฑํ๋ค.
Figure 1: Mining embedding space using PLM-clust: providing access to novel enzymes with minimal
์์ผ๋ผ๋์ ๋ฐ๊ฒฌ: ๊ธ๋ฆฌ์ฝ์ค ํ์ด๋๋กค๋ผ์ ์์ 100๋ฐฐ ์ด์์ ํ์ฑ ์ฆ๊ฐ ๋ฌ์ฑ, ์ด๋ฏผํ์ํจ์(IRED) ์ฐ๊ตฌ: ์ด๋งค ๋ค์์ฑ ํ๋กํ์ผ์์ 100๋ฐฐ ์ด์์ ์ฆ๊ฐ ๋ฌ์ฑ, ์์ธก ์ ํ๋: ์ฝ 10๊ฐ ํจ์ ์คํฌ๋ฆฐ์ผ๋ก ~90% ์ ๋ขฐ๋์ ์์ธก ์์ฑ ๊ฐ๋ฅ, ๊ณต๊ฐ ํ์: ๋๋ถ๋ถ์ ์๊ธฐ๊ฐ ๊ตํ๋ ๊น์ ์์ด ๊ณต๊ฐ ์์ญ๊น์ง ๋๋ฌ, ๋จ๊ณ๋ณ ํจ์จ์ฑ: ๊ฐ ๋ฐ๋ณต ์ฌ์ดํด์ด ํด๋ฌ์คํฐ ์๋งํผ์ ์คํ๋ง ํ์
Figure 1: Mining embedding space using PLM-clust: providing access to novel enzymes with minimal
์ดํ: PLM-clust๋ ๋จ๋ฐฑ์ง ์ธ์ด๋ชจ๋ธ์ ์๋ฒ ๋ฉ ๊ณต๊ฐ์ ํจ์ ๋ฐ๊ฒฌ์ ์ฒด๊ณ์ ์ผ๋ก ํ์ฉํ๋ ์ฐฝ์์ ์ด๊ณ ์ค์ฉ์ ์ธ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ค. ๋ฐ๋ณต์ ์คํ ํ๋ ์์ํฌ๋ก ์ ํ๋ ์คํ ์์ฐ ๋ด์์ 100๋ฐฐ ์ด์์ ํ์ฑ ํฅ์์ ๋ฌ์ฑํ์ผ๋ฉฐ, ๊ธฐ์กด directed evolution์ ํ๊ณ๋ฅผ ์ฐํํ๋ ๊ฐ๋ ์ ์ง์ ์ ๋ณด์ฌ์ค๋ค. ๋ค๋ง ์ด๊ธฐ ์กฐ๊ฑด ์์กด์ฑ, zero-shot ์ค์ฝ์ด๋ง ์ด๋ก ๋ถ์กฑ, ์ ํ๋ ๊ฒ์ฆ ๋ฒ์ ๋ฑ์ ๊ฐ์ ํ์ ์์๊ฐ ์์ผ๋, ์๋ฌผ์ด๋งค ์์ง๋์ด๋ง ๋ถ์ผ์์ ์๋นํ ์ค์ ๊ฐ์น๋ฅผ ์ง๋ ๊ธฐ์ฌ๋ก ํ๊ฐ๋๋ค.