์ ์: | ๋ ์ง: 2026-04-29 | URL: https://www.biorxiv.org/content/10.64898/2026.04.29.721096v1 📄 PDF
Figure 3. Model accuracy in terms of predicted DSSP secondary structure. A. DSSP sequence percent identity of
๋ณธ ๋ ผ๋ฌธ์ RCSB PDB์ ์์ญ๋ง ๋จ๋ฐฑ์ง๋ก ํ์ตํ bLSTMa(bidirectional LSTM with multi-head self-attention) ๊ธฐ๋ฐ์ ์์ฑํ AI ๋จ๋ฐฑ์ง ์ค๊ณ ๋ชจ๋ธ์ ๊ฐ๋ฐํ์ฌ, ์ถ์๋ ์๋ฏธ๋ ธ์ฐ ์ํ๋ฒณ ์กฐ๊ฑด์์ ํน์ 2์ฐจ ๊ตฌ์กฐ ๋ชจํฐํ๋ฅผ ๊ฐ๋ ์ ๊ท ํฉํ์ด๋๋ฅผ ์ค๊ณํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค. Coverage theory๋ฅผ ๋ฐํ์ผ๋ก ๋ค์ํ ํฌ๊ธฐ์ ์๋ฏธ๋ ธ์ฐ ์ํ๋ฒณ(6~19๊ฐ)์์ ์ํ๋ 2์ฐจ ๊ตฌ์กฐ ๊ตฌ์กฐ๋ฅผ ๊ฐ๋ 29,387๊ฐ์ ๋จ๋ฐฑ์ง ์์ด์ ์ค๊ณํ๊ณ ๊ทธ ์ฑ๋ฅ์ ํ๊ฐํ์๋ค.
Figure 3. Model accuracy in terms of predicted DSSP secondary structure. A. DSSP sequence percent identity of
์ํ๋ฒณ ํฌ๊ธฐ๋ณ ์ฑ๋ฅ: ํฌ๊ธฐ 19, 10, 6 ์๋ฏธ๋ ธ์ฐ ์ํ๋ฒณ์์ ๊ฐ๊ฐ 66%, 54%, 42%์ ํ๊ท DSSP ์ ์ฒด์ฑ(percent identity) ๋ฌ์ฑ. ๊ตฌ์กฐ ๋ณต์ก์ฑ๋ณ ์ฑ๋ฅ: ์ ๋ณต์ก์ฑ ๊ตฌ์กฐ(์ฃผ๋ก helix)์์ 68% ํ๊ท PID, ๊ณ ๋ณต์ก์ฑ ๊ตฌ์กฐ(helix-coil-sheet-coil-sheet-coil-helix)์์๋ 6๊ฐ ์๋ฏธ๋ ธ์ฐ ์ํ๋ฒณ์ผ๋ก ๋์ PID ์ค๊ณ ๊ฐ๋ฅ. 3์ฐจ์ ๊ตฌ์กฐ ๋ณด์กด: 2์ฐจ ๊ตฌ์กฐ ์ ๋ณด๋ง์ผ๋ก ํ์ตํ์์๋ ๋ง์ ์ค๊ณ๊ฐ ํ์ ๋จ๋ฐฑ์ง์ 3์ฐจ์ tertiary ๊ตฌ์กฐ๋ฅผ ์ฑ๊ณต์ ์ผ๋ก ๋ณด์ .
Figure 1. Major components of the bLSTMa encoder-decoder model architecture. Detailed architectures of the
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ coverage theory ๊ธฐ๋ฐ์ ์ค๊ณ ์๋ฆฌ๋ฅผ ์์ฑํ AI์ ๊ฒฐํฉํ์ฌ ์ถ์ ์๋ฏธ๋ ธ์ฐ ์ํ๋ฒณ์์ ์ํ๋ 2์ฐจ ๊ตฌ์กฐ๋ฅผ ๊ฐ๋ ํฉํ์ด๋๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ์ค๊ณํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค. 313๊ฐ ์ํ๋ฒณ์์ 29,387๊ฐ ์์ด์ ์ค๊ณํ๊ณ ๋ค์ธต์ ์ฑ๋ฅ ํ๊ฐ๋ฅผ ์ํํ ์ ์์ ํฌ๊ด์ฑ์ด ๋์ผ๋ฉฐ, ํนํ 2์ฐจ ๊ตฌ์กฐ ํ์ต๋ง์ผ๋ก 3์ฐจ์ ๊ตฌ์กฐ๋ฅผ ๋ณด์กดํ๋ ํ์์ ๋จ๋ฐฑ์ง ํด๋ฉ์ ๊ธฐ๋ณธ ์๋ฆฌ์ ์๋ก์ด ํต์ฐฐ์ ์ ๊ณตํ๋ค. ๋ค๋ง ๊ทน๋๋ก ์ถ์๋ ์ํ๋ฒณ ์กฐ๊ฑด์์์ ์ฑ๋ฅ ์ ์ฝ๊ณผ ์ค์ ํฉ์ฑ ๊ฒ์ฆ์ ๋ถ์ฌ๋ ์ค์ฉํ ๋จ๊ณ์์ ๋ณด์ ํ์ํ๋ค.