์ ์: | ๋ ์ง: 2026-04-14 | URL: https://www.biorxiv.org/content/10.64898/2026.04.14.718363v1 📄 PDF
Figure 1: A schematic overview of the architecture and conditioning strategy of the IDP-Prop2seq model.
์ด ๋ ผ๋ฌธ์ ๋จ๋ฐฑ์ง ์ธ์ด๋ชจ๋ธ์ ๊ธฐ๋ฐํ Transformer encoder-decoder ์ํคํ ์ฒ(IDR-Prop2Seq)๋ฅผ ์ ์ํ์ฌ target ํํ ์์๋ธ ๊ธฐ์ ์์ ์กฐ๊ฑด๋ถ๋ก ๋ณธ์ง์ ๋น๊ตฌ์กฐ ์์ญ(IDR) ์์ด์ ์์ฑํ๋ค. ํต์ฌ ๋ฐ๊ฒฌ์ ํํ ๋ฐ ๋ฌผ๋ฆฌํํ์ ํน์ฑ์ ์ ๋ฐํ ์ ์ด๊ฐ ๋๊ท๋ชจ ๋ฐ์ดํฐ ์ค์ผ์ผ(์ฝ ์ฒ๋ง ๊ฐ bacterial IDR ์์ด)์์๋ง ๋ฌ์ฑ๋๋ฉฐ, ๋ฐ์ดํฐ ๊ฐ์ฉ์ฑ์ด IDR ์ค๊ณ ๋ชจ๋ธ์ ์ฃผ์ ํ๊ณ์์ ๋ณด์ฌ์ค๋ค.
Figure 2: Distribution of absolute error statistics for Rg and Ree. Violin plots showing the distributions
Figure 1: A schematic overview of the architecture and conditioning strategy of the IDP-Prop2seq model.
์ดํ: ์ด ๋ ผ๋ฌธ์ IDR ์ค๊ณ๋ผ๋ ๋ฏธ๊ฐ๋ฐ ๋ฌธ์ ์ encoder-decoder ์กฐ๊ฑด๋ถ ์์ฑ ๋ชจ๋ธ์ ์ ์ฉํ๊ณ , ๋ฐ์ดํฐ ๊ท๋ชจ๊ฐ ์์ฑ ๋ชจ๋ธ ์ฑ๋ฅ์ ๋ฏธ์น๋ ์ํฅ์ ์ฒด๊ณ์ ์ผ๋ก ์ ์ฆํ ์ฐ์ํ ์ฐ๊ตฌ๋ค. Transformer ์ํคํ ์ฒ์ ๋๊ท๋ชจ computational dataset ํ์ฉ์ด ๊ธฐ์ ์ ์ผ๋ก ๊ฒฌ๊ณ ํ๊ณ , data-centric paradigm ์ ์๊ฐ ์๋ฏธ ์๋ค. ๋ค๋ง ์์ฑ๋ ์ํ์ค์ ์คํ์ ๊ฒ์ฆ๊ณผ ๊ธฐ๋ฅ์ฑ ํ์ธ์ด ๋ถ์กฑํ๋ฉฐ, ํ์ฌ ๋ฐ์ดํฐ ๊ท๋ชจ์ ์ถฉ๋ถ์ฑ ๋ฐ ์ถ๊ฐ ์คํ ํ์์ฑ ๋ฑ์ด ํ๊ณ๋ก ๋จ๋๋ค. ํฅํ ์คํ์ validation๊ณผ ๋ ํฐ ๊ท๋ชจ ๋ฐ์ดํฐ์ ํ๋ณด๊ฐ ํ์์ ์ด๋ค.