์ ์: | ๋ ์ง: 2026-04-19 | URL: https://www.biorxiv.org/content/10.64898/2026.04.18.719394v1 📄 PDF
Figure 2: Composition of BELKA dataset and baseline ML performance BELKA dataset. A) Distribution of In Distribution (sh
DNA ์ธ์ฝ๋ฉ ๋ผ์ด๋ธ๋ฌ๋ฆฌ(DEL) ๋ฐ์ดํฐ๋ก ํ์ต๋ ๊ธฐ๊ณํ์ต ๋ชจ๋ธ์ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ์ฒด๊ณ์ ์ผ๋ก ํ๊ฐํ๋ ๋ ผ๋ฌธ. NeurIPS 2024 BELKA ๊ฒฝ์ง๋ํ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ML, docking, co-folding ๋ฐฉ๋ฒ์ ๋น๊ตํ๊ณ , out-of-distribution ํํฉ๋ฌผ ์์ธก์ ์ด๋ ค์์ ์ ์ฆํ๋ฉฐ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๊ณผ์ ๋ณด์ ๊ด๊ณ๋ฅผ ๋ถ์.
Figure 4. Performance of structure-based methods on the OOD BELKA set and analysis of and training on physics-derived fe
Figure 3: Performance of baseline ML model with modified train and test sets. A) Mean average precision of baseline mode
์ดํ: ์ด ๋ ผ๋ฌธ์ ๋๊ท๋ชจ ๊ณต๊ฐ ๋ฐ์ดํฐ(BELKA)๋ฅผ ํ์ฉํ์ฌ DEL ๊ธฐ๋ฐ ML ๋ชจ๋ธ์ OOD ์ผ๋ฐํ ๋ฌธ์ ๋ฅผ ์ฒ์์ผ๋ก ์ฒด๊ณ์ ์ผ๋ก ๊ท๋ช ํ ์ค์ํ ์ฐ๊ตฌ์ด๋ค. ๋จ์ํ ๋ฒค์น๋งํน์ ๋์ด ์ฌ๋ฌ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๊ณผ์ ๋น๊ต๋ฅผ ํตํด ํ์ค์ ์ธ ํต์ฐฐ๋ ฅ์ ์ ์ํ๋ฉฐ, ์ค์ฉ์ ์ธ ์คํ์์ค ๋๊ตฌ(DEL-iver)๋ฅผ ์ ๊ณตํ๋ค. ๋ค๋ง OOD ์คํจ ๋ฉ์ปค๋์ฆ์ ๋ํ ์ด๋ก ์ ๋ถ์ ์ฌํ์ ์ธ๋ถ ๋ฐ์ดํฐ์ ๊ฒ์ฆ์ด ์์ผ๋ฉด ๋์ฑ ๊ฐ๋ ฅํ ๋ ผ๋ฌธ์ด ๋ ๊ฒ์ด๋ค.