์ ์: | ๋ ์ง: 2026-03-02 | URL: https://www.biorxiv.org/content/10.64898/2026.03.02.707794v1 📄 PDF
Figure 1. Benchmarking framework for evaluating generative models on synthetic bulk RNA-seq data
๋ฒํฌ RNA-seq ๋ฐ์ดํฐ์ ํฉ์ฑ ์์ฑ์ ์ํ 11๊ฐ ์์ฑ ๋ชจ๋ธ์ ๋ ์ ์ฝํธํธ์ 978๊ฐ ๋๋๋งํฌ ์ ์ ์์ ๊ฑธ์ณ ์ฒด๊ณ์ ์ผ๋ก ๋ฒค์น๋งํนํ์ฌ, ๋ถํฌ ์ถฉ์ค๋(distributional fidelity), ๋ค์ด์คํธ๋ฆผ ์ ์ฉ์ฑ(downstream utility), ์๋ฌผํ์ ํ๋น์ฑ(biological plausibility), ํ๋ผ์ด๋ฒ์ ์ํ๋ ์ธก๋ฉด์์ ์ข ํฉ์ ์ผ๋ก ํ๊ฐํ ์ฐ๊ตฌ์ด๋ค. membership inference attack์ ๋ํ ์ทจ์ฝ์ฑ๊ณผ ๋ค๋ฅธ ํ๊ฐ ์ฐจ์ ๊ฐ์ trade-off๋ฅผ ๊ฐ์กฐํ์ฌ ๋ชจ๋ธ ์ ํ์ ์ง์นจ์ ์ ์ํ๋ค.
Figure 2. Fidelity metrics for BRCA and COMBINED datasets. Four metrics are shown in separate facets:
Figure 3. Utility metrics for BRCA and COMBINED datasets. Four metrics are shown, each in a separate
์ดํ: ํฉ์ฑ ์๋ฌผ์ํ ๋ฐ์ดํฐ์ ์์ฑ์์ utility-privacy-fidelity์ multi-dimensional trade-off๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ๋ฒค์น๋งํนํ ์ค์ํ ์ปค๋ฎค๋ํฐ ์ฐ๊ตฌ๋ก, ๊ด๋ฒ์ํ ์์ฑ ๋ชจ๋ธ์ transcriptomic ๋ฐ์ดํฐ๋ผ๋ ๊ตฌ์ฒด์ ์ด๊ณ ์ค์ํ ๋งฅ๋ฝ์์ ํ๊ฐํ์ฌ ๋ชจ๋ธ ์ ํ์ ์ค๋ฌด์ ์ง์นจ์ ์ ๊ณตํ๋ค. ๋ค๋ง ํ๊ฐ ๋ฒ์์ ์ ํ(์ ์ฝํธํธ, landmark genes, MIA)๊ณผ ๊ฒฐ๊ณผ์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ ๋ ผ์๊ฐ ๋ณด๊ฐ๋๋ฉด ๋์ฑ ๊ฐ๋ ฅํ ๊ฒ์ด๋ค.