Essence
Figure 1. MolHIT achieves SOTA result on MOSES dataset.
MolHIT๋ Hierarchical Discrete Diffusion Model๊ณผ Decoupled Atom Encoding์ ํตํด ๋ถ์ ๊ทธ๋ํ ์์ฑ์์ ๊ฑฐ์ ์๋ฒฝํ ํํ์ ์ ํจ์ฑ(99.1%)์ ๋ฌ์ฑํ SOTA ๋ชจ๋ธ๋ก, 1D ์ํ์ค ๋ชจ๋ธ์ ์ ํจ์ฑ๊ณผ 2D ๊ทธ๋ํ ๋ชจ๋ธ์ ๊ตฌ์กฐ ํ์ ์ฑ์ ๋์์ ์คํํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: MolHIT๋ ๊ณ์ธต์ ํ์ฐ ๋ชจ๋ธ๊ณผ ์์ ์ธ์ฝ๋ฉ์ ์ฌ์ค๊ณ๋ฅผ ํตํด ๋ถ์ ๊ทธ๋ํ ์์ฑ์ ์ค๋๋ ๋ฌธ์ ๋ฅผ ์ฐ์ํ๊ฒ ํด๊ฒฐํ๋ฉฐ, ๊ฐ๋ ฅํ ์คํ์ ์ฆ๊ฑฐ์ ์ด๋ก ์ ์ ๋น์ฑ์ผ๋ก ๋ท๋ฐ์นจ๋๋ ๊ฒฌ๊ณ ํ ๊ธฐ์ฌ๋ฅผ ์ ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
MolGAN์ ๋ถ์๊ทธ๋ํ ์์ฑ์ ๊ณ ์ ์ ์ธ generative ๋ชจ๋ธ๋ก, MolHIT์ ๊ณ์ธต์ diffusive modeling๊ณผ ๋น๊ต ๊ฐ๋ฅํ ์ด๋ก ์ ๊ธฐ๋ฐ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
MolHIT ๋
ผ๋ฌธ์ ๋ถ์ ๊ทธ๋ํ ์์ฑ๊ณผ ๊ณ์ธต์ ๊ตฌ์กฐ ๋ชจ๋ธ๋ง์ ๋
ผ์ํ์ฌ, DISCO์์ ํ์ฉ๋ ์ ์๋ ์์ฑํ ๊ตฌ์กฐ-์์ด ์ค๊ณ ๋ฐฉ๋ฒ์ ํ ๋๋ฅผ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ReviewEval ๋
ผ๋ฌธ์ AI ์์ฑ ๋ถ์๊ฐ ์์ฝํํ ํ๊ฐ์์ ์ด๋ค ํ์ ์ฑ๊ณผ ์ ํจ์ฑ์ ๊ฐ๋์ง ๋ฆฌ๋ทฐ ๊ธฐ๋ฐ์ผ๋ก ์ ๋ ํ๊ฐํ์ฌ, ์์ฑ๋ ๋ถ์์ ํ๊ฐ ๊ด์ ์ ๋ณด์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
Foundation models in bioinformatics ๋
ผ๋ฌธ์ ๋ถ์ ํํยท์์ฑ์ foundation model ์ ๊ทผ์ ๋ค๋ฃจ์ด MolHIT์ ๋์กฐ์ ์ผ๋ก ์ฝ์ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
3D ๋ถ์ ์์ฑ ๋ฐ ํํ ํ์ต์ ์ํ ๋ค๋ฅธ ๋ฑ๋ณ ์ ๊ฒฝ๋ง ์ ๊ทผ๋ฒ์ ์ทจํ๋ ์ฐ๊ตฌ์ด๋ค
๋ค๋ฅธ ์ ๊ทผ
๋ถ์ ๊ทธ๋ํ์ ๊ณ์ธต๊ตฌ์กฐ ์์ฑ์ ์๋ก์ด ์๊ณ ๋ฆฌ์ฆ์ผ๋ก ์ ๊ทผํ๋ MolHIT ๋
ผ๋ฌธ๊ณผ, ์ด์ฐ/์ฐ์ ์์ฑ ์กฐํฉ๊ธฐ๋ฒ์ ์ํธ ๋น๊ต๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ฒฐ์ ์ฌ๋ฃ์ ๋ฌผ์ฑ ์์ธก ๋ฐ ์ญ์ค๊ณ๋ฅผ ์ํ ๋์์ ์์ฑ ๋ชจ๋ธ์ด๋ค.
ํ์ ์ฐ๊ตฌ
ํํ ๋ฐ์ ์์ธก๊ณผ ํฉ์ฑ ๊ฒฝ๋ก ํ์์์ diffusion ๋ฐ sequence-to-structure ๋คํธ์ํฌ ์กฐํฉ์ ๋์ฑ ๋ฐ์ ์ํต๋๋ค.
ํ์ ์ฐ๊ตฌ
MolHIT์ ๊ทธ๋ํ ๊ธฐ๋ฐ ์์ฑ์ ๋์ด์, attention ๊ธฐ๋ฐ ์ ํธ ํด์ ๋ฐ motif ์์ฑ์ ํตํฉํ generative protein sequence ์ค๊ณ ๋ฐฉํฅ์ผ๋ก ํ์ฅํ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
Reward-Guided Discrete Diffusion ๋
ผ๋ฌธ์ diffusion ๋ชจ๋ธ์์ ๋ฆฌ์๋๋ฅผ ํ์ฉํด ์์ฑ์ ์ ๋ํ๋ ๊ธฐ๋ฒ์ ์ ์ํด MolHIT์ ํ์ฅ์ ์์ ์๋ค.
ํ์ ์ฐ๊ตฌ
๊ณ์ธตํ ๋ถ์๋์ญํ ์์ฑ ๋ฐ ํ ํฐํ ๋ชจ๋ธ๋ก ๊ธฐ์กด graph diffusion ๋ชจ๋ธ์ ๋ค์ํ ํ์ฅ ๋ฐ ์์ฉ ๊ฐ๋ฅ ์ฌ๋ก๋ฅผ ๋ณด์ฌ์ค๋ค.