Essence
Figure 2: Overview of Frag2Seq pipeline. Atoms in the small molecule are reordered according to
๋ณธ ๋
ผ๋ฌธ์ ๊ตฌ์กฐ๊ธฐ๋ฐ ์ ์ฝ์ค๊ณ(SBDD)๋ฅผ ์ํด ์ธ์ด๋ชจ๋ธ์ ์ ์ฉํ๋ ์๋ก์ด ๋ฐฉ๋ฒ Frag2Seq๋ฅผ ์ ์ํ๋ค. 3D ๋ถ์๋ฅผ ๋จํธ๊ธฐ๋ฐ ์ํ์ค๋ก ๋ณํํ๊ธฐ ์ํด SE(3)-๋๋ณ ์ง์ญ ํ๋ ์์ ๊ตฌ์ฑํ์ฌ SE(3)-๋ถ๋ณ ์ํ์ค๋ฅผ ์ถ์ถํ๊ณ , inverse folding ๋ชจ๋ธ์ ๋จ๋ฐฑ์ง ํฌ์ผ ์๋ฒ ๋ฉ์ cross-attention์ผ๋ก ํตํฉํ์ฌ ๋ชฉํ-์ธ์ ๋ถ์ ์์ฑ์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ SBDD ๋ถ์ผ์ ์ธ์ด๋ชจ๋ธ์ ์ ์ฉํ ์ฐธ์ ํ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ฉฐ, SE(3)-๋๋ณ ํ๋ ์์ ํตํ 3D ๊ธฐํ ๋ณด์กด ๋ฐ ๋จํธ๊ธฐ๋ฐ ์์ฑ์ ์กฐํฉ์ผ๋ก ๊ธฐ์กด ๋ฐฉ๋ฒ ๋๋น ์ฐ์ํ ์ฑ๋ฅ๊ณผ ํจ์จ์ฑ์ ๋ฌ์ฑํ๋ค. ๋ค๋ง ๋ถ์ ๋ถํด ์ ๋ต์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ ๊ฒ์ฆ๊ณผ ๋ ๋ณต์กํ ๋ถ์ ๊ตฌ์กฐ์ ๋ํ ์ฑ๋ฅ ํ๊ฐ๊ฐ ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
304๋ฒ ๋
ผ๋ฌธ์ ๋๋ณ ๊ทธ๋ํ ๋คํธ์ํฌ ์ค๊ณ๋ 349๋ฒ์ SE(3)-๋๋ณ ์ขํ ํ๋๊ทธ๋จผํธ ํ ํฐํ ๋ฐฉ๋ฒ๋ก ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ด ๋ ์ ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Geometry Informed Tokenization ๋
ผ๋ฌธ์ 3D ๋ถ์ ๊ตฌ์กฐ ์ ๋ณด๋ฅผ ์ฐ๊ณํ ํ ํฐํ ๋ฐฉ์์ ์ ์ํ์ฌ Frag2Seq ์ ๊ทผ๊ณผ ์ง๊ฒฐ๋ ์ ํ์ฐ๊ตฌ์
๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ธฐํ ๊ตฌ์กฐ ์ธ์ ๋ฐ ํ ํฐํ์ ๊ฐ์ด ์์ฌ, ํ๊ฒฝ ๋ฐ์ดํฐ ํตํฉ AI ๋ถ์ ๊ธฐ๋ฒ์ด ์ธ๋ฅ ํ๊ฒฝ ๋ฌธ์ ํด๊ฒฐ์ ์ด๋ป๊ฒ ํ์ฉ๋ ์ ์๋์ง ์์ฌํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
349 ๋
ผ๋ฌธ์ ์ ์ ์ฒดยท๋จ๋ฐฑ์ง ๋ฐ์ดํฐ์ ๊ตฌ์กฐ ํ ํฐํ ๋ฐ ํํ ๋ฐฉ๋ฒ๋ก ์ ์๊ฐํ์ฌ, 3032์์ ํ๋กํ
์ด ์ ์ฒด ๋งฅ๋ฝ์ representation ํ์ต์ ์๋จ์ด ๋ ์ ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ถ์ ์์ฑ ๋ฅ๋ฌ๋ ๋ฐฉ์์ ์ ๋ฐ์ ๋ฒค์น๋งํน ๋ฐ ์ค์ ์ฑ๋ฅ ํ๊ณ ๋ถ์์ด ๊ตฌ์กฐ ๊ธฐ๋ฐ ํ ํฐํ ์ฐ๊ตฌ์ ์คํจ์ฑ ํ๊ฐ์ ์ค์ํ ๋ฐํ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ถ์ geometry์ fragment ๊ธฐ๋ฐ ํ ํฌ๋์ด์ง ์ฐ๊ตฌ๊ฐ, Bolek์ fingerprint ๊ธฐ๋ฐ ๋ฉํฐ๋ชจ๋ฌ ์
์ถ๋ ฅ ์๋ฒ ๋ฉ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์กฐ๊ฑด๋ถ ๋ถ์ ์์ฑ์ ์ํ ๋ค๋ฅธ ์์ฑ ๋ชจ๋ธ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
439์ ๊ฒฐ์ ๊ตฌ์กฐ SE(3) ๋ถ๋ณ ํ ํฌ๋์ด์ฆ์ 349์ ๋ถ์ Frag/Geometry ํน์ง ํ ํฐํ ๋ฐฉ๋ฒ์ LLM-์ฌ๋ฃ ์ฐ๊ตฌ๋ฅผ ์ํ ๊ตฌ์กฐ ํํ ์ค๊ณ๋ผ๋ ์ ์ฌ ๋ฌธ์ ์ ์๋ฐ๋ ์ ๊ทผ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
E(3)-๋ฑ๋ณ ์ ๊ฒฝ๋ง์ ์ฌ์ฉํ์ฌ 3D ๋ถ์ ๊ตฌ์กฐ๋ฅผ ํตํฉ์ ์ผ๋ก ํํํ๋ ์ ์ฌํ ๊ธฐ์ด ๋ชจ๋ธ ์ฐ๊ตฌ์ด๋ค
๋ค๋ฅธ ์ ๊ทผ
์ง๋๋ถ์๊ธฐ ์์ฉ์ ๋ํ ์ ํ์ ์์ธก๊ณผ ๋ฌ๋ฆฌ, ๊ตฌ์กฐ ๊ธฐ๋ฐ ํ ํฌ๋์ด์ฆ๋ฅผ ํตํ ์์ธก ๋ฐ ์ค๊ณ์ ์ด์ ์ ๋ง์ถ ์ ๊ทผ์
๋๋ค.
ํ์ ์ฐ๊ตฌ
๋จธ์ ๋ฌ๋ ์ ๋ ํฉํ์ด๋ ๋์์ธ์ ๊ตฌ์กฐ์ ํธํฅ ๋ฌธ์ ๋ฅผ ๋ค๋ฃธ์ผ๋ก์จ, ๊ตฌ์กฐ ๊ธฐ๋ฐ ํ ํฐํ๊ฐ ์ค์ ๋จ๋ฐฑ์ง/์ฝ๋ฌผ ๋์์ธ ์ฑ๋ฅ์ ๋ฏธ์น๋ ์ํฅ์ ํ์ฅํ๋ค.
์์ฉ ์ฌ๋ก
AlphaGenome ๋
ผ๋ฌธ์ ์ธ์ด ๊ธฐ๋ฐ ์๋ฌผํ์ ์์ธก๋ชจ๋ธ์ FM ์ ์ฉ์ ์ค์ ์ ์ ์ฒด ๋ณ์ด ์์ธก์์ ํ์ฉ, Frag2Seq์ ์ค์ ํ์ฉ์ฑ์ ๋ณด์ฌ์ค๋๋ค.