Essence
Figure 1: AlphaGenome ๋ชจ๋ธ ์ํคํ
์ฒ, ํ์ต ๋ฐฉ์ ๋ฐ ์ข
ํฉ ํ๊ฐ ์ฑ๋ฅ. (a) ๋ชจ๋ธ ๊ฐ์: 1 Mb DNA ์์ด์ ์
๋ ฅ๋ฐ์ 11๊ฐ ๋ชจ๋ฌ๋ฆฌํฐ์์ 5,930๊ฐ์ ๊ฒ๋ ํธ๋์ ๋จ์ผ ์ผ๊ธฐ์ ํด์๋๋ก ์์ธก. (e) ๋ณ์ด ํจ๊ณผ ์์ธก์์ ๊ธฐ์กด ๋ชจ๋ธ ๋๋น ์๋์ ์ฑ๋ฅ ๊ฐ์
AlphaGenome์ 1 ๋ฉ๊ฐ๋ฒ ์ด์ค(Mb) DNA ์์ด ์
๋ ฅ๊ณผ ๋จ์ผ ์ผ๊ธฐ์(bp) ํด์๋๋ฅผ ํตํฉํ์ฌ, 11๊ฐ์ ์๋ฌผํ์ ๋ชจ๋ฌ๋ฆฌํฐ(์ ์ ์ ๋ฐํ, ์คํ๋ผ์ด์ฑ, ํฌ๋ก๋งํด ์ ๊ทผ์ฑ, ์กฐ์ง์ธ์ ๊ฒฐํฉ, 3D ํฌ๋ก๋งํด ๊ตฌ์กฐ ๋ฑ)์ ๊ฑธ์ณ 5,930๊ฐ์ ๊ฒ๋ ํธ๋์ ๋์์ ์์ธกํ๋ ํตํฉ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ด๋ค.
Evaluation
์ดํ: AlphaGenome์ ๊ธฐ์กด์ ๊ตฌ์กฐ์ ํธ๋ ์ด๋์คํ๋ฅผ ๊ทน๋ณตํ๊ณ 11๊ฐ ๋ชจ๋ฌ๋ฆฌํฐ๋ฅผ ํตํฉํ๋ ๊ฐ๋ ฅํ unified model๋ก์, ๋น์ฝ๋ฉ ๋ณ์ด์ ๋ถ์์ ํจ๊ณผ ํด์์ ์ํ ์ค์ํ ์ง์ ์ ์ ์ํ๋ค. ๊ด๋ฒ์ํ ๋ฒค์น๋งํน๊ณผ ๊ณต๊ฐ ๋๊ตฌ ์ ๊ณต์ผ๋ก ์ค์ฉ์ ์ํฉํธ๊ฐ ๋์ผ๋, ์ปจํ
์คํธ ๊ธธ์ด ํ๊ณ์ ์ผ๋ถ modality์ ํด์๋ ์ ์ฝ์ด ํฅํ ๊ฐ์ ๊ณผ์ ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Integrated analysis of multimodal single-cell data ๋
ผ๋ฌธ์ ๋จ์ผ์ธํฌ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ๋ฉํฐ๋ชจ๋ฌ, ์ ์ ์ ๋ฐํ ์์ธก์ ๋ถ์ ๋ฐ ํตํฉ ๋ฐฉ๋ฒ๋ก ๊ธฐ๋ฐ์ ์ ์ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
100kb ์ฅ๊ฑฐ๋ฆฌ ๊ท์ ์ ๋ณด๋ฅผ Transformer์์ ํจ๊ณผ์ ์ผ๋ก ํ์ฉํ๋ ๋ฐฉ๋ฒ๋ก ์ด AlphaGenome์ ๋๊ท๋ชจ DNA-์ ์ ์ฒด ๋ชจ๋ ์์ธก์ ์ง์ ์ ์ธ ์๊ฐ์ ์ค๋ค.
๋ค๋ฅธ ์ ๊ทผ
DNA ์์ด๋ก๋ถํฐ ์ ์ ์ ๋ฐํ์ ์์ธกํ๋ ์ ์ฌํ Transformer ๊ธฐ๋ฐ ๋ฅ๋ฌ๋ ์ ๊ทผ๋ฒ์ ์ทจํ๋ ์ฐ๊ตฌ์ด๋ค
๋ค๋ฅธ ์ ๊ทผ
DNA ์์ด๋ก๋ถํฐ ๋ค์ค ์๋ฌผํ์ ๋ชจ๋ฌ๋ฆฌํฐ๋ฅผ ์์ธกํ๋ ์ ์ฌํ ํตํฉ ๊ฒ๋ ๋ชจ๋ธ์ ์ ์ํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
AlphaGenome ๋
ผ๋ฌธ์ ์ค๋ฏน์ค ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ผ๋ก ๊ท์ ์์ ์์ธก ๋ฌธ์ ๋ฅผ ๊ธฐ์กด์ ML ๋ฐฉ๋ฒ์ผ๋ก ๋ค๋ฃจ๋ฉฐ, Seq2Exp์ ์ธ๊ณผ์ ์ ๋ณด ๋ณ๋ชฉ ์ ๊ทผ๊ณผ ๋์กฐ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ ์ ์ฒด ๋ถ์ ๋ฐ ์ค๊ณ๋ฅผ ์ํ AI ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
Foundation models in bioinformatics ๋
ผ๋ฌธ์ ๋ค์ํ ์๋ช
์ ๋ณด ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ์ญํ ๊ณผ ๋จ์ผ๋ชจ๋ฌ/๋ค์ค๋ชจ๋ฌ ์์ธก ํ๋ ์์ํฌ๋ฅผ ๋น๊ตํด, AlphaGenome์ ๋ค์ค ๋ชจ๋ฌ๋ฆฌํฐ ์์ธก๊ณผ ๋น๊ต ํ๊ฐ๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
OptiPrime ๋ชจ๋ธ๊ณผ ํจ๊ป AlphaGenome์ ๋จ์ผ ์ผ๊ธฐ์ ํด์๋ ๋ฐ ๋ค์ค ๋ชจ๋ฌ๋ฆฌํฐ ์์ธก ๋ฅ๋ ฅ์ ๋น๊ตํ๋ฉด์, ์ ์ ์ฒด ๊ธฐ๋ฐ ๋ฐํ ์์ธก๋ชจ๋ธ์ ๋ค์ํ ์ฑ๊ณต ์ฌ๋ก๋ฅผ ์ดํด๋ณผ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
RNA ์์ด ์ค๊ณ๋ฅผ ์ํ ์ฐ์ ์ต์ ํ ๋๋ ์ํ๋ง ๊ธฐ๋ฐ ๋์์ ๋ฐฉ๋ฒ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
AlphaGenome ๋
ผ๋ฌธ์ ๋ฉํฐ๋ชจ๋ฌ ์ ์ ์ฒด ์
๋ ฅ ๋ฐ ๋ค์ํ ์๋ฌผํ์ ์ ํธ ๋์ ์์ธก์ ๊ฐ๋ฅํ๊ฒ ํ์ฌ, ๋จ์ผ์ธํฌ ๊ธฐ๋ฐ multi-omics ๋ถ์์ ์ต์ ๋ฅ๋ฌ๋ ๋ฐ์ ๋ฐฉํฅ์ ์ ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
AlphaGenome์ด ์์ธกํ๋ ์๋ฌผํ์ ๋ชจ๋ฌ๋ฆฌํฐ ์ค ํ๋(์: ํฌ๋ก๋งํด ๊ตฌ์กฐ, ์คํ๋ผ์ด์ฑ)์ ํนํ๋ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
AlphaGenome์ regulatory variant ์์ธก์ attention ๊ธฐ๋ฐ ๋ํ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ MEIsensor์ ์์๊ธฐ๋ฐ AI ์ ๊ทผ์ ๋ ๋์ ์ค์ผ์ผ๋ก ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
AlphaGenome์ ๋๊ท๋ชจ ์ ์ ์ฒด ๊ธฐ๋ฐ ์์ธก foundation model๋ก, Neurotox์ ๊ฐ์ด ๊ธฐ๋ฅ์ฑ ๋จ๋ฐฑ์ง ๋ถ๋ฅ ๋ฑ ์ค์ ๋ฐ์ด์ค์ ์ฉ์ ๊ณง์ฅ ์ฐ๊ฒฐ๋ ์ ์๋ค.
์์ฉ ์ฌ๋ก
AlphaGenome ๋
ผ๋ฌธ์ ์ธ์ด ๊ธฐ๋ฐ ์๋ฌผํ์ ์์ธก๋ชจ๋ธ์ FM ์ ์ฉ์ ์ค์ ์ ์ ์ฒด ๋ณ์ด ์์ธก์์ ํ์ฉ, Frag2Seq์ ์ค์ ํ์ฉ์ฑ์ ๋ณด์ฌ์ค๋๋ค.
์์ฉ ์ฌ๋ก
๋๊ท๋ชจ ๊ฒ๋ ๋ฐ์ดํฐ์ ๋ฅ๋ฌ๋ ์์ธก์ ๊ฒฐํฉํ๋ AlphaGenome๊ณผ LLM ๋ฑ ์๋ช
๊ณผํ ํนํ ์ธ์ด๋ชจ๋ธ ์ ์ฉ ์ฌ๋ก๋ฅผ ๋น๊ตํ ์ ์๋ค.