Essence
Figure 1: Schematic overview of multimodal integration using Weighted Nearest Neighbor analysis
๋ณธ ๋
ผ๋ฌธ์ multimodal single-cell data ๋ถ์์ ์ํด weighted-nearest neighbor (WNN) ๋ถ์์ด๋ผ๋ ๋น๊ฐ๋
ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. ์ด ๋ฐฉ๋ฒ์ ๊ฐ ์ธํฌ์์ ๊ฐ ๋ฐ์ดํฐ ํ์
(์: RNA์ protein)์ ์๋์ ์ ๋ณด ๊ฐ์น๋ฅผ ํ์ตํ์ฌ ์ธํฌ ์ํ๋ฅผ ์ ์ํ๊ณ , ๊ธฐ์กด์ ๋จ์ผ ๋ชจ๋ฌ๋ฆฌํฐ ๋ถ์์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ ์ ์๋ค.
Achievement
Figure 1: Schematic overview of multimodal integration using Weighted Nearest Neighbor analysis
WNN ๋ฐฉ๋ฒ๋ก ๊ฐ๋ฐ: RNA์ protein modality์ ์ ๋ณด ๊ฐ์น๋ฅผ ์๋์ผ๋ก ํ์ตํ๊ณ ์ธํฌ๋ณ ๊ฐ์ค์น๋ฅผ ๊ณ์ฐํ๋ ๋ฐฉ๋ฒ ์ ์. ๋๊ท๋ชจ atlas ๊ตฌ์ถ: 228๊ฐ ํญ์ฒด ํจ๋์ ํฌํจํ CITE-seq ๋ฐ์ดํฐ 211,000 human PBMC์ multimodal reference atlas ์์ฑ. ์ธํฌ ์ํ ํด์ ๊ฐ์ : WNN ๋ถ์์ผ๋ก ๋จ์ผ modality ๋ถ์ ๋๋น ์ธํฌ ์ํ ์ ์ ๋ฅ๋ ฅ ํฅ์ ๋ฐ ๋ฏธ๋ณด๊ณ ๋ฆผํ๊ตฌ ์๋ธํ์
๋ฐ๊ฒฌ ๋ฐ ๊ฒ์ฆ. ์ค์ ์์ฉ: ๋ฐฑ์ ์ ์ข
๋ฐ COVID-19 ๊ฐ์ผ์ ๋ํ ๋ฉด์ญ ์๋ต ํด์์ ์ฑ๊ณต์ ์ผ๋ก ์ ์ฉ.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 5/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ multimodal single-cell ๋ฐ์ดํฐ ๋ถ์์ ์ค์ํ ๊ณ์ฐ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ฉฐ, 211,000 ์ธํฌ ๊ท๋ชจ์ multimodal reference atlas ๊ตฌ์ถ์ผ๋ก ์ค์ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ์
์ฆํ๋ค. WNN ๋ฐฉ๋ฒ์ ๊ฐ๋
์ ๋ช
ํ์ฑ, ๋ฐฉ๋ฒ์ ์ผ๋ฐ์ฑ, ๊ทธ๋ฆฌ๊ณ Seurat ์คํ์์ค ํดํท ๊ตฌํ์ผ๋ก ์ธํ ๋์ ์ํฅ๋ ฅ์ ๊ณ ๋ คํ ๋ ์ฐ์ํ ๊ธฐ์ฌ๋๋ฅผ ๊ฐ์ง ๋
ผ๋ฌธ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
SCANPY๋ ๋๊ท๋ชจ ๋จ์ผ์ธํฌ ์ ์ ์ ๋ฐํ ๋ถ์์์ ๋ณธ ์ฐ๊ตฌ์ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฐ ๋ถ์์ ๊ธฐ๋ฐ ํด์
๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Integrated analysis of multimodal single-cell data ๋
ผ๋ฌธ์ ๋จ์ผ์ธํฌ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ๋ฉํฐ๋ชจ๋ฌ, ์ ์ ์ ๋ฐํ ์์ธก์ ๋ถ์ ๋ฐ ํตํฉ ๋ฐฉ๋ฒ๋ก ๊ธฐ๋ฐ์ ์ ์ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋จ์ผ์ธํฌ ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ ํตํฉ(WNN ๋ฐฉ๋ฒ)์ ์ ์ํ ๋
ผ๋ฌธ์ผ๋ก, Cell2Sentence ํ๋ ์์ํฌ์ ์๋ฌผ์ ๋ณดํตํฉ ์ ๊ทผ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋จ์ผ์ธํฌ, ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ ํตํฉ ๋ถ์ ๋ฐฉ๋ฒ์ ๋๋ช
์ฌ๋ก์จ, APOLLO์ multi-modal embedding ํ๋ ์์ํฌ ํ์ต ๋ฉ์ปค๋์ฆ์ ํ ๋๊ฐ ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋จ์ผ์ธํฌ ๋ค์ค๋ชจ๋ฌ ๋ฐ์ดํฐ ํตํฉ ๋ฐ ํํ ํ์ต์ ๋ถ๊ธฐ์ ์ผ๋ก, ์กฐ์ง๋ณ๋ฆฌโ๊ณต๊ฐ์ ์ฌ์ฒด ์ตํฉ์ ์ด๋ก ์ ์ฌ๋ก๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ฉํฐ๋ชจ๋ฌ ๋จ์ผ์ธํฌ ๋ฐ์ดํฐ ํตํฉ ๋ถ์ ๋ฐฉ๋ฒ์ ์ ํ ์ฐ๊ตฌ๋ก, CLM-X์ multiway transformer ๊ตฌ์กฐ์ ๊ธฐ์ด ๋ชจ๋ธ ์ค๊ณ์ ์ํฅ์ ์ค๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Integrated analysis of multimodal single-cell data ๋
ผ๋ฌธ์ ๋จ์ผ์ธํฌ ๋ฐ์ดํฐ ํตํฉ ๋ถ์์ ์๋ก์ด ์ ๊ทผ์ ์๊ฐํ์ฌ, edgePython์ ๋จ์ผ์ธํฌ ์ ์ ์ ๋ฐํ ๋ฐ์ดํฐ ๋ถ์ ํ์ฅ์ ๊ธฐ์ด๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋จ์ผ์ธํฌ ๋ค์ค๋ชจ๋ฌ ๋ฐ์ดํฐ ๋ถ์์ ํตํฉ์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ์ฌ Celcomen์ด ๊ณต๊ฐ์ ์ธ๊ณผ disentanglement๋ฅผ ๊ตฌํํ๋ ๋ฐ ์ฃผ์ํ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ฉํฐ์ค๋ฏน์ค ๋จ์ผ์ธํฌ ๋ฐ์ดํฐ ํตํฉ ๋ถ์์ ํต์ฌ ์ด๋ก ์ ํ๋ ์์ผ๋ก, DECODE์ ํ์ต ์ ๋ต ๋ฐ ๊ฒฐ๊ณผ ํด์์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋จ์ผ์ธํฌ ๋ค์ค๋ชจ๋ฌ ๋ฐ์ดํฐ ํตํฉ ๋ถ์ ๋ฐฉ๋ฒ๋ก ์ ์ ๊ณตํ์ฌ, Hi-Compass์ ์
๋ ฅยทํน์ฑ ํ์ฅ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
DNA ์์ด๋ก ์ ์ ์ ๋ฐํ์ ์์ธกํ๋ ๋ฌธ์ ์ ๋นํด, ๋ณธ ๋
ผ๋ฌธ์ ๋ฉํฐ๋ชจ๋ฌ ๋จ์ผ์ธํฌ ๋ฐ์ดํฐ๋ฅผ ํตํฉ ๋ถ์ํ๋ ๋์์ ์ฐ๊ตฌ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
431(Integrated analysis...)์ ์ฌ๋ฌ ๋ชจ๋ฌ์ ๋จ์ผ-์ธํฌ ๋ฐ์ดํฐ ํตํฉ์ ์ค์ ์คํ์ ์ ์ฉํ๋ ์ฌ๋ก๋ก, 487์ ๋ค์ค๋ชจ๋ฌ ๋ฐฉ๋ฒ๊ณผ ๋น๊ต ์ดํด์ ๋์์ ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ์ผ์ธํฌ ๋ฐ์ดํฐ์ ๋ฉํฐ๋ชจ๋ฌ ํตํฉ ๋ถ์์ ๋ค๋ฃจ๋ 431 ์ฐ๊ตฌ๋ ๋จ์ผ์ธํฌ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ํ์ธํ๋๊ณผ ์๋ฃ ์ผ๋ฐํ ์ด์์ ๋์์ด ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํตํฉ ๋ฉํฐ๋ชจ๋ฌ ๋จ์ผ์ธํฌ ๋ถ์ ๋
ผ๋ฌธ๊ณผ VAE-MS์ ๊ฒฐ๊ณผ๋ฅผ ๋น๊ตํ๋ฉด, ๋์ฐ๋ณ์ด ์๊ทธ๋์ฒ ์ถ์ถ ๋ฐฉ์์ ์ฐจ์ด๋ฅผ ์ดํดํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํฌ๋ก๋งํด ๋ฃจํ ๋๋ 3D ๊ฒ๋ ์กฐ์ง ๋ถ์์ ์ํ ๋์์ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ๋ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
WNN ๋ฐฉ๋ฒ๋ก ๋
ผ๋ฌธ์ SCANPY๋ก ์ ์ ๋ ๋ฐ์ดํฐ์ ๋จ์ผ์ธํฌ ๋ฉํฐ๋ชจ๋ฌ ๋ถ์์ ์ถ๊ฐ์ ์ผ๋ก ๊ฐ๋ฅํ๊ฒ ํ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
๋จ์ผ์ธํฌ ์์ค ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ๋ฅผ ํตํฉ ๋ถ์ํ๋ WNN ๋ฐฉ๋ฒ๋ ์ ์ ์ ๋ฐํ ์์ธก์ ์ ๋ฐ๋๋ฅผ ๋์ด๊ธฐ ์ํ ํ์ฅ ์ฐ๊ตฌ๋ก ๋ณผ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
Efficient fine-tuning of single-cell foundation models ๋
ผ๋ฌธ์ ๋จ์ผ์ธํฌ ๋ฐ์ดํฐ์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๊ฒฐํฉ ์ฐ๊ตฌ์ ์์ฉ ํ์ฅ์
๋๋ค.
ํ์ ์ฐ๊ตฌ
scBaseCamp ๋
ผ๋ฌธ์ ์๋ํ๋ ๋๊ท๋ชจ ๋จ์ผ์ธํฌ ๋ฐ์ดํฐ ํตํฉ ๋ฐ ๋ถ์์ ์ค์ฆ์ ์ฌ๋ก๋ก, WNN ์ ๊ทผ๋ฒ์ ์ค์ ์ ํ์ฅ์ด ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
AlphaGenome ๋
ผ๋ฌธ์ ๋ฉํฐ๋ชจ๋ฌ ์ ์ ์ฒด ์
๋ ฅ ๋ฐ ๋ค์ํ ์๋ฌผํ์ ์ ํธ ๋์ ์์ธก์ ๊ฐ๋ฅํ๊ฒ ํ์ฌ, ๋จ์ผ์ธํฌ ๊ธฐ๋ฐ multi-omics ๋ถ์์ ์ต์ ๋ฅ๋ฌ๋ ๋ฐ์ ๋ฐฉํฅ์ ์ ์ํฉ๋๋ค.
์์ฉ ์ฌ๋ก
Integrated analysis of multimodal single-cell data ๋
ผ๋ฌธ์ ML ๊ธฐ๋ฐ ์์ด์ ํธ์ ์ค์ ๋ฐ์ดํฐ ๋ถ์ ์ ์ฉ ์ฌ๋ก๋ก, Gym-style ๋ฒค์น๋งํน ํ๋ ์์ํฌ์ ์ ํจ์ฑ์ ๋ณด์ฌ์ค๋ค.
์์ฉ ์ฌ๋ก
๋ค์ค๋ชจ๋ฌ ๋จ์ผ์ธํฌ ๋ฐ์ดํฐ์ ํตํฉ ๋ถ์ ์ฌ๋ก์ ๋น๊ตํด scBaseCamp์ AI ๊ธฐ๋ฐ ์๋ ๋ฐ์ดํฐ ํ๋ ์ด์
์ ์ค์ง์ ์ ์ฌ๋ ฅ์ ํ์ธํ ์ ์์ต๋๋ค.
์์ฉ ์ฌ๋ก
ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๊ธฐ๋ฐ ๋ฐ์ด์ค์ ๋ณด ๋ถ์์ด ๋จ์ผ์ธํฌ ๋ฑ ์คํ์ ๋ณด ํตํฉ์ ๋ฏธ๋ ๋ฐฉํฅ์ ์ฐธ๊ณ ๊ฐ ๋๋ค.
์์ฉ ์ฌ๋ก
Cell2Sentence ํ๋ ์์ํฌ๊ฐ ๋จ์ผ์ธํฌ ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ ํตํฉ ๋ฐ ๋ถ์์ WNN ๋ฐฉ๋ฒ๋ก ์ ์ค์ง์ ์ผ๋ก ๊ตฌํํ ์ฌ๋ก๋ค.
์์ฉ ์ฌ๋ก
edgePython ๋
ผ๋ฌธ์ ๋จ์ผ์ธํฌ RNA-seq ๋ฐ์ดํฐ์ ํนํ๋ ํ์ด์ฌ ๊ธฐ๋ฐ ๋ถ์๋๊ตฌ๋ฅผ ๊ฐ๋ฐํ์ฌ, ๋ฉํฐ๋ชจ๋ฌ ๋จ์ผ์ธํฌ ๋ฐ์ดํฐ ์ค์ ๋ถ์์์ WNN์ฒ๋ผ ๋ฐ์ดํฐ ํตํฉ ์ค์ฉํ ์์๋ฅผ ๋ณด์ฌ์ค๋๋ค.
์์ฉ ์ฌ๋ก
๋จ๋ฐฑ์ง-๊ธ๋ฆฌ์นธ ๊ฐ์ ์ค์ ์ํธ์์ฉ ๋ชจ๋์ ๋ณตํฉ์ ๊ตฌ์กฐ ๋ถ์์ ๋ณธ ๋
ผ๋ฌธ์ ๊ตฌ์กฐ ํด์ ํต์ฐฐ์ ์ ์ฉํ ์ ์์ต๋๋ค.