Essence
Figure 3: Persistent homology across transformer layers and tissue domains. (a) H1 persistence delta (observed minus
์๋ฌผํ ํ์ด๋ฐ์ด์
๋ชจ๋ธ(scGPT, Geneformer)์ ๋ด๋ถ ํํ์ด ์ธ์ฝ๋ฉํ ์์ยท๊ธฐํ ๊ตฌ์กฐ๋ฅผ AI ๊ธฐ๋ฐ ์๋ ๊ฐ์ค ์ ๋ณ ๋ฃจํ๋ก 141๊ฐ ๊ฐ์ค์ ๊ฒ์ฆํ์ฌ ๊ท๋ช
ํ ์ฐ๊ตฌ. ๋ชจ๋ธ์ด ์๋ฌผํ์ ์ผ๋ก ์๋ฏธ ์๋ ๊ธฐํ ๊ตฌ์กฐ๋ฅผ ํ์ตํ์ง๋ง, ๊ตฌ์กฐ๋ ๋ฉด์ญ ์กฐ์ง์ ๊ตญํ๋๋ฉฐ ๋ชจ๋ธ ๊ฐ ์ ์ฌ์ฑ๋ ๋ถ๋ถ์ ์์ ์
์ฆ.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ ์๋ ๊ฐ์ค ์ ๋ณ์ด๋ผ๋ ํ์ ์ ๋ฐฉ๋ฒ๋ก ์ผ๋ก ์๋ฌผํ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ์์ยท๊ธฐํ ๊ตฌ์กฐ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ๊ท๋ช
ํ๊ณ , ์๊ฒฉํ null ์ ์ด์ ๋ถ์ ์ ๊ฒฐ๊ณผ ๊ธฐ๋ก์ ํตํด ์ค์ ์ ํธ์ artifact์ ๊ฒฝ๊ณ๋ฅผ ๋ช
ํํ ํ๋ค. ๊ทธ๋ฌ๋ tissue ํน์ด์ฑ, PCA ์ฐจ์ ์ถ์์ ์ ๋ณด ์์ค, ๋ฐ์ดํฐ ํ๊ณ ๋ฑ์ผ๋ก ์ธํด ๋ฐ๊ฒฌ์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ ์ ํ์ ์ด๋ฉฐ, ํ์ด๋ฐ์ด์
๋ชจ๋ธ ํด์ ๋ถ์ผ์ ์ค์ํ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ์ฌ์ ํจ๊ป ์๋ฌผํ ๋ชจ๋ธ ์ ๋ขฐ๋ ํ๊ฐ์ ์๋ก์ด ๊ธฐ์ค์ ์ ์ํ๋ ์ฐ์ํ ์ฐ๊ตฌ.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
320๋ฒ ๋
ผ๋ฌธ์ ์ฝ๋ ๊ธฐ๋ฐ ๋ํ์ธ์ด๋ชจ๋ธ ํ๊ฐ์ AI ๋ชจ๋ธ์ ๋ด์ฌ ํน์ฑ ์ง๋จ์ ๋ค๋ฃจ์ด, 3282๋ฒ์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๋ด๋ถ ํํ ๋ถ์ ๊ธฐ๋ฒ๊ณผ ์ด๋ก ์ ์ผ๋ก ์ฐ๊ฒฐ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์๋ฌผ์ ๋ณดํ์์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ๋ด๋ถ ํํ์ ๋ํ ์ ๋ฐ์ ํํฉ์ ๋ค๋ฃจ๋ฏ๋ก ์์ ๋ฐ ๊ธฐํ ๊ตฌ์กฐ ๋ถ์ ๋
ผ๋ฌธ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
3245์ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ/์์ด ์ ๋ณด ์ตํฉ deep learning ๋ชจ๋ธ์ด 3282์ ์๋ฌผํ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๋ด๋ถ ๊ตฌ์กฐ ํด์ ๋ฐ ์๋ ๊ฐ์ค ์ ๋ณ ์ฐ๊ตฌ์ ๋ชจํฐ๋ธ๊ฐ ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
031๋ฒ ๋
ผ๋ฌธ์ ๊ณผํ์ ๊ฐ์ค ์์ฑ ํ๋ ์์ํฌ์ ๋ํ ์ข
ํฉ์ ๋ฆฌ๋ทฐ๋ฅผ ์ ๊ณตํ์ฌ, 3282๋ฒ์ ๊ฐ์ค ์๋ ๊ฒ์ฆ ๋ฃจํ ๋ฐฉ๋ฒ๊ณผ ๋น๊ต ์ฝ๊ธฐ์ ์ ํฉํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
โScientific hypothesis generation by large language modelsโ๋ LLM์ ๊ฐ์ค ์์ฑ ๋ฅ๋ ฅ์ ํ๊ฐํ๋ฏ๋ก, ๋ด๋ถ ๊ตฌ์กฐํ์ต๊ณผ ๊ฐ์ค ํ๊ฐ ๊ด์ ์์ ์ํธ๋ณด์์ ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
3282 ๋
ผ๋ฌธ์ ์๋ฌผํ์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ด ๋ด์ฌํ ์์ ๋ฐ ๊ธฐํ ๊ตฌ์กฐ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ๋ถ์ํด, ๋จ์ผ์ธํฌ ํํ ๊ณต๊ฐ ํด์(3179)๊ณผ ์ง์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฌผํ์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ด ์ต๋ํ๋ ์์์ ยท๊ธฐํํ์ ๊ตฌ์กฐ ํ์ต์ ํฌ๊ด์ ์ผ๋ก ๋ถ์ํ๋ฉฐ ๋จ๋ฐฑ์ง-๋ฆฌ๊ฐ๋ ๋ชจ๋ธ๊ณผ ๋น๊ต๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ ๋ค ์๋ฌผํ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ๋ด๋ถ ํํ(๊ตฌ์กฐ/ํฌ์์ฑ ๋ฑ)์ ํด์ํ๋ ค ์๋ํ์ง๋ง, 3282๋ ์์ยท๊ธฐํ ๊ตฌ์กฐ์ ์ง์ค, 3281์ ํฌ์ ์คํ ์ธ์ฝ๋ ๊ธฐ๋ฐ ํด์์ ์๋ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฌผํ์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ์์ ๋ฐ ๊ธฐํํ์ ๊ตฌ์กฐ ๋ถ์์ด๋ผ๋ ์ ์ฌ ๋ชฉ์ ์ ๊ฐ์ง๋ ์ ๊ทผ ๋ฐฉ์์ด ๋ค๋ฆ
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฌผํ์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ด ์์ธกํ๋ ํ ํด๋ก์ง, ๊ตฌ์กฐ์ ๊ธฐํ์ ยท์์์ ํน์ฑ์ ๋ถ์ํ๋ ๋
ผ๋ฌธ์ผ๋ก, ๋๊ท๋ชจ ๊ตฌ์กฐ ์์ธก๊ณผ ์ฐ๊ณํด๋ณด๋ฉด ์ ์ฉํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ตฌ์ฒด์ ํ๋ ์์ํฌ(ViraHinter)์ ๋ฌ๋ฆฌ ๋ค์ํ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ๋ด๋ถ ์์/๊ธฐํ ๊ตฌ์กฐ๋ฅผ ํด์์ ์ผ๋ก ๋น๊ตํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
โImproving Scientific Hypothesis Generation with Knowledge Graphsโ๋ ๋ด๋ถ ํํ์ ์๋ฏธ๋ก ์ ๊ตฌ์กฐ ํ์ต์ ์ค์ ๊ฐ์ค ์ถ๋ก ์ ์ฐ๊ฒฐํ๋ ์์ฉ ์ฐ๊ตฌ๋ก ํจ๊ป ์ฐธ๊ณ ํ ๋งํ๋ค.
ํ์ ์ฐ๊ตฌ
ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ด ์ธ์ฝ๋ฉํ ๊ตฌ์กฐ์ ํน์ง์ ๋ํ ์ค์ ๋ถ์, ์คํ์ ๊ฒ์ฆ์ ์ํํ ๋
ผ๋ฌธ์ผ๋ก, ์ด๋ก ์ ๋
ผ์์ ์ ์ฉ ์ฌ๋ก์ด๋ค.
ํ์ ์ฐ๊ตฌ
์๋ฌผํ์ ์ง์์ ๋ค์ฐจ์ ์คํํธ๋ด ๊ธฐํ ๋ถ์ ๋ฐฉ๋ฒ์ผ๋ก ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ๊ตฌ์กฐ ์๋ฏธ์ฑ ํด์์ ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์๋ฌผํ์ foundation model์ด ๋ด๋ถ์ ์ผ๋ก ์ต๋ํ๋ ๊ธฐํยท์์ ๊ตฌ์กฐ ํด์์ ์๋ํ์ฌ, PLL์ ํด์์ ํน์ง๊ณผ ์ค์ง์ ์๋ฏธ๋ฅผ ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
SAE ๊ธฐ๋ฐ ๋ด๋ถ ๊ตฌ์กฐ ํด์์ ๋์ด์ ์์ ๋ฐ ๊ธฐํํ์ ์๋ฏธ๋ฅผ ์คํ ๋ฃจํ์ ์ฐ๊ณํด ๊ฒ์ฆํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
3245์ ์๋ฌผํ์ ์์ด-๊ตฌ์กฐ ์ ๋ณด ์ตํฉ์ 3282๊ฐ ์๋ฌผํ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๋ด๋ถ์ ์์-๊ธฐํ ๊ตฌ์กฐ ํด์ ๋ฐ ์๋ ๊ฐ์ค ์ ๋ณ ์ฐ๊ณ๋ก ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
What Topological and Geometric Structure Do Biological Foundation Models Compute? ๋
ผ๋ฌธ์ ๋จ๋ฐฑ์ง ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ๋ด๋ถ ๊ตฌ์กฐ์ /ํ ํด๋ก์ง ์ ๋ณด ํ์ต์ ์ค์ฆ์ ์ผ๋ก ๋ถ์ํ์ฌ, AlphaInterp ์ฐ๊ตฌ ๋ฐฉํฅ์ ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์๋ฌผํ์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ์์ยท๊ธฐํ์ ๊ตฌ์กฐ ํ๊ฐ๊ฐ ๋ฆฌ๊ฐ๋-ํ๊น ๊ฒฐํฉ ๋ฒค์น๋งํฌ์ ์ง์ ์ฐ๊ด๋๋ค.
์์ฉ ์ฌ๋ก
๋จ๋ฐฑ์ง-๊ธ๋ฆฌ์นธ ๊ฐ์ ์ค์ ์ํธ์์ฉ ๋ชจ๋์ ๋ณตํฉ์ ๊ตฌ์กฐ ๋ถ์์ ๋ณธ ๋
ผ๋ฌธ์ ๊ตฌ์กฐ ํด์ ํต์ฐฐ์ ์ ์ฉํ ์ ์์ต๋๋ค.
์์ฉ ์ฌ๋ก
3282๋ฒ ๋
ผ๋ฌธ์์ ์๋ฌผํ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ๋ด๋ถ ํํ์ด AI ๊ธฐ๋ฐ ๊ฐ์ค ๊ฒ์ฆ์ ์ฌ์ฉ๋๋ ์ฌ๋ก๋, 3280๋ฒ์ WaveFormer์์ ์ ํธ์๋ฒ ๋ฉ์ ํด์ ๋ฐ ํ์ฉ์ ์ค์ ์ ์์ฉ ์์๋ก ์ฐ๊ฒฐ๋ฉ๋๋ค.
๋ฐ๋ก /๋นํ
๋ด๋ถ ๊ตฌ์กฐ ๋ถ์์ ์ธ์ง์ ํ๊ณ์ AI์ ์ธ๊ฐ ๊ฐ ์ถ๋ก ํธํฅ์ ๋ค๋ฃจ์ด ๋ด๋ถ ๊ตฌ์กฐ์ ์๋ฏธ ํด์์ ๋นํ์ ์๊ฐ์ ์ ๊ณตํ๋ค.