Scaling and quantization of large-scale foundation model enables resource-efficient predictions in network biology

์ €์ž: Han Chen, Madhavan S. Venkatesh, Javier GฯŒmez Ortega, Siddharth V. Mahesh, Tarak N. Nandi | ๋‚ ์งœ: 2026.03 | DOI: 10.1038/s43588-026-00972-4 📄 PDF


Essence

์ด ๋…ผ๋ฌธ์€ ~10^4๋ฐฑ๋งŒ ๊ฐœ์˜ ์ธ๊ฐ„ ๋‹จ์ผ ์„ธํฌ ์ „์‚ฌ์ฒด๋กœ ๊ตฌ์„ฑ๋œ ๋Œ€๊ทœ๋ชจ Genecorpus-104M ๋ฐ์ดํ„ฐ์…‹์—์„œ Geneformer ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์Šค์ผ€์ผ๋ง ๋ฒ•์น™์„ ์ •์˜ํ•˜๊ณ , ๋ชจ๋ธ ์–‘์žํ™”(quantization)๊ฐ€ ์ƒ๋ฌผํ•™์  ์ง€์‹์„ ๋ณด์กดํ•˜๋ฉด์„œ ๋ฆฌ์†Œ์Šค ํšจ์œจ์ ์ธ ๋ฏธ์„ธ์กฐ์ •๊ณผ ์ถ”๋ก ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•จ์„ ์ž…์ฆํ•œ๋‹ค.

Motivation

Achievement

Figure 3

Fig. 3 | Effect of scaling and quantization on cell-level tasks. a, Zero-shot

How

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 4/5 Significance: 5/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ์ด ๋…ผ๋ฌธ์€ ์ƒ๋ฌผํ•™์  ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์‹ค์ œ ํ™œ์šฉ์„ ํฌ๊ฒŒ ์ด‰์ง„ํ•  ์ˆ˜ ์žˆ๋Š” ์ค‘์š”ํ•œ ์—ฐ๊ตฌ๋กœ, ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•, ๋ช…ํ™•ํ•œ ์Šค์ผ€์ผ๋ง ๋ฒ•์น™ ์ •์˜, ๊ทธ๋ฆฌ๊ณ  ์–‘์žํ™”๋ฅผ ํ†ตํ•œ ๋ฆฌ์†Œ์Šค ํšจ์œจ์„ฑ ๋‹ฌ์„ฑ์ด๋ผ๋Š” ์—ฌ๋Ÿฌ ๊ธฐ์—ฌ๋ฅผ ์ œ์‹œํ•œ๋‹ค. ๋‹ค๋งŒ ์–‘์žํ™” ๊ธฐ๋ฒ•์˜ ๊ธฐ์ˆ ์  ์„ธ๋ถ€์‚ฌํ•ญ ์„ค๋ช…๊ณผ ์ž„์ƒ ์ ์šฉ์— ๋Œ€ํ•œ ์‹ค์ฆ์  ๊ฒ€์ฆ์ด ๋ณด๊ฐ•๋˜๋ฉด ๋”์šฑ ์™„์„ฑ๋„ ์žˆ๋Š” ์—ฐ๊ตฌ๊ฐ€ ๋  ๊ฒƒ์ด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
696์€ ์‹ฑ๊ธ€์…€ ๋‹จ์ผ์„ธํฌ ๋ฐ์ดํ„ฐ์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ์Šค์ผ€์ผ๋ง์„ ์‹ค์ฆ์ ์œผ๋กœ ์—ฐ๊ตฌํ–ˆ๊ณ , 3237์€ ์ด๋ฅผ ๊ธฐ์ดˆ๋กœ scaling/quantization ๊ธฐ๋ฒ•์„ ๋ฐœ์ „์‹œํ‚ต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋‹จ์ผ์„ธํฌ ์Šค์ผ€์ผ ๋‹จ๋ฐฑ์งˆ/์œ ์ „์ฒด ๋Œ€ํ˜• ๋ชจ๋ธ์˜ ํšจ์œจ์  ํ•™์Šต์— ๊ด€ํ•œ ๋‚ด์šฉ์ด, 3234์˜ AI ๊ธฐ๋ฐ˜ ๋‹จ๋ฐฑ์งˆ ํ•ด์„ ์ž๋™ํ™” ํ”Œ๋žซํผ ๊ตฌ์ถ•์— ๊ทผ๊ฐ„์ด ๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ƒ๋ช…์ •๋ณดํ•™ ๊ด€๋ จ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ๋ฐ ๋ชจ๋ธ ํ™•์žฅ ๋…ผ์˜๋กœ, 3237์˜ ๋‹จ์ผ์„ธํฌ ๋ชจ๋ธ๊ณผ์˜ ์ ‘๊ทผ๋ฒ• ์ฐจ์ด๋ฅผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
CLM-X๋Š” ๋‹ค์–‘ํ•œ single-cell ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ž…๋ ฅ์ฒ˜๋ฆฌ ๋ฐ ํ† ํฐํ™” ์•„ํ‚คํ…์ฒ˜๋ฅผ ํ†ตํ•ด, Geneformer์™€ ๊ตฌ๋ณ„๋˜๋Š” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Scaling and quantization of large-scale foundation model enables high-throughput materials discovery๋Š” ๋Œ€๊ทœ๋ชจ foundation model ํ™œ์šฉ ๋ฌด๊ธฐ ์†Œ์žฌ ๋ฐœ๊ฒฌ์„ ๊ณ ์ฒ˜๋ฆฌ๋Ÿ‰์œผ๋กœ ํ™•์žฅ, 3117๊ณผ ๋ฌธ์ œ์‹ ์ ‘๊ทผ์ด ๋งž๋‹ฟ์•„ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Genecorpus-104M์— ๊ธฐ๋ฐ˜ํ•œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ scalingยท์–‘์žํ™” ์—ฐ๊ตฌ๊ฐ€, CHANRG์˜ ํšจ์œจ์  ๋ฐ์ดํ„ฐ ๋ถ„ํ•  ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ์ด์–ด์ง„๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Genecorpus-104M ๊ธฐ๋ฐ˜ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ์Šค์ผ€์ผ๋ง ์—ฐ๊ตฌ๊ฐ€, MEIsensor์˜ ๋Œ€๊ทœ๋ชจ ์œ ์ „์ฒด ๋ณ€์ดํ•™์Šต์— ํ™•์žฅ ์ ์šฉ๋œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋Œ€๊ทœ๋ชจ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ํ™•์žฅ๊ณผ ์–‘์žํ™” ๋ฐ ์ตœ์ ํ™” ๋ฐฉ๋ฒ•์„ ์‹ค์ œ ์Šค์ผ€์ผ์–ด๋ธ”๋กœ ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ๋ณด์ธ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
3237์˜ ๋Œ€๊ทœ๋ชจ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์„ 3281์ฒ˜๋Ÿผ ์ƒ๋ฌผํ•™์  ๊ตฌ์กฐ ์ธ์‹ ๋ฐ ํฌ์†Œ ์˜คํ† ์ธ์ฝ”๋” ์‘์šฉ ๋“ฑ ์‹ค์ œ ํŒฌ๋‹ค๋ฏน ์˜ˆ์ธก์ด๋‚˜ ๋‹จ๋ฐฑ์งˆ ๊ธฐ๋Šฅ ์ถ”๋ก ์— ์ ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •