Unimatch: Universal matching from atom to task for few-shot drug discovery

์ €์ž: Ruifeng Li, Mingqian Li, Wei Liu, Yuhua Zhou, Xiangxin Zhou, Yuan Yao, Qiang Zhang, Hongyang Chen | ๋‚ ์งœ: 2025 | DOI: ๋ฏธ์ œ๊ณต 📄 PDF


Essence

Figure 1

๊ทธ๋ฆผ 1: ๋ถ„์ž ๊ตฌ์กฐ์˜ ๋‹ค์–‘ํ•œ ์ˆ˜์ค€์ด ์„œ๋กœ ๋‹ค๋ฅธ ํŠน์„ฑ์— ์˜ํ–ฅ์„ ๋ฏธ์นจ: (a) ์›์ž ์ˆ˜์ค€์—์„œ ๋ถˆ์†Œ์™€ ์งˆ์†Œ๊ฐ€ ์‚ฐ์„ฑ๋„์™€ ์—ผ๊ธฐ์„ฑ์— ์˜ํ–ฅ, (b) ๋ถ€๋ถ„๊ตฌ์กฐ ์ˆ˜์ค€์—์„œ ํ•˜์ด๋“œ๋ก์‹ค ๊ทธ๋ฃน์ด ์†Œ์ˆ˜์„ฑ์— ์˜ํ–ฅ, (c) ๋ถ„์ž ์ˆ˜์ค€์—์„œ ์ „์ฒด ๊ตฌ์กฐ๊ฐ€ ๋“๋Š”์ ์— ์˜ํ–ฅ

๋ณธ ๋…ผ๋ฌธ์€ ์›์ž(atom)์—์„œ ๊ณผ์ œ(task) ์ˆ˜์ค€๊นŒ์ง€ ๊ณ„์ธต์  ๋งค์นญ์„ ์ˆ˜ํ–‰ํ•˜๋Š” UniMatch ๋ชจ๋ธ์„ ์ œ์•ˆํ•˜์—ฌ, ๋ถ„์ž์˜ ๋‹ค์ธต์  ๊ตฌ์กฐ ์ •๋ณด๋ฅผ ๋ช…์‹œ์ ์œผ๋กœ ํฌ์ฐฉํ•˜๊ณ  ๋ฉ”ํƒ€๋Ÿฌ๋‹์„ ํ†ตํ•ด ๊ณผ์ œ ๊ฐ„ ์ผ๋ฐ˜ํ™”๋ฅผ ๋‹ฌ์„ฑํ•จ์œผ๋กœ์จ few-shot ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•œ๋‹ค.

Motivation

Achievement

Figure 2

๊ทธ๋ฆผ 2: UniMatch์˜ ๊ฐœ์š”. ์ขŒ์ธก: ์ธ์ฝ”๋”ฉ ๋ชจ๋“ˆ๊ณผ ๋งค์นญ ๋ชจ๋“ˆ๋กœ ๊ตฌ์„ฑ๋œ ๊ณ„์ธต์  ํ’€๋ง-๋งค์นญ ์•„ํ‚คํ…์ฒ˜. ์šฐ์ธก: ๋งค์นญ ๋ชจ๋“ˆ์˜ ์„ธ๋ถ€ ํ”„๋กœ์„ธ์Šค

  1. ์„ฑ๋Šฅ ๊ฐœ์„ : MoleculeNet ๋ฐ FS-Mol ๋ฒค์น˜๋งˆํฌ์—์„œ AUROC 2.87%, โˆ†AUPRC 6.52% ํ–ฅ์ƒ ๋‹ฌ์„ฑ. Meta-MolNet ๋ฒค์น˜๋งˆํฌ์—์„œ๋„ ์šฐ์ˆ˜ํ•œ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ ์ž…์ฆ.
  2. ๋‹ค์ธต์  ํ‘œํ˜„ ํ•™์Šต: GNN์˜ ๊ฐ ๊ณ„์ธต์—์„œ ์›์žโ†’๋ถ€๋ถ„๊ตฌ์กฐโ†’๋ถ„์ž ์ˆ˜์ค€์˜ ๊ณ„์ธต์  ํ‘œํ˜„์„ ์ถ”์ถœํ•˜์—ฌ, ๋‹ค์–‘ํ•œ ์Šค์ผ€์ผ์˜ ๋ถ„์ž ํŠน์ง•์„ ๋™์‹œ์— ํฌ์ฐฉ.
  3. ์ ์‘์  ํŠน์ง• ์„ ํƒ: ์ฃผ์˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜(attention mechanism)์„ ํ†ตํ•ด ๊ฐ ์ˆ˜์ค€์—์„œ ๊ฐ€์žฅ ๊ด€๋ จ์„ฑ ๋†’์€ ํŠน์ง•์„ ๋™์ ์œผ๋กœ ๊ฐ€์ค‘์น˜ํ™”ํ•˜์—ฌ ์ •๋ฐ€ํ•œ ๋งค์นญ ๋‹ฌ์„ฑ.

How

Figure 3

๊ทธ๋ฆผ 3: FS-Mol ํ…Œ์ŠคํŠธ ๊ณผ์ œ์—์„œ ๋ชจ๋“  ๋น„๊ต ๋ฐฉ๋ฒ•์˜ ํ‰๊ท  ์„ฑ๋Šฅ ๋ฐ ํ‘œ์ค€ ์˜ค์ฐจ

๋ช…์‹œ์  ๊ณ„์ธต์  ๋ถ„์ž ๋งค์นญ (Architecture):

$$\hat{y}^{(l)}_{\tau,q} = \text{Softmax}\left(\frac{(z^{(l)}_{\tau,q}W_q)(z^{(l)}_{\tau,s}W_k)^\top}{\sqrt{d}}\right)y_{\tau,s}$$

$$\hat{y}_{\tau,q} = \text{Linear}_{W_o}(\text{Concat}(\hat{y}^{(1)}_{\tau,q}, \hat{y}^{(2)}_{\tau,q}, \cdots, \hat{y}^{(L)}_{\tau,q}))$$

์•”๋ฌต์  ๊ณผ์ œ ์ˆ˜์ค€ ๋งค์นญ (Meta-Learning):

Originality

Limitation & Further Study

Evaluation

์ดํ‰: UniMatch๋Š” ๋ถ„์ž์˜ ๋‹ค์ธต์  ๊ตฌ์กฐ ์ •๋ณด๋ฅผ ๋ช…์‹œ์ ์œผ๋กœ ํฌ์ฐฉํ•˜๊ณ  ๋ฉ”ํƒ€๋Ÿฌ๋‹์œผ๋กœ ๊ณผ์ œ ๊ฐ„ ์ผ๋ฐ˜ํ™”๋ฅผ ๋‹ฌ์„ฑํ•˜๋Š” ์‹ค์šฉ์ ์ด๊ณ  ํšจ๊ณผ์ ์ธ ํ”„๋ ˆ์ž„์›Œํฌ์ด๋ฉฐ, ์—ฌ๋Ÿฌ ๋ฒค์น˜๋งˆํฌ์—์„œ ๊ธฐ์กด ๋ฐฉ๋ฒ• ๋Œ€๋น„ ์ผ๊ด€๋œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๋ณด์—ฌ์คŒ. ๋‹ค๋งŒ ๋ฉ”ํƒ€๋Ÿฌ๋‹ ๊ธฐ๋ฒ•์˜ ์ƒ์„ธํ•œ ์„ค๋ช…๊ณผ ๊ณ„์‚ฐ ํšจ์œจ์„ฑ ๋ถ„์„์ด ๋ณด์™„๋˜๋ฉด ๋…ผ๋ฌธ์˜ ์™„์„ฑ๋„๊ฐ€ ๋”์šฑ ๋†’์•„์งˆ ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ๋จ.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
335๋Š” few-shot ํ•™์Šต์—์„œ RAG ๊ธฐ๋ฐ˜ ๊ตฌ์กฐ์  ์ผ๋ฐ˜ํ™” ๋ฐฉ์‹์„ ๋‹ค๋ฃจ๋ฉฐ, 856์˜ UniMatch๊ฐ€ ๋‹ค์ธต ๊ตฌ์กฐ ๋งค์นญ๊ณผ ๋ฉ”ํƒ€๋Ÿฌ๋‹์„ ๋„์ž…ํ•œ ๋ฐฐ๊ฒฝ์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
3038๋ฒˆ ๋…ผ๋ฌธ์€ ๊ณ„์ธต์  ์›์ž๊ฐ„ ํฌํ…์…œ์˜ ์‹ ๋ขฐ์„ฑ๊ณผ ๋ฒ”์šฉ์„ฑ ํ‰๊ฐ€๋ฅผ ํ†ตํ•ด UniMatch ๋ชจ๋ธ์— ์ ์šฉ๊ฐ€๋Šฅํ•œ ๊ธฐ๋ณธ ๊ทผ๊ฑฐ๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ทธ๋ž˜ํ”„ ์‹ ๊ฒฝ๋ง์„ ์ด์šฉํ•œ ๋‹จ๋ฐฑ์งˆ ๊ตฌ์กฐ ํ‘œํ˜„ ํ•™์Šต์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์ด ๋˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
290๋ฒˆ ๋…ผ๋ฌธ์€ ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ์„ ์œ„ํ•œ ํŒŒ๋ผ๋ฏธํ„ฐํ™”๋œ ์ถ”๋ก  ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ๋กœ, ๊ณ„์ธต์ /๊ณผ์ œ ๊ฐ„ ์ผ๋ฐ˜ํ™” ๋ฌธ์ œ์—์„œ ์œ ์‚ฌ ๊ณผ์ œ๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
PerTurboAgent ๋…ผ๋ฌธ์€ ์—ฐ์†์ ์ธ ์‹คํ—˜ ์ตœ์ ํ™” ๋ฐ ์†Œ์ˆ˜ ํ•™์Šต ๊ธฐ๋ฐ˜ ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ์„ AI๋กœ ์ž๋™ํ™”ํ•˜์—ฌ, ์œ ์‚ฌ ๋ฌธ์ œ์— ๋Œ€ํ•œ ๋‹ค์–‘ํ•œ ์ ‘๊ทผ๋ฐฉ์‹์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
344๋Š” ๋ฐ”์ด์˜ค์ •๋ณดํ•™์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์—ญํ• ๊ณผ ๊ตฌ์กฐ์  ํŠน์ง•์„ ๋…ผ์˜ํ•ด, 856์ด ์ œ์‹œํ•˜๋Š” ๋ฉ”ํƒ€๋Ÿฌ๋‹/๊ณ„์ธต์  ํ‘œํ˜„ ํ•™์Šต๊ณผ ์ ‘๊ทผ๋ฒ•์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
3123์€ GNN์„ ํ™œ์šฉํ•ด ๋‹จ๋ฐฑ์งˆ-๋ฆฌ๊ฐ„๋“œ ์ƒํ˜ธ์ž‘์šฉ์„ ์˜ˆ์ธกํ•˜๋ฉฐ, 856์˜ universal matching ๋ชจ๋ธ๊ณผ ๋‹ค๋ฅธ ์‹ ๊ฒฝ๋ง ๊ธฐ๋ฐ˜ ์ ‘๊ทผ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
305๋Š” ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์„ ํ™œ์šฉํ•œ ํ™”ํ•™ ํƒ์ƒ‰๊ณผ ์ง„ํ™”์  ์ ‘๊ทผ์„ ๋‹ค๋ฃจ์–ด, 856์˜ ํ† ํฐํ™”์™€ ๊ณ„์ธต ์ •๋ณด ํ™œ์šฉ์„ ์‹ค์ œ ์„ค๊ณ„์— ๋ฐ˜์˜ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
single-cell ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์„ ํ™œ์šฉํ•œ ์†Œ์ˆ˜(์ ์€ ์ƒ˜ํ”Œ) ๋ฐ์ดํ„ฐ ํ•™์Šต ํ™•์žฅ ์—ฐ๊ตฌ๋กœ, UniMatch์˜ ๊ณ„์ธต์  ๋งค์นญ ๋ฉ”์ปค๋‹ˆ์ฆ˜๊ณผ ์‹ค์ œ ํ™œ์šฉ ์‚ฌ๋ก€๋ฅผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
749์˜ Evo ๋ชจ๋ธ์€ ๋Œ€๊ทœ๋ชจ genome-scale sequence modeling์„ ํ†ตํ•ด 856์˜ ๊ณ„์ธต์  ๊ตฌ์กฐ ์ •๋ณด ํฌ์ฐฉ ๋ชจ๋ธ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ์‹ค์ฆ์ ์œผ๋กœ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •