SSPSPredictor: A Sequence and Structure based Deep Learning Model for Predicting Phase-Separating Proteins

์ €์ž: | ๋‚ ์งœ: 2026.04 | DOI: N/A 📄 PDF


Essence

๋ณธ ๋…ผ๋ฌธ์€ ๋‹จ๋ฐฑ์งˆ ์•ก-์•ก ์ƒ๋ถ„๋ฆฌ(liquid-liquid phase separation, LLPS)๋ฅผ ๊ฒช๋Š” ๋‹จ๋ฐฑ์งˆ(phase-separating proteins, PSPs)์„ ์˜ˆ์ธกํ•˜๊ธฐ ์œ„ํ•ด ESM-2 ๋‹จ๋ฐฑ์งˆ ์–ธ์–ด ๋ชจ๋ธ์˜ ์„œ์—ด ์ •๋ณด์™€ GVP graph neural network์˜ ๊ตฌ์กฐ ์ •๋ณด๋ฅผ ์œตํ•ฉํ•œ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ SSPSPredictor๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ์ด ๋ชจ๋ธ์€ ํด๋“œ๋œ ๋‹จ๋ฐฑ์งˆ๊ณผ ๋ณธ์งˆ์ ์œผ๋กœ ๋ฌด์งˆ์„œํ•œ ๋‹จ๋ฐฑ์งˆ(intrinsically disordered proteins, IDPs) ๋ชจ๋‘์— ๋Œ€ํ•ด ๊ท ํ˜•์žกํžŒ ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ, ์ฃผ์˜์ง‘์ค‘(attention) ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํ†ตํ•ด ํ•ด์„๊ฐ€๋Šฅ์„ฑ์„ ์ œ๊ณตํ•œ๋‹ค.

Motivation

Achievement

Figure 2

Figure 2.

How

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: SSPSPredictor๋Š” ESM-2์™€ graph neural network (GVP, SPIN-CGNN)์˜ ๋‹ค์ค‘๋ชจ๋‹ฌ ์ •๋ณด ์œตํ•ฉ์„ ํ†ตํ•ด ํด๋“œ๋œ ๋‹จ๋ฐฑ์งˆ๊ณผ ๋ฌด์งˆ์„œ ๋‹จ๋ฐฑ์งˆ ๋ชจ๋‘์— ๋Œ€ํ•œ ๊ท ํ˜•์žกํžŒ PSP ์˜ˆ์ธก์„ ์ œ๊ณตํ•˜๋Š” ๊ฐ•๊ฑดํ•œ ๋ชจ๋ธ์ด๋‹ค. ์ฃผ์˜์ง‘์ค‘ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํ†ตํ•œ ํ•ด์„๊ฐ€๋Šฅ์„ฑ๊ณผ ์ธ๊ฐ„ ๋‹จ๋ฐฑ์งˆ์ฒด ๊ทœ๋ชจ ๋ถ„์„์„ ํ†ตํ•œ ์ƒ๋ฌผํ•™์  ํ†ต์ฐฐ๋ ฅ์ด ์ฃผ์š” ๊ฐ•์ ์ด๋‚˜, ์ œํ•œ๋œ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์…‹ ๊ทœ๋ชจ๊ฐ€ ๊ฐœ์„ ์ด ํ•„์š”ํ•œ ๋ถ€๋ถ„์ด๋‹ค. ์ข…ํ•ฉ์ ์œผ๋กœ ์ƒ์ฒด๋ถ„์ž ์ƒ๋ถ„๋ฆฌ ์—ฐ๊ตฌ์— ์œ ์šฉํ•œ ๋„๊ตฌ๋กœ์„œ์˜ ๊ฐ€์น˜๊ฐ€ ์ถฉ๋ถ„ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
344๋Š” bioinformatics์—์„œ์˜ foundation model ์ ์šฉ ์ „๋ฐ˜์„ ๋‹ค๋ฃจ๋ฉฐ, 3245์˜ ๋‹จ๋ฐฑ์งˆ ์„œ์—ด-๊ตฌ์กฐ ์œตํ•ฉ ๋ชจ๋ธ์˜ ์ „๋ฐ˜์  ๋งฅ๋ฝ๊ณผ ํ•œ๊ณ„ ๋ถ„์„์— ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ค๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ฌผํ•™์  ์ง€์‹๊ณผ ๊ตฌ์กฐ์˜ ์ŠคํŽ™ํŠธ๋Ÿด ๋ถ„์„ ๋“ฑ ํ† ํด๋กœ์ง€์  ํ•ด์„ ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•˜์—ฌ, 3245์˜ PSP ๋ถ„๋ฅ˜ ์ง€ํ‘œ์˜ ์ด๋ก ์  ํ† ๋Œ€๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
3245์˜ ๋‹จ๋ฐฑ์งˆ ๊ตฌ์กฐ/์„œ์—ด ์ •๋ณด ์œตํ•ฉ deep learning ๋ชจ๋ธ์ด 3282์˜ ์ƒ๋ฌผํ•™ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ๋‚ด๋ถ€ ๊ตฌ์กฐ ํ•ด์„ ๋ฐ ์ž๋™ ๊ฐ€์„ค ์„ ๋ณ„ ์—ฐ๊ตฌ์˜ ๋ชจํ‹ฐ๋ธŒ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ฒฐ์ •๊ตฌ์กฐ ์˜ˆ์ธก์— ์žฌ๊ท€์  ํ•ฉ์„ฑ ์‹ ๊ฒฝ๋ง ๊ธฐ๋ฐ˜ recurrent convolution ๋ฐฉ๋ฒ•์„ ๋„์ž…ํ•œ ๋…ผ๋ฌธ์œผ๋กœ, ์ƒ์„ฑ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์—ญ์„ค๊ณ„ ์—ฐ๊ตฌ์˜ ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
SSPSPredictor๋Š” ์‹œํ€€์Šค-๊ตฌ์กฐ-๋ฌผ์„ฑ ์˜ˆ์ธก์„ ์œ„ํ•œ ์‹ฌ์ธต ๋ชจ๋ธ๋ง์„ ์ œ๊ณตํ•˜์—ฌ 3120์˜ ๋‹ค๋ฌผ์„ฑ ํƒ์ƒ‰๊ณผ ๋ฌผ๋ฆฌ์  ํƒ€๋‹น์„ฑ ๋ณด์žฅ์— ์ด๋ก ์  ๊ทผ๊ฑฐ๊ฐ€ ๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
GNN ๊ธฐ๋ฐ˜ ๋‹จ๋ฐฑ์งˆ ๊ตฌ์กฐ-๊ธฐ๋Šฅ ์˜ˆ์ธก์— ๋Œ€ํ•œ ๋Œ€์•ˆ์  ๋”ฅ๋Ÿฌ๋‹ ์ ‘๊ทผ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹จ๋ฐฑ์งˆ ์‹ ํ˜ธ ๋ฐ ๋…์„ฑ ์˜ˆ์ธก์„ ์œ„ํ•œ ์‹œํ€€์Šคยท๊ตฌ์กฐ ๊ธฐ๋ฐ˜ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ๋กœ 2๊ฐ€์ง€ task๊ฐ„ ์„ฑ๋Šฅ ๋ฐ ํ•ด์„ ๋น„๊ต๋ฅผ ๊ฐ€๋Šฅ์ผ€ ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
3245๋ฒˆ ๋…ผ๋ฌธ์€ sequenceโ€“structure ๊ธฐ๋ฐ˜ deep learning ์ ‘๊ทผ์„ ํ™œ์šฉํ•ด, ๋ณ‘์›์„ฑ ๋‹จ๋ฐฑ์งˆ์˜ ๋ถ„๋ฅ˜ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅธ ๋ชจ๋ธ๋ง ๋ฐฉ์‹์œผ๋กœ ํ’€ ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
3245๋ฒˆ ๋…ผ๋ฌธ์€ ์„œ์—ด ๋ฐ ๊ตฌ์กฐ ์ •๋ณด๋ฅผ ํ™œ์šฉํ•œ deep learning ๊ธฐ๋ฐ˜ ๋‹จ๋ฐฑ์งˆ ๊ฒฐํ•ฉ ์˜ˆ์ธก์œผ๋กœ, IARA ๋ชจ๋ธ์˜ binding site ์˜ˆ์ธก๊ณผ ๋‹ค๋ฅธ ๋ฐฉํ–ฅ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
3245๋ฒˆ ๋…ผ๋ฌธ์€ ์„œ์—ด ๋ฐ ๊ตฌ์กฐ ๊ธฐ๋ฐ˜ deep learning์„ ํ†ตํ•œ ๋‹จ๋ฐฑ์งˆ ๊ธฐ๋Šฅ ์˜ˆ์ธก์œผ๋กœ, PCN ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๊ณผ ์ƒ๋ณด์  ์‹œ๊ฐ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
3245์˜ ์ƒ๋ฌผํ•™์  ์„œ์—ด-๊ตฌ์กฐ ์ •๋ณด ์œตํ•ฉ์„ 3282๊ฐ€ ์ƒ๋ฌผํ•™ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ๋‚ด๋ถ€์˜ ์œ„์ƒ-๊ธฐํ•˜ ๊ตฌ์กฐ ํ•ด์„ ๋ฐ ์ž๋™ ๊ฐ€์„ค ์„ ๋ณ„ ์—ฐ๊ณ„๋กœ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
3245๋ฒˆ ๋…ผ๋ฌธ์€ ๊ฒฐ์ • ๊ตฌ์กฐ์™€ ์กฐ์„ฑ์„ ๋™์‹œ์— ์ƒ์„ฑํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•˜์—ฌ DMFlow์˜ ๋ฌด์งˆ์„œ ์†Œ์žฌ ์ƒ์„ฑ์„ ๊ตฌ์กฐ์  ์ธก๋ฉด์—์„œ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋‹จ๋ฐฑ์งˆ ๊ธฐ๋Šฅ ์˜ˆ์ธก์„ ์œ„ํ•œ ๋‹ค์–‘ํ•œ AI ๋ชจ๋ธ ํ‰๊ฐ€ ๋ฐ ํ™•์žฅ ์—ฐ๊ตฌ์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋‹จ๋ฐฑ์งˆ ์„œ์—ด ๋ฐ ๊ตฌ์กฐ ์ •๋ณด ๊ธฐ๋ฐ˜์˜ ๊ฒฐํ•ฉ ํŠน์ด์„ฑ ์˜ˆ์ธก์— ์ตœ์ ํ™”๋œ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ ์—ฐ๊ตฌ์ž…๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๋‹จ๋ฐฑ์งˆ ๊ตฌ์กฐ, ์„œ์—ด, ํ‘œ๋ฉด ์ •๋ณด ํ†ตํ•ฉ ๊ณ„์ธต์  DL ๋ชจ๋ธ๋กœ, 3245์˜ ๋‹ค์ค‘๋ชจ๋‹ฌ ๊ธฐ๋ฐ˜ PSP ์˜ˆ์ธก ํ”„๋ ˆ์ž„์›Œํฌ์™€ ์‘์šฉ ์ง€์ ์ด ๋งž๋‹ฟ๋Š”๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๋‹จ๋ฐฑ์งˆ ์–ธ์–ด๋ชจ๋ธ ๋ฐ ํ•ญ์›-์ˆ˜์šฉ์ฒด ์ƒํ˜ธ์ž‘์šฉ ์˜ˆ์ธก์—์„œ ๋น„์ง€๋„ ํ•™์Šต ๊ธฐ๋ฐ˜ ์›Œํฌํ”Œ๋กœ์šฐ ์ ์šฉ์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •