์ ์: Fang Wu, Weihao Xuan, Heli Qi, Hanqun Cao, Heng-Jui Chang, Zeqi Zhou, Haokai Zhao, Ma Jian, Carl Ma, Yu-Chi Cheng, Kuan Pang, Xiangru Tang, Zehong Wang, Guanlue Li, Hanchen Wang, Kejun Ying, Pan Lu, Chiho Im, Seungju Han, Peng Xia, Tinson Xu, Yinxi Li, Deyao Zhu, Pheng-Ann Heng, Naoto Yokoya, Masashi Sugiyama, Li Erran Li, Jure Leskovec, Yejin Choi | ๋ ์ง: 2026-05-01 | URL: https://arxiv.org/abs/2605.02937 📄 PDF
Essence
Figure 1. Proteo-R1 couples a multimodal reasoning expert with a
์ด ๋
ผ๋ฌธ์ ๋จ๋ฐฑ์ง ์ค๊ณ์์ ์ถ๋ก ๊ณผ ์์ฑ์ ๋ช
์์ ์ผ๋ก ๋ถ๋ฆฌํ๋ dual-expert ํ๋ ์์ํฌ์ธ Proteo-R1์ ์ ์ํ๋ค. multimodal LLM์ด ๊ธฐ๋ฅ์ ์ผ๋ก ์ค์ํ ์๊ธฐ๋ฅผ ์๋ณํ๊ณ ์ด๋ฅผ hard constraint๋ก diffusion ๊ธฐ๋ฐ ์์ฑ ๋ชจ๋ธ์ ์ ๋ฌํจ์ผ๋ก์จ ํด์๊ฐ๋ฅํ๊ณ ๋ชจ๋์์ธ ๋จ๋ฐฑ์ง ์ค๊ณ๋ฅผ ์คํํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: Proteo-R1์ ๋จ๋ฐฑ์ง ์ค๊ณ์ ๋ช
์์ ์ถ๋ก ๋จ๊ณ๋ฅผ ๋์
ํ์ฌ ํด์๊ฐ๋ฅ์ฑ, ์ ์ด์ฑ, ๋ชจ๋์ฑ์ ํ๊ธฐ์ ์ผ๋ก ๊ฐ์ ํ๋ ์ค์ํ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ค. dual-expert architecture์ residue-level constraint ๋ฉ์ปค๋์ฆ์ ์ฐฝ์์ ์ด๋ฉฐ ๊ธฐ์ ์ ์ผ๋ก ๊ฒฌ๊ณ ํ๋ค. ๋ค๋ง ํ๊ฐ๊ฐ antibody CDR์ ๊ตญํ๋๊ณ LLM ์ค๋ฅ ์ ํ๋ ๊ณ์ฐ ํจ์จ์ฑ ๋ถ์์ด ๋ถ์กฑํ ์ ์ด ์์ฝ๋ค. ํฅํ ๋ค์ํ ๋จ๋ฐฑ์ง ์ค๊ณ ์์
์ผ๋ก ์ผ๋ฐํํ๊ณ ์ด๋ฌํ ์ค๋ฌด์ ์ธก๋ฉด๋ค์ ๋ณด์ํ๋ค๋ฉด ๋จ๋ฐฑ์ง ๊ณตํ ๋ถ์ผ์์ ๋งค์ฐ ์ํฅ๋ ฅ ์๋ ๋ฐฉ๋ฒ๋ก ์ด ๋ ์ ์์ ๊ฒ์ผ๋ก ํ๋จ๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
์๋ฌผ์ ๋ณดํ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ํ์ฉ ์๋ฒ ์ด ๋
ผ๋ฌธ์ผ๋ก, multi-modal LLM ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง ์ค๊ณ ์ ๋ต์ ์ ๋ฐ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
BioLLM ์๋ฒ ๋ฉ ๋ฐ RNA-interaction ์์ธก ์์ญ์ foundation model์ ๊ฒฐํฉํ ์ฐ๊ตฌ๋ก CrossLLM-Mamba ๊ฐ๋
์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
3181์ ๋ค์ค ๊ด์ ๋ค๋ชฉ์ ๋จ๋ฐฑ์ง์์ธก ํ๋ ์์ํฌ ๊ฐ๋
์ด 3224์ reasoning-generative dual-expert ๊ตฌ์กฐ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
dual expert ๊ตฌ์กฐ์ diffusion ์์ฑ ๋ชจ๋ธ์ ๋ช
์์ ์ผ๋ก ๊ฒฐํฉํจ์ผ๋ก์จ 3228์ RL-๊ฐ์ด๋ PLM ๊ธฐ๋ฐ ์์ด ์์ฑ์ ์ด๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋จ๋ฐฑ์ง ๊ธฐ๋ฅ ์์ธก์์ foundation model ํ์ฉ ๋ฐ ๋๋ฉ์ธ ํนํ autoregressive ์ถ๋ก ์ด๋ก ์ BioReason-Pro์ ๊ธฐ๋ฐ์ผ๋ก ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋จ๋ฐฑ์ง ์ค๊ณ ๋ฐ ๋จ์ ๋ฐ๊ฒฌ๊ณผ์ ์์ foundation model ๋์
์, PUFFIN์ ๊ตฌ์กฐ-๊ธฐ๋ฅ ์ง๋ ํ์ต ํ๋ ์์ํฌ์ ๊ธฐ์ ์์ด๋์ด๋ก ์ผ์ ์ ์๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
de novo ๋จ๋ฐฑ์ง ์ค๊ณ ๋ฐ ์์ฑ AI ๋ชจ๋ธ์ ํ์ด๋ฐ์ด์
์ํคํ
์ฒ, ํ์ต ํ๋ ์ ๋ฑ์ด ๊ธฐ์ด๋ก ์ ์๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์ฑ์ ๊ธฐ๋ฐ ๋๋
ธ๋ณด ๋จ๋ฐฑ์ง ์ค๊ณ ๋ชจ๋ธ๋ก, ๋จ๋ฐฑ์ง ๋์ญํยท์ง๋ ํน์ฑ์ ๋ค๋ฅด๊ฒ ๊ณ ๋ คํ๋ ์ ๊ทผ ๋ฐฉ์์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
de novo ๋จ๋ฐฑ์ง ์ค๊ณ๋ฅผ ์ฌ์ธต์ ์ผ๋ก ๋ค๋ฃจ๋ Reasoning Foundation Model ์ฌ๋ก๋ก, ๊ตฌ์กฐ ์ ์ ์ ์์ฉ๊ณผ ํ๋ ์์ํฌ์ ์ฐจ์ด์ ์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
3224 ๋
ผ๋ฌธ์ de novo ๋จ๋ฐฑ์ง ๋์์ธ์ ์ํ reasoning ๊ธฐ๋ฐ ๊ธฐ์ด๋ชจ๋ธ์ ์ ์ํด, 3041๊ณผ ๋ค๋ฅธ ํฌ๋ก์ค์ค์ผ์ผ ํํ ํตํฉ ์ ๋ต์ ๋น๊ตํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
de novo ๋จ๋ฐฑ์ง ์ค๊ณ ๋ฐ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๊ธฐ๋ฐ ์๋ก์ด ๋จ๋ฐฑ์ง ์์ฑ์ ์ฃผ์ ๋ก, ๋ค์ํ ์๋ ์ค๊ณ ๋ฐฉ์์ ๋น๊ต์ ์ฐจ๋ณ์ ์ ํ์
ํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ ๋ค ๋จ๋ฐฑ์ง sequence design ๋ฌธ์ ๋ฅผ ์ ๊ฒฝ-์ฌ๋ณผ๋ฆญ ๋ฐ ์์ฑ AI ๊ด์ ์์ ํ์ง๋ง, 2990์ Neuro-Symbolic AI, 3224๋ LLM ๊ธฐ๋ฐ dual-expert ๋ฐฉ์์
๋๋ค.
ํ์ ์ฐ๊ตฌ
์ฌ์ธต ํ์ต ๊ธฐ๋ฐ de novo ๋จ๋ฐฑ์ง ์ค๊ณ ๋ฐ ๊ฒฐํฉ ๋ถ์ ์์ธก์ ํ์ธต ํ์ฅํด, AF2BIND์ ์ ์ฉ์ฑ๊ณผ ๋ฏธ๋ ๋ฐ์ ์ ์์ฌ์ ์ ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
3181์์ ์ ๊ธฐ๋ ํด์๊ฐ๋ฅ์ฑ๊ณผ ํน์ฑ ์ตํฉ ๋ฌธ์ ๋ฅผ 3224๊ฐ Reasoning ๋ฐ Generative dual-expert ํ๋ ์์ํฌ๋ก ๋ ๋ฐ์ ์์ผ ํ๋๋ค.
ํ์ ์ฐ๊ตฌ
BioReason-Pro์ ์ ์ฌํ๊ฒ ๋จ๋ฐฑ์ง ์ค๊ณ์ ๊ธฐ๋ฅ์์ธก์์ foundation models์ ์๋ฌผ์ ๋ณด ์๋ฒ ๋ฉ์ ํ์ฉํ๋ค.
ํ์ ์ฐ๊ตฌ
Proteo-R1 ๋
ผ๋ฌธ์ ์์ฑํ ๋จ๋ฐฑ์ง ์ค๊ณ์ reasoning evaluation ๋ฐ ํ๊ฐ๋ฐฉ๋ฒ์ ๋ค๋ฃจ์ด, 3025 ์ฐ๊ตฌ์ ์์ฉ์ฑ๊ณผ ํ๊ณ ๋ณด์์ ๊ฐ๋ฅํ๊ฒ ํด์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
de novo ๋จ๋ฐฑ์ง ์ค๊ณ์ ๊ธฐ๋ฅ ์์ธก์ ๊ดํ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ์์ฉ ์ฌ๋ก ์ฐ๊ตฌ๋ก ํ์ฅ์ฑ์ ๋ณด์ผ ์ ์๋ค.
์์ฉ ์ฌ๋ก
์์ด์ ํธ ๊ธฐ๋ฐ de novo ๋จ๋ฐฑ์ง ์ค๊ณ ํ๋ ์์ํฌ๋ก ์ค์ ์ค๊ณ ์ ๋ต ์ ์ฉ์ ๊ดํ ์ฐ๊ฒฐ๊ณ ๋ฆฌ๋ฅผ ์ ๊ณตํ๋ค.
์์ฉ ์ฌ๋ก
de novo ๋จ๋ฐฑ์ง ์ค๊ณ์ ์ ๋ขฐ์ฑ ํ๊ฐ ๋ฌธ๋งฅ์์ ๋ค์ค ํ๊น ๋ฒค์น๋งํฌ ๊ฒฐ๊ณผ๋ฅผ ์ ์ฉํด๋ณผ ์ ์๋ค.