Essence
Figure 2: Many PLMs display more variability in their attention focus than the cor-
๋จ๋ฐฑ์ง ์ธ์ด ๋ชจ๋ธ(PLM)์ด ์์ฐ์ด ๋ชจ๋ธ(NLM)๊ณผ ๋ด๋ถ ๋ฉ์ปค๋์ฆ์์ ๊ทผ๋ณธ์ ์ผ๋ก ๋ค๋ฅด๊ฒ ์๋ํจ์ ๋ถ์ํ๊ณ , ๋์ early-exit ๊ธฐ๋ฒ์ ์ ์ฉํ์ฌ ์ฑ๋ฅ๊ณผ ํจ์จ์ ๋์์ ๊ฐ์ ํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ PLM๊ณผ NLM์ ๊ทผ๋ณธ์ ์ฐจ์ด๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ๊ท๋ช
ํ๊ณ ์ด๋ฅผ ๋ฐํ์ผ๋ก ์ค์ง์ ์ธ ์ฑ๋ฅ ๋ฐ ํจ์จ์ฑ ๊ฐ์ ์ ๋ฌ์ฑํ ์ค์ํ ์ฐ๊ตฌ์ด๋ค. ์๋ฌผํ์ ๋ฐ์ดํฐ์ ํนํ๋ ๋ชจ๋ธ ๊ฐ๋ฐ ๋ฐฉํฅ์ ์ ์ํ๋ฉฐ, ๋ฐฉ๋ฒ๋ก ์ ์ฐฝ์์ฑ๊ณผ ์คํ์ ํ๋น์ฑ์ด ์ฐ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
440์ ๊ทธ๋ํ์ ๊ฒฝ๋ง ๋ฐ ๊ฐํํ์ต ๊ธฐ๋ฐ ๊ตฌ์กฐ ์ค๊ณ๋ 3221์์ ๋
ผ์ํ๋ ์ธ์ด๋ชจ๋ธ ๊ธฐ๋ฐ ํํ/์๋ช
๊ณผํ ๊ตฌ์กฐ-์ธ์ด ์ฐ๊ฒฐ ๋
ผ์์ ์ด๋ก ์ ํ ๋์ ๋ง๋ฟ์ ์๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋จ๋ฐฑ์ง ์ธ์ด ๋ชจ๋ธ๊ณผ ์์ฐ์ด ๋ชจ๋ธ์ ๋น๊ต ๋ถ์์ ๋ํ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋จ๋ฐฑ์ง ์ธ์ด๋ชจ๋ธ์ ๊ธฐ์ด ๊ตฌ์กฐ ๋ฐ ์์ฐ์ด๋ชจ๋ธ๊ณผ์ ๋น๊ต๋ฅผ ๋ค๋ฃจ์ด 3221์ ๋ดยท์ธ๋ถ ๋ฉ์ปค๋์ฆ ๋น๊ต ์ฐ๊ตฌ์ ์ด๋ก ๋ฐฐ๊ฒฝ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
ProtoMech ํ๋ ์์ํฌ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋จ๋ฐฑ์ง ์ธ์ด ๋ชจ๋ธ์ ๋ด๋ถ ๋ฉ์ปค๋์ฆ ์ฐจ์ด๋ฅผ ๋ถ์ํ๋ method๊ฐ ๊ณต์ ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Protein Language Models Diverge from Natural Language ๋
ผ๋ฌธ์ ๋จ๋ฐฑ์ง language model์ ๋
์์ ํน์ฑ์ ๋ถ์ํ์ฌ Neurotox์ ์ํ์ค ๊ธฐ๋ฐ deep embedding์ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ฅผ ๊ฐํํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋จ๋ฐฑ์งยทRNA ์ธ์ด๋ชจ๋ธ ๋ด๋ถ ๋ฉ์ปค๋์ฆ ๋ฐ early-exit ๋ฑ ํจ์จํ ๊ธฐ๋ฒ์ด, Cross-Attention ๊ธฐ๋ฐ ํตํฉ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง ์ธ์ด ๋ชจ๋ธ์ ํํ ํ์ต๊ณผ ํจ์จ์ฑ ๊ฐ์ ์ ๋ํ ์ ์ฌํ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง ์ธ์ด ๋ชจ๋ธ์ ๋ด๋ถ ๋ฉ์ปค๋์ฆ ๋ถ์์ ๋ํ ๋์์ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ๋ฆฌํธ๋ ์ธ ํธ๋์คํฌ๋จธ ํด์ ๊ฐ๋ฅ์ฑ์ ๋ํ ๋ฆฌ๋ทฐ๋ก, PLM-NLM ๊ตฌ์กฐ ์ฐจ์ด ํด์์ ๋ํ ๋ณด์์ ์๊ฐ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง ์ธ์ด๋ชจ๋ธ ๋ด๋ถ์ ๋ฐ๋ณต ํจํด ํ์ง ์ฐ๊ตฌ๊ฐ, PLM/NLM ๋ด๋ถ ๊ตฌ์กฐ์ ์ฐจ์ด ํด์๊ณผ ๋์กฐ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์ฐ์ด์ ๋จ๋ฐฑ์ง์ ํํ ๊ณต๊ฐ ํน์ฑ์ ๋น๊ตํ๋ฉฐ ๋ถ์ยท๋จ๋ฐฑ์ง ํตํฉ ํํ์ ๋ํ ๋ค๋ฅธ ๊ด์ ์ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง ์ธ์ด๋ชจ๋ธ์ด ์์ฐ ์ธ์ด์ ์ด๋ป๊ฒ ๋ค๋ฅธ์ง ๋ถ์ํ๋ฏ๋ก, PLM ๊ธฐ๋ฐ ๊ธฐ๋ฅ ์์ธก ์ฐ๊ตฌ์ ์๋์ง ํจ๊ณผ๊ฐ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ธ์ด ๋ชจ๋ธ์ ๋ด๋ถ ์๋ ๋ฉ์ปค๋์ฆ ๋ถ์ ๋ฐ ํจ์จํ์ ๋ํ ๋์์ ๊ด์ ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
์ฌ๋ฃ ๋ฐ๊ฒฌ ๋ถ์ผ foundation model ํ์ฉ ํ์ค์ ๋ถ์ํด, ๋จ๋ฐฑ์ง ์ธ์ด๋ชจ๋ธ์ ์์ฐ์ด์์ ์ฐจ๋ณ์ ์ฑ๋ฅ๊ณผ ์ค์ ์์ฉ์ ๋
ผ์ํ ๋ ์ฐธ๊ณ ๋๋ค.
ํ์ ์ฐ๊ตฌ
Protein Language Models Diverge from Natural Language๋ ๋จ๋ฐฑ์ง ์ธ์ด๋ชจ๋ธ์ ๊ณ ์ ๊ตฌ์กฐ์ ์งํ ์ ๋ณด ์ดํด๋ฅผ ๋ถ์ํด, 3109์ ๋จ๋ฐฑ์ง ๋ณ์ด ์์ธก ์ฐ๊ตฌ๋ฅผ ์ด๋ก ์ ์ผ๋ก ์ฌํํ๋ค.
ํ์ ์ฐ๊ตฌ
๋จ๋ฐฑ์ง ์ธ์ด ๋ชจ๋ธ์ ๋ด๋ถ ๋ฉ์ปค๋์ฆ ํด์์ ๋น๊ต/๋ถ์ํ ๋
ผ๋ฌธ์ผ๋ก, ProtoMech์ ๊ฒฐ๊ณผ์ ์ง์ ์ ์ผ๋ก ์ฐ๊ด๋๋ค.
ํ์ ์ฐ๊ตฌ
Unsupervised protein language models์ ํจํด ํ์ต์ด ์ค์ ์๋ฌผ ๋ฐ์๊ณผ ์ด๋ป๊ฒ ์ฐ๊ฒฐ๋๋์ง ๊ฒ์ฆํด์ฃผ๋ ๋
ผ๋ฌธ์ด๋ค.
์์ฉ ์ฌ๋ก
๋จ๋ฐฑ์ง ์ธ์ด๋ชจ๋ธ์ ๋ด๋ถ ๋ฉ์ปค๋์ฆ ๋ถ์ ์ฐ๊ตฌ๋ก, bidirectional ๋น๊ต์ reverse predictivity์ ์ค์ ์ ์ฉ ์ฌ๋ก๊ฐ ๋๋ค.
๋ฐ๋ก /๋นํ
3221 ๋
ผ๋ฌธ์ ๋จ๋ฐฑ์ง ์ธ์ด ๋ชจ๋ธ๊ณผ ์์ฐ์ด ์ฒ๋ฆฌ ์ธ์ด๋ชจ๋ธ ๊ฐ์ ๋ณธ์ง์ ์ฐจ์ด๋ฅผ ๋ถ์ํ์ฌ, 2196์ ์ ๊ทผ ๋ฐฉ์์ ๋ํ ์ฌํ ํ ๋ก ์ ์ ๊ณตํฉ๋๋ค.
๋ฐ๋ก /๋นํ
๋จ๋ฐฑ์ง ์ธ์ด ๋ชจ๋ธ์ด ์์ฐ ์ธ์ด ๋ชจ๋ธ๊ณผ ๊ทผ๋ณธ์ ์ผ๋ก ๋ค๋ฅธ ํน์ฑ์ ๋ณด์ธ๋ค๋ ์ ์ ๋ฐํ๋ฉฐ, ์ฝ๋ฌผ ํ์ฑ๋จ ์ฐจ ์์ธก์ ํด์ ๋ฐฉ๋ฒ์ ๋นํ์ ์๊ฐ์ ์ ์ํฉ๋๋ค.