Essence
Figure 1: Raw vs. SALI-normalized position sensitivity across six protein families and model ablations. Top row (raw sen
ChEMBL์ 2,500๋ง ๋ถ์ ์ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ฝ๋ฌผ ๋ถ์์์ ๋ฏธ์ธํ ๊ตฌ์กฐ ๋ณํ๊ฐ ํฐ ํ์ฑ ๋ณํ๋ฅผ ์ผ๊ธฐํ๋ ์์น๋ฅผ ์์ธกํ๋ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ๊ฐ๋ฐํ์ฌ, ์์จ ์์ฝํํ์ ์ด๊ธฐ ํ์ ํจ์จ์ 2๋ฐฐ ํฅ์์์ผฐ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ์ด ๋
ผ๋ฌธ์ 2,500๋ง ๊ฐ ๋ถ์ ์์ผ๋ก ๋๊ท๋ชจ ๊ฒ์ฆํ ์ฒซ position-level activity cliff ์์ธก ์์คํ
์ ์ ์ํ๋ฉฐ, SALI normalization์ ํ์์ฑ์ ์
์ฆํ๊ณ target-agnostic 3D context ์ธ์ฝ๋ฉ์ผ๋ก ๋ฐ์ด๋ ์ผ๋ฐํ๋ฅผ ๋ฌ์ฑํ๋ค. ์ ๋ณด ๋์ค์ ๋ํ ์ฒด๊ณ์ ๋์, ์์ ๊ฒฐ๊ณผ์ ํฌ๋ช
ํ ๋ณด๊ณ , ์ค์ ๋ฐฐํฌ ๊ฐ๋ฅํ ๋๊ตฌ ์ ๊ณต์ผ๋ก ์ฝ๋ฌผ ๋ฐ๊ฒฌ ์๋ํ์ ์ค์ง์ ์ง์ ์ ์ด๋ฃจ์๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ฝ๋ฌผ-์ง๋ณ ์ํธ์์ฉ ๋ฐ SAR ์์ธก์ ์ํ ๋์กฐํ์ต ๊ธฐ๋ฐ ํ๋ ์์ํฌ๋ฅผ ๋์
ํ์ฌ, ๋ถ์ ํ์ฑ ์์ธก ์ฐ๊ตฌ์ ํต์ฌ ์ด๋ก ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ ๋ถ์ผ LLM ํ์ฉ์ ๋ํ ํฌ๊ด์ ์๋ฒ ์ด๋ก, ์ฝ๋ฌผ ํน์ฑ ์์ธก ๋ฐ ์์ฑํ ๋ชจ๋ธ ์ฌ์ฉ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ธ์ฒด 2D ํฌ์ฆ ์ถ์ ์ ์ํ ์์น ๊ธฐ๋ฐ ํธํฅ ๋ฐฉ๋ฒ์ผ๋ก, ๋ฏธ์ธ๊ตฌ์กฐ ๋ณํ๊ฐ ๋ถ์ ๋์์ ๋ฏธ์น๋ ์ํฅ ์์ธก์ ๋ฌผ๋ฆฌ์ ๊ตฌ์กฐ์์ ์ฐจ์ฉํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Augmenting large language models with chemistry tools ๋
ผ๋ฌธ์ LLM๊ณผ ํํ ๋๊ตฌ ํตํฉ์ ํตํ ์ ์ฝ ์ค๊ณ ๋ฐฉ์์ ๋ ๋ค๋ฅธ ๊ตฌํ์ ๋ค๋ฃจ์ด, ์์จ์ ํ์ฑ ์์ธก ์ ๊ทผ๋ฒ์ ๋์์ ์๊ฐ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ถ์ ๊ตฌ์กฐ์์ ํ๋์ฑ ์์ธก์ ๋ฅ๋ฌ๋ยท์ธ์ด๋ชจ๋ธ ๊ธฐ๋ฐ ์ ๊ทผ์ผ๋ก ๋ค๋ฃจ์ด activity cliffs ์์ธก ํ๋ ์์ํฌ์ ์ง์ ๋น๊ตํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ถ์ ํน์ฑ ์์ธก์ ๊ดํ ๋ฅ๋ฌ๋ ๋ฒค์น๋งํฌ ๋
ผ๋ฌธ์ผ๋ก, ์๋ก ๋ค๋ฅธ ๋ฐ์ดํฐ์ ๋ฐฉ๋ฒ๋ก ์ ๋น๊ตํ๋ฉฐ ๋
๋ฆฝ์ ์ธ ๊ด์ ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ๊ธฐ๋ฐ ํํ์ ์ฌ๊ณ ๋ ฅ ์ฆ์ง์ ํตํด ํฉ์ฑ ๊ฒฝ๋ก ๋ฐ SAR ์ฐ๊ตฌ๋ฅผ ์ง์ํ๋ ๋ฐฉ๋ฒ์ ์๊ฐํด, ํ๋ ์ ๋ฒฝ ์์ธก๊ณผ ๋์กฐ๋๋ ์ ๊ทผ์ด๋ค.
ํ์ ์ฐ๊ตฌ
LMM ๊ธฐ๋ฐ ํํ์ ๊ตฌ์กฐ ํ์ ๊ณต๊ฐ์์ ํจ์จ์ ํ์ ์ ๋ต์ ์ ์ํ์ฌ, activity cliffs ๊ฒฐ์ ์ ๋ณ์ด์ ํ์ ํจ์จ ํฅ์ ๊ฒฐ๊ณผ์ ์ฐ๊ณ๋๋ค.
๋ฐ๋ก /๋นํ
๋จ๋ฐฑ์ง ์ธ์ด ๋ชจ๋ธ์ด ์์ฐ ์ธ์ด ๋ชจ๋ธ๊ณผ ๊ทผ๋ณธ์ ์ผ๋ก ๋ค๋ฅธ ํน์ฑ์ ๋ณด์ธ๋ค๋ ์ ์ ๋ฐํ๋ฉฐ, ์ฝ๋ฌผ ํ์ฑ๋จ ์ฐจ ์์ธก์ ํด์ ๋ฐฉ๋ฒ์ ๋นํ์ ์๊ฐ์ ์ ์ํฉ๋๋ค.