Essence
๋จ๋ฐฑ์ง ๊ณตํ ๋ถ์ผ์ ํนํ๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM) ๊ธฐ๋ฐ ์๋ํ ๋จธ์ ๋ฌ๋(AutoML) ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ, ๋ฅ๋ฌ๋ ์ ๋ฌธ ์ง์์ด ์๋ ์๋ฌผํ์๋ค๋ ์์ฐ์ธ์ด๋ก ๋จ๋ฐฑ์ง ์์ง๋์ด๋ง ์์
์ ์ํํ ์ ์๋๋ก ํ ํ์ ์ ์์คํ
์ด๋ค.
Evaluation
Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4.5/5 Overall: 4.2/5
์ดํ: AutoProteinEngine์ LLM ๊ธฐ๋ฐ ์๋ํ๋ฅผ ํตํด ๋จ๋ฐฑ์ง ๊ณตํ์์ ๊ณ์ฐ ์ ๋ฌธ์ฑ์ ์ง์
์ฅ๋ฒฝ์ ํ๊ธฐ์ ์ผ๋ก ๋ฎ์ถ ํ์ ์ ์์คํ
์ด๋ค. ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ ์ฒ๋ฆฌ์ ์๋ํ๋ HPO๋ ๊ฐ์ ์ด๋, ํ์ ๋ ์คํ ๊ฒ์ฆ๊ณผ LLM ์ ๋ขฐ์ฑ ์ด์๊ฐ ํ์ฅ ๋์
์ ๊ณผ์ ๋ก ๋จ์ ์๋ค. ๋ ๊ด๋ฒ์ํ ๋จ๋ฐฑ์ง ์์ง๋์ด๋ง ์์
์ ๋ํ ๊ฒ์ฆ๊ณผ ์คํ์ค ํ์
์ฌ๋ก๊ฐ ์ถ๊ฐ๋๋ฉด ํ๋ฌธ์ ยท์ฐ์
์ ์ํฅ๋ ฅ์ด ๋ํญ ์์นํ ๊ฒ์ผ๋ก ๊ธฐ๋๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Leveraging biomolecule and natural language through multi-modal models ๋
ผ๋ฌธ์ ๋จ๋ฐฑ์ง ์ธ์ด๋ชจ๋ธ ์ค๊ณ์ ์๋ฌผํ ์์
์ ์ฐ๊ณ๋ฅผ ์ค์ ์ ์ผ๋ก ์ค๋ช
ํ์ฌ AutoProteinEngine์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Scientific Large Language Models ๋
ผ๋ฌธ์ ์๋ฌผํ ๋ฐ ํํ ๋ถ์ผ๋ฅผ ํฌํจํ ๊ณผํ LLM์ ๋ํฅ์ ์ ๋ฆฌํ์ฌ AutoProteinEngine์ ๋ฐฐ๊ฒฝ ์ด๋ก ์ ๋์์ ์ค๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
144๋ฒ ๋
ผ๋ฌธ์ ๋จ๋ฐฑ์ง ๋ฐ์ธ๋ฉ ๋ถ์ ์์ธก์ ์ํ LLM ๊ธฐ๋ฐ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฏ๋ก, 3104์์ ํ์ฅ๋ fitness benchmark ์ค๊ณ์ ๋ฐฐ๊ฒฝ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
144๋ฒ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง ์ค๊ณ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฏ๋ก, 3090์์ method-agnostic ๋ฐฉ์ ํตํฉ ๋ฐ ํ์คํ ๋ชฉ์ ์ ๊ธฐ์ด๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
AutoProteinEngine(144)์ LLM ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง ์์ง๋์ด๋ง ์ํฌํ๋ก์ฐ ์ค๊ณ์ ๊ธฐ์ ์ ํ ๋๋ฅผ ๋ง๋ จํด ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
144๋ LLM์ ๋จ๋ฐฑ์ง ์ค๊ณ ๋ฑ ์๋ช
๊ณผํ ๊ณต์ ์๋ํ์ ์ ์ฉํ ๋ฐ๋ฉด, 239๋ CRISPR ์คํ ์ค๊ณ์ ํนํ๋์ด ์์ผ๋, ์ ๊ทผ์ ์ ์ฌํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฌผํ ๋๋ฉ์ธ์์์ LLM ์์ด์ ํธ ์๋ํ์ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฌผ์ ๋ณดํ ๋ถ์ผ AI ์๋ํ๋ฅผ ์ํ LLM ์์ด์ ํธ์ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
AutoML๊ณผ ๋๋ฉ์ธ ํนํ ๊ณผํ ์์
์๋ํ์ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
GeneAgent๋ ์ ์ ์ ์ธํธ ๋ถ์์ ์ํ ์
ํ-๊ฒ์ฆ ์์ด์ ํธ๋ก, ๋จ๋ฐฑ์ง/์๋ฌผํ์ ์ํ์ค ๋ถ์ผ์์ AutoProteinEngine๊ณผ ๋ค๋ฅธ ์ ๊ทผ์ผ๋ก ์๋ํ๋ ๊ณผํ ์คํ์ ์ง์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
BioAgents ๋
ผ๋ฌธ์ ๋ค์ค ์์ด์ ํธ LLM์ผ๋ก ์๋ช
์ ๋ณด ๋ถ์์ ๋ฏผ์ฃผํํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ์ฌ AutoProteinEngine๊ณผ ๋์ผํ ๋๋ฉ์ธ์์ ๋์ฒด์ ์ ๊ทผ์ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Agentic End-to-End De Novo Protein Design ๋
ผ๋ฌธ์ ๋จ๋ฐฑ์ง ๋์์ธ ์๋ํ์ ์ด์ ์ ๋ง์ถ์ด, AutoProteinEngine์ LLM ๊ธฐ๋ฐ ์๋ํ ์ ๊ทผ๊ณผ ๋น๊ต์ ๊ด์ ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
AutoProteinEngine ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง/์ ์ ์ฒด ์ค๊ณ ํ๋ ์์ํฌ๋ฅผ ๋ค๋ฃจ๋ฉฐ, ATGC-Gen๊ณผ ์ ์ฌํ ๊ตฌ์กฐ์ ์์ฑ ์์
์ ๋ ๋ค๋ฅธ ๊ตฌํ ์ฌ๋ก์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง ์์ง๋์ด๋ง์ ์ํ LLM ๊ธฐ๋ฐ agent ์ค๊ณ ๋ฐ ์คํ ํ๋ ์์ํฌ๋ก, ๋ค์ค ์์ด์ ํธ ์คํ ์๋ํ์ ์๋ฌผํ์ ์ฌ๋ก์.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง ์ธ์ด ๋ชจ๋ธ์ ๋ด๋ถ ๋ฉ์ปค๋์ฆ ๋ถ์์ ๋ํ ๋์์ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
144๋ LLM ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง ์์ง๋์ด๋ง ์์ด์ ํธ ํ๋ ์์ํฌ๋ก, 3133์ sampling/engineering trade-off ๊ฒฐ๊ณผ๋ฅผ ์คํ์ ๊ด์ ์์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
144๋ LLM ๊ธฐ๋ฐ์ ๋จ๋ฐฑ์ง ์์ง๋์ด๋ง ํ๋ ์์ํฌ๋ก, 3150์ ํญ์ฒด ์ค๊ณ ์๋ํ์ ๋๊ตฌ/์์จ์ฑ ๋น๊ต์ ์ ์ฉํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ ๋ค ๋จ๋ฐฑ์ง ์ค๊ณ ์๋ํ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ง๋ง, MOGP-MMF๋ ์ ์ ํ๋ก๊ทธ๋๋ฐ ๊ธฐ๋ฐ ๋ค์ค ๋ชฉ์ ์ผ๋ก, AutoProteinEngine์ LLM์ ํ์ฉํ ์ ๊ทผ์ด๋ผ ๋ฐฉ๋ฒ๋ก ์ด ์์ดํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
144 ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง/๋ฆฌ๊ฐ๋ ์ค๊ณ ํ๋ ์์ํฌ๋ฅผ ์์คํ
์ ์ผ๋ก ๋ค๋ฃฌ๋ค๋ ์ ์์, 3044์ ์ํฌํ๋ก ๊ธฐ๋ฐ ํตํฉ ์ ๊ทผ๊ณผ ๋น๊ตํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
REINVENT ์ธ์๋ LLM ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง/๋ถ์ ์์ฑ ํ๋ ์์ํฌ๋ฅผ ํ์ฉํ ๋ค์ํ fine-tuning ์ฌ๋ก์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ
์คํธ์ ๊ทธ๋ํ ๋คํธ์ํฌ๋ฅผ ๊ฒฐํฉํ์ฌ ์๋ฌผํ์ ์ํธ์์ฉ์ ์์ธกํ๋ ๋์์ ์ ๊ทผ๋ฒ์ด๋ค
ํ์ ์ฐ๊ตฌ
ProtAgents ์ญ์ ๋ค์ค์์ด์ ํธ LLM ๊ธฐ๋ฐ์ ๋จ๋ฐฑ์ง ํ์ ํ๋ ์์ํฌ๋ก, ๋จ๋ฐฑ์ง ์์ง๋์ด๋ง ๋ถ์ผ์ ๋ํ ํ๋์ ๊ด์ ์ ์ ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง ์ค๊ณ ๋ฐ ํ์ ๊ธฐ๋ฅ ํ์ ํ๋ ์์ํฌ๋ก, PROTEUS์ ๋ฐ์ดํฐ ๋ถ์ยท์๋ฌผ์ ๋ณด ๋๊ตฌ ์ ์ฉ์ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์์ฉ์ผ๋ก ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง ์ค๊ณ ์๋ํ ํ๋ ์์ํฌ๋ก, 19-์๋ฏธ๋
ธ์ฐ ์ค๊ณ ์ฌ๋ก๋ฅผ ํ์ฅ ์ ์ฉํ ์ ์๋ ํ๋ฆ์ ์ ์ํฉ๋๋ค.
์์ฉ ์ฌ๋ก
AutoProteinEngine์ ์๋ช
๊ณผํ ๋ถ์ผ์ ์ํ์ค ๊ธฐ๋ฐ ์์ง๋์ด๋ง์ ์ง์คํ์ฌ, CASSIA์ ํด์๊ฐ๋ฅ ์ธํฌ์ฃผ์ ํ๋ ์์ํฌ์ ์ค์ ๋ถ์ผ๋ณ ์ ์ด ๊ฐ๋ฅ์ฑ์ ์กฐ๋ช
ํ๋ค.