Essence
PROTEUS์ ๋ฐ๋ณต์ ๊ฐ์ ํ๋ ์์ํฌ(a)์ ์์ธํ ์์
ํ๋ก์ธ์ค(b). ๋ฐ์ดํฐ ์ค๋ช
, ์ฐ๊ตฌ ๋ชฉํ ๊ณํ, ์ํฌํ๋ก์ฐ ๊ณํ, ๋๊ตฌ ์คํ, ๊ฒฐ๊ณผ ํด์์ ์ํ ๊ตฌ์กฐ
๋ณธ ๋
ผ๋ฌธ์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ํ์ฉํ์ฌ ์๋ณธ ๋จ๋ฐฑ์ง์ฒดํ(proteomics) ๋ฐ์ดํฐ๋ก๋ถํฐ ์๋์ผ๋ก ๊ณผํ์ ๋ฐ๊ฒฌ์ ์ํํ๋ PROTEUS ์์คํ
์ ์ ์ํ๋ค. ์ธ๊ฐ์ ๊ฐ์
์์ด ๊ณ์ธต์ ๊ณํ ์๋ฆฝ, ์๋ฌผ์ ๋ณดํ ๋๊ตฌ ์คํ, ๋ฐ๋ณต์ ๋ถ์ ์ํฌํ๋ก์ฐ ์ ์ ๋ฅผ ํตํด ๊ณ ํ์ง์ ์๋ฌผํ์ ๊ฐ์ค์ ์์ฑํ๋ค.
Evaluation
์ดํ: PROTEUS๋ LLM์ ํ์ฉํ ๋จ๋ฐฑ์ง์ฒดํ ๋ฐ์ดํฐ ๋ถ์ ๋ฐ ๊ฐ์ค ์์ฑ์ ์์ ์๋ํ๋ฅผ ์ฑ๊ณต์ ์ผ๋ก ๊ตฌํํ ํ์ ์ ์์คํ
์ด๋ฉฐ, ํฌ๊ด์ ํ๊ฐ๋ฅผ ํตํด ์ ๋ขฐ์ฑ๊ณผ ์ฐธ์ ์ฑ์ ์
์ฆํ๋ค. ๋ค๋ง ์์ฑ๋ ๊ฐ์ค์ ์คํ์ ๊ฒ์ฆ, ๋ ๋ค์ํ ์๋ฌผํ์ ์์ญ์ผ๋ก์ ํ์ฅ, ๊ทธ๋ฆฌ๊ณ ๊ธฐ์ ์ ์ธ๋ถ์ฌํญ์ ํฌ๋ช
์ฑ ๊ฐ์ ์ด ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ๋๊ตฌ ํ์ฉ ๊ธฐ๋ฐ ์์ด์ ํธ ํ๋ ์์ํฌ ๊ด๋ จ ์์ด๋์ด ๋ฐ ์ํฌํ๋ก์ฐ๊ฐ PROTEUS์ ์๋ ๋จ๋ฐฑ์ง์ฒดํ ๋ถ์์ ๊ตฌ์กฐ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ ๋ฐ๊ฒฌ์ ์ํ ์์จ ์์ด์ ํธ์ ๊ธฐ๋ฐ ๊ฐ๋
์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
704์ SciAgentGym์ ๊ณผํ ์์
์์ LLM ๊ธฐ๋ฐ ํด ์ฌ์ฉ ๋ฒค์น๋งํฌ๋ฅผ ์ ๊ณตํ์ฌ, 131์ PROTEUS ์ํฌํ๋ก์ฐ ์ฑ๋ฅ ํ๊ฐ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ํ์ฑํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
131๋ฒ ๋
ผ๋ฌธ์ ํ๋กํ
์ค๋ฏน์ค ์คํ์ ์๋ํ LLM ์์ด์ ํธ ์ ์ฉ์ ๋ค๋ค, 556๋ฒ MolQuest์ ์ญ๋์ ์คํ ํ๊ฒฝ์์ ์์ด์ ํธ ์ฑ๋ฅ ์ธก์ ์ ๊ธฐ์ด์ ๊ตฌํ ์ฌ๋ก๋ก ์ฐ๊ณ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Automating exploratory proteomics research via language models ๋
ผ๋ฌธ์ ํ
์คํธ ๋ถ์ ๋์ ์ค์ ์๋ช
๊ณผํ ์ฐ๊ตฌ ๋ฐ์ดํฐ(ํ๋กํ
์ค๋ฏน์ค)์ ๋คํธ์ํฌ-๊ธฐ๋ฐ ํ ํฝ๋ชจ๋ธ๋ง์ ์ ์ฉํ ์ค์ฉ์ ์ฌ๋ก๋ก, 929์ ๋ชจ๋ธ ์ ์ฉ ๋ฐฉ์์ ์ฐจ๋ณ์ ์๋๋ฅผ ๋ณด์ฌ์ค๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฌผ์ ๋ณดํ ๋ฐ์ดํฐ ๋ถ์์ ์๋ํํ๋ LLM ๊ธฐ๋ฐ ์์คํ
์ ์ ์ฌํ ์ ๊ทผ ๋ฐฉ์์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง์ฒดํ ๋๋ ์๋ฌผ์ ๋ณดํ ๋ถ์ ์๋ํ์ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฌผ์ ๋ณดํ ์์ญ์์ AI ์์ด์ ํธ๋ฅผ ํ์ฉํ ๊ณผํ์ ๋ฐ๊ฒฌ ์๋ํ์ ๋ ๋ค๋ฅธ ์ ๊ทผ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฌผํ์ ๋ฐ์ดํฐ ๋ถ์ ์๋ํ์ LLM์ ํ์ฉํ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ์ ๋ฐ๊ฒฌ ์๋ํ๋ฅผ ์ํ LLM ์์ด์ ํธ์ ๊ด๋ จ ์ฐ๊ตฌ๋ก ์ ์ฌํ ๋ชฉํ๋ฅผ ๊ณต์ ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ช
๊ณผํ ๋ถ์ผ์ ์คํ์ ๋ฐ์ดํฐ ๋ถ์ ์๋ํ์ LLM ์ ํ์ฉํ ๋๋ค๋ฅธ ์ ๋ชฉ ์ฌ๋ก๋ก, ํ๋์ ๊ฒฝ๊ณผํ ์ธ ๋ฐ์ด์ค ๋ถ์ผ๋ก ํ์ฅ ์ฌ๋ก๋ฅผ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง ๋์ฌ์ฒด ๋ฑ ์๋ช
๊ณผํ ์คํ์์ ๋ฉํฐ์์ด์ ํธ LLM ๊ธฐ๋ฐ ์๋ํ ์ฐ๊ตฌ๊ฐ ์ด๋ป๊ฒ ์ด๋ฃจ์ด์ง๋์ง ๋์์ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
131 ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ํ๋กํ
์ค๋ฏน์ค ์ฐ๊ตฌ ์๋ํ๋ฅผ ๋ค๋ฃจ์ด, 3043๊ณผ ๊ฐ์ด ๋๊ตฌ ๋ฐ ํ
์คํธ์์ ๋ฐ์ดํฐ ์ถ์ถ ๋ฐฉ๋ฒ์ ๋น๊ตํ ๋งํ๋ค.
ํ์ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ๋จ๋ฐฑ์ง ์ค๊ณ ๋ฐ ํ์ ๊ธฐ๋ฅ ํ์ ํ๋ ์์ํฌ๋ก, PROTEUS์ ๋ฐ์ดํฐ ๋ถ์ยท์๋ฌผ์ ๋ณด ๋๊ตฌ ์ ์ฉ์ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์์ฉ์ผ๋ก ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์ธ์ด๋ชจ๋ธ์ ํ์ฉํด ํ๋กํ
์ค๋ฏน์ค ์ฐ๊ตฌ์ ์ ์ฉํ์ฌ, ๊ฐ์ธํ ์๋ฃ์ ์์์ ๋ค์ค๋๋ฉ์ธ ์ฐ๊ตฌ ์๋ํ๋ก ํ์ฅ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
131์ LLM์ ํ์ฉํด ์คํ์ ๋จ๋ฐฑ์ง์ฒด ์ฐ๊ตฌ๋ฅผ ์๋ํํ๋ฉฐ, 118์ ๋ก๋ด ์กฐ์ ์๋ฎฌ๋ ์ด์
ํ๋ ์์ํฌ๊ฐ ์ค์ ๊ณผํ ์ํฌํ๋ก์ฐ์ ์ ์ฉ๋ ์ฌ๋ก์
๋๋ค.
์์ฉ ์ฌ๋ก
238์ citation generation tool์ 131์ ๋๊ท๋ชจ ๋ฐ๊ฒฌ ํ์ดํ๋ผ์ธ์์ ์๋ ๋ฌธํ๊ท์ ๋ฐ ์ธ์ฉ ์์ฑ๊ณผ ์ง์ ์ ์ผ๋ก ์ฐ๊ณ ์ ์ฉ๋ ์ ์์ต๋๋ค.
์์ฉ ์ฌ๋ก
Automating exploratory proteomics research via language models ๋
ผ๋ฌธ์ SciKnowEval๊ฐ์ ๋ฒค์น๋งํฌ ์์์ LLM ๋ชจ๋ธ์ ์ค์ ์๋ช
๊ณผํ/๋จ๋ฐฑ์ง ์์ญ ์ง์ ๊ฐ๋ฅ์ฑ์ ์ ์ํฉ๋๋ค.
์์ฉ ์ฌ๋ก
LLM์ ํ์ฉํ ์์ด๋์ด ๋ฐ๊ตด ๋ฐ ํํ์ ์ฐ๊ตฌ ์๋ํ์ ์ค์ ์ ์ฉ ์์๋ก ์ฐ๊ฒฐ๋ฉ๋๋ค.