Essence
Figure 1: Our ChemToolAgent framework. Upon receiv-
ChemToolAgent๋ 29๊ฐ์ ๋๊ตฌ๋ฅผ ํตํฉํ ํํ ๋ฌธ์ ํด๊ฒฐ LLM ์์ด์ ํธ์ด๋ฉฐ, ์ ๋ฌธํ๋ ์์
์์๋ ๋๊ตฌ ์ฆ๊ฐ์ ํจ๊ณผ๊ฐ ์์ง๋ง ์ผ๋ฐ ํํ ๋ฌธ์ ์์๋ ๊ธฐ๋ณธ LLM์ ๋ฅ๊ฐํ์ง ๋ชปํจ์ ๋ณด์ฌ์ค๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ChemToolAgent๋ ๋๊ตฌ ์ฆ๊ฐ ์์ด์ ํธ์ ์ฅ๋จ์ ์ ๋ช
ํํ ๊ท๋ช
ํ ์ค์ํ ์ค์ฆ์ ์ฐ๊ตฌ์ด๋ฉฐ, ๋๊ตฌ๊ฐ ํญ์ ์ฑ๋ฅ์ ๊ฐ์ ํ์ง ์๋๋ค๋ ๋ฐ์ง๊ด์ ๋ฐ๊ฒฌ์ ํฅํ ํํ LLM ์์ด์ ํธ ์ค๊ณ์ ์ค์ํ ํจ์๋ฅผ ์ ๊ณตํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
ReAct๋ ํด ์ฌ์ฉ ๋ฅ๋ ฅ์ ์ฆ๊ฐ์ํค๋ LLM ์ค๊ณ ๋ฐฉ์์ผ๋ก, ChemToolAgent์ ๋๊ตฌ์ฆ๊ฐ ์ ๊ทผ์ ํต์ฌ์ ์ธ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
115๋ LLM ๊ธฐ๋ฐ ํํํด ์ฆ๊ฐ ๊ธฐ๋ฒ ์ ๋ฐ์ ์ ๋ฆฌํ์ฌ, 214์ ChemToolAgent ์ค๊ณ์ ๊ฐ๋
์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
ChemToolAgent ๋
ผ๋ฌธ์ ๋๊ตฌ ํ์ฉ ์ค์ฌ์ LLM ์์ด์ ํธ ์ค๊ณ์ ํผ๋๋ฐฑ-๊ธฐ๋ฐ ์์ฑ ํ๊ฐ๋ฅผ ์คํํ์ฌ Paper2Web์ ๋ฐ๋ณต ๊ฐ์ ํ ์์ด์ ํธ ์ค๊ณ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
214๋ ํํ reasoning์์ LLM์ ํด ํ์ฉ์ด ๊ตฌ์กฐ์ reasoning ํฅ์์ ์ด๋ป๊ฒ ๊ธฐ์ฌํ๋์ง ๋ค๋ฃจ๋ฉฐ, 3172์ ๋
ผ์ฆ์ ํ๋ ์์ํฌ ์ด๋ก ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
CLAM์ LLM ์ง์ ๋ถ์ ํ์ฑ ํด๊ฒฐ์ด๋ผ๋ ๋ค๋ฅธ ๋์ ์ ๋ฌธ์ ์ ์ ๊ทผํ์ง๋ง, LLM์ tool-use๋ ์ํธ ์์ฉ ๊ด์ ์์ ๋ด์ฉ์ด ์ํธ๋ณด์์ ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Chemist-X ์ญ์ ํํ ๋ฌธ์ ํด๊ฒฐ์ LLM ๊ธฐ๋ฐ ์์ด์ ํธ๋ฅผ ํ์ฉํ์ง๋ง, ๋๊ตฌ ๋ฐ ์ํฌํ๋ก์ฐ์ ์ ๊ทผ ๋ฐฉ์์์ ์ฐจ๋ณ์ฑ์ ๋ณด์ธ๋ค.
๋ค๋ฅธ ์ ๊ทผ
210 ๋ํ LLM์ ํํ ๋๊ตฌ ์ ๋ชฉ ์์ด์ ํธ๋ฅผ ์ ์ํ์ง๋ง, ๋ฌธ์ ์ ๊ทผ ๋ฐ ๋๊ตฌ์ ํตํฉ ๋ฐฉ์์ด 214์ ๊ตฌ๋ณ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
214 ๋
ผ๋ฌธ์ 138๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก LLM ๊ธฐ๋ฐ ํํ ํฉ์ฑ ๋ฐ ์คํ ์๋ํ๋ฅผ ์งํฅํ์ง๋ง, ์ฌ์ฉ ๋๊ตฌ ๋ฐ ๋ฒค์น๋งํฌ ํ๊ฒฝ์ด ์์ดํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
214๋ ์ฌ๋ฌ ํํ ๋๊ตฌ๋ฅผ ํตํฉํด์ ๋ฌธ์ ๋ฅผ ํธ๋ ์์ด์ ํธ๋ก 176์ ํ๋ ์์ํฌ์ ํ์ฅ๋ ์ ์ฉ์ฌ๋ก๋ผ๊ณ ๋ณผ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
Modular large language model agents for multi-task computational chemistry ๋
ผ๋ฌธ์ ๋ค์ํ ํํ ์์
์์ ๋ชจ๋ํ ๋๊ตฌ ํ์ฅ์ ํ๊ตฌํ๋ค.
์์ฉ ์ฌ๋ก
LLM Agent ๊ธฐ๋ฐ ํํ ๋ฐ์ ์๋ฎฌ๋ ์ด์
๋ฐ ์ ํ ์์ธก ํด(214)์ด ์ค์ ๋ก BOS-Lig dataset์ ํ์ฉ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค๋ค.