Essence
ChemCrow๋ GPT-4์ 18๊ฐ์ ํํ ์ ๋ฌธ๊ฐ ๋๊ตฌ๋ฅผ ํตํฉํ์ฌ ํฉ์ฑ ๊ณํ, ์ฝ๋ฌผ ๋ฐ๊ฒฌ, ์ฌ๋ฃ ์ค๊ณ ๋ฑ ๋ค์ํ ํํ ์์
์ ์๋์ผ๋ก ์ํํ ์ ์๋ LLM ํํ ์์ด์ ํธ์ด๋ค. ์ด ์์คํ
์ ๊ณค์ถฉ ๊ธฐํผ์ ์ ์ ๊ธฐ์ด๋งค ํฉ์ฑ์ ์์จ์ ์ผ๋ก ์คํํ๊ณ ์๋ก์ด ์์์ฒด ๋ฐ๊ฒฌ์ ์ฃผ๋ํ์ฌ, ๊ณ์ฐ ํํ๊ณผ ์คํ ํํ ์ฌ์ด์ ๊ฒฉ์ฐจ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ฐ๊ฒฐํ๋ค.
Evaluation
์ดํ: ChemCrow๋ LLM์ ํํ ๋๊ตฌ์ ์ฒด๊ณ์ ์ผ๋ก ํตํฉํ์ฌ ์์จ์ ํฉ์ฑ ์คํ๊ณผ ์ ์ฝ ๋ฐ๊ฒฌ์ ์คํํ ํ๊ธฐ์ ์ธ ์์
์ผ๋ก, ํํ ์๋ํ ๋ถ์ผ์ ๋ช
ํํ ์ง์ ์ ๋ณด์ฌ์ค๋ค. ๋ค๋ง ํ๊ฐ ๋ฐฉ๋ฒ๋ก ์ ํ์คํ์ ๋ค์ํ ํํ ๋๋ฉ์ธ์ผ๋ก์ ํ์ฅ์ฑ ๊ฒ์ฆ์ด ํฅํ ๊ณผ์ ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
115๋ LLM์ ํํ๋๊ตฌ ์ฆ๊ฐ ์ ๋ต์ ๊ฐ๋
์ ๊ธฐ๋ณธ๊ธฐ๋ฅผ ์ ์ํด, 176์์์ ๋๊ตฌ-์์ด์ ํธ ์ตํฉ ์ค๊ณ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
115๋ LLM ๊ธฐ๋ฐ ํํํด ์ฆ๊ฐ ๊ธฐ๋ฒ ์ ๋ฐ์ ์ ๋ฆฌํ์ฌ, 214์ ChemToolAgent ์ค๊ณ์ ๊ฐ๋
์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
115(ChemCrow)๋ LLM ๊ธฐ๋ฐ ํํ ์์ด์ ํธ ์ํคํ
์ฒ์ ์ด๊ธฐ ์ฌ๋ก๋ก, DrugAgent(290)์ ์ ์ฝ๋ฐ๊ฒฌ ์๋ํ ํ๋ ์์ํฌ์ ์ด๋ก ์ ยท๊ตฌํ์ ๊ธฐ๋ฐ์
๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
115 ๋
ผ๋ฌธ์ LLM์ ํํ ์ถ๋ก ๋ฅ๋ ฅ ๊ฐ์ ์ ์ํ ์ธ๋ถ ๋๊ตฌยท๋ฐ์ดํฐ ํ์ฉ ์ ๋ต์ ๋ชฉ์ ์ผ๋ก, 209์ ์๊ธฐ๊ฐฑ์ ๋ฉ๋ชจ๋ฆฌ์ ๋ณด์กฐ์ ๋ฐฉ์์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Augmenting large language models with chemistry tools ๋
ผ๋ฌธ์ ํํ ๋๋ฉ์ธ ํนํ ๋๊ตฌ ์ฌ์ฉ์ ํตํ LLM ํฅ์์ ์ง์คํ์ฌ ether0 ๋ชจ๋ธ ํ๋ จ ์ ๋ต์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Augmenting large language models with chemistry tools ๋
ผ๋ฌธ(ChemCrow)์ LLM์ ๋ค์ ํํ ๋๊ตฌ๋ฅผ ๊ฒฐํฉํ์ฌ ์ฝ๋ฌผ ์ค๊ณ์ ๋ถ์ ์๋ํ๋ฅผ ์คํํ๋ฉฐ, TxAgent์ ๋ค๋จ๊ณ ์ถ๋ก ยท๋๊ตฌ ํตํฉ ์ ๊ทผ์ ๊ธฐ์ ์ ํ ๋๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
ํํ ๋๊ตฌ์ LLM ํตํฉ์ ์ด๋ก /๋ฐฉ๋ฒ๋ก ๊ธฐ์ด๋ฅผ ์ ๊ณตํ์ฌ LLM ๊ธฐ๋ฐ ๊ณ ์ํธ๋กํผ ์ด๋งค ํ์ ํ๋ ์์ํฌ์ ๊ทผ๊ฐ์ด ๋จ.
๋ค๋ฅธ ์ ๊ทผ
ChemCrow์ ์ ์ฌํ๊ฒ, ChemCrow ๋
ผ๋ฌธ๊ณผ ๋ณ๋์ ChemAgent ๋
ผ๋ฌธ๋ LLm ๊ธฐ๋ฐ ํํ ์ง์ ์
๋ฐ์ดํธ ์์ด์ ํธ ๊ตฌ์กฐ๋ฅผ ์ ์ํ์ฌ ๋๊ตฌ ํ์ฉ์ ๋ค๋ฅธ ์ ๊ทผ์ ๋ณด์ฌ์ค๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ๊ธฐ๋ฐ ์์จ ํํ ์คํ ์ค๊ณ ๋ฐ ์คํ ์์คํ
์ ์ ์ฌํ ์ ๊ทผ ๋ฐฉ์์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
CACTUS ๋
ผ๋ฌธ๋ ์ฌ๋ฌ ํํ ๋๊ตฌ๋ค๊ณผ LLM์ ์ฐ๊ฒฐํด ๊ณผํ์ ์ถ๋ก ๊ณผ ์คํ์๋ํ๋ฅผ ์๋ํ์ฌ, ChemCrow ์์คํ
๊ณผ ์ฑ๋ฅยท์ค๊ณ ์ธก๋ฉด์์ ๋น๊ต ๊ฐ์น๊ฐ ํฌ๋ค.
๋ค๋ฅธ ์ ๊ทผ
115๋ ํํ ๋๋ ๊ณผํ ๋ถ์ผ๋ฅผ ์ํ ๋ค๋ฅธ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ ๋๋ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ์ ์ํ์ฌ ChemDFM๊ณผ ๋์์ ์ผ๋ก ๋น๊ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ๋ถ์ ์ต์ ํ ๋๋ ํํ ๊ณต๊ฐ ํ์์ ํ์ฉํ๋ ์ ์ฌํ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํํ ๋ฐ ์ฌ๋ฃ ์ค๊ณ์ AI๋ฅผ ์ ์ฉํ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง ๊ณตํ์ ์ํ ์์ฑ ๋ชจ๋ธ์ ๋ค๋ฅธ ์ํ๋ง ์ ๋ต์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ ์ฝ ์กฐ๊ฑด ๊ธฐ๋ฐ ๋ถ์ ์์ฑ์ ์ํ ๋ค๋ฅธ ๋ฅ๋ฌ๋ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
Augmenting large language models with chemistry tools ๋
ผ๋ฌธ์ LLM๊ณผ ํํ ๋๊ตฌ ํตํฉ์ ํตํ ์ ์ฝ ์ค๊ณ ๋ฐฉ์์ ๋ ๋ค๋ฅธ ๊ตฌํ์ ๋ค๋ฃจ์ด, ์์จ์ ํ์ฑ ์์ธก ์ ๊ทผ๋ฒ์ ๋์์ ์๊ฐ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ฝ๋ฌผ ๋ฐ๊ฒฌ์ ์ํ ๋ถ์ ๋ฌผ์ฑ ์์ธก์ LLM์ ํ์ฉํ๋ ์ ์ฌํ ์ ๊ทผ๋ฒ์ ๋ค๋ฃจ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ๋ถ์ ๋ฌผ์ฑ ์์ธก ๋ฐ ํํ ์ถ๋ก ์ ์ ์ฉํ๋ ์ ์ฌํ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ํํ ํฉ์ฑ ๊ณํ ๋ฐ ์ถ๋ก ์ ์ ์ฉํ๋ ์ ์ฌํ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
ํํ ๋๊ตฌ ํ์ฅ LLM ์ ๊ทผ(115)์ 304์ ๊ทธ๋ํ ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ ๋ถ์ ์์ธก๊ณผ ๊ทผ๋ณธ์ ์ผ๋ก ๋ค๋ฅธ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ ๊ธฐ๋ฐ ์ ๊ทผ์ ๋ณด์ฌ์ค๋ค.
ํ์ ์ฐ๊ตฌ
ํํํฉ์ฑ ์๋ํ ํ๋ซํผ์ ํน์ ๋จ๊ณ(์: ๋ฐ์ ์์ธก ๋๋ ๊ท๋ชจ ํ๋)๋ฅผ ์ฌํ ์ฐ๊ตฌํ๋ค.
ํ์ ์ฐ๊ตฌ
115๋ฒ ๋
ผ๋ฌธ์ LLM์ ์ค์ ํํ ๋๊ตฌ๋ฅผ ์ ๋ชฉ์ํค๋ ์ ๋ต์ ๋ค๋ฃจ์ด, OSDA Agent์ ๊ณ์ฐํํ ๊ฒฐํฉ ๋ฐฉ์๊ณผ ์ด์ด์ง๋๋ค.
ํ์ ์ฐ๊ตฌ
TxAgent๋ ChemCrow์ ๋ค์ค ํํ ๋๊ตฌ-LLM ํตํฉ ๊ฐ๋
์ ๋ฐ์ด์ค์์ฝ ๋ฐ ์์ ์ ๋ณด ๊ธฐ๋ฐ ์ ๋ฐ ์น๋ฃ ๋ถ์ผ๋ก ํ์ฅํ์ฌ ์ ์ฉํ๋ค.
ํ์ ์ฐ๊ตฌ
ํํ ๋๊ตฌ์ LLM์ ๊ฒฐํฉํ ์ ๊ทผ๋ฒ์ด ๋ํนยท์ฌ๋ญํน์ ์ด๋ป๊ฒ ํ์ฉ๋ ์ ์์์ง ๋
ผ์ํ๋ ์ค์ฉ์ ๋งฅ๋ฝ์ ์ ๊ณตํฉ๋๋ค.
์์ฉ ์ฌ๋ก
LLM ๊ธฐ๋ฐ ๋ํธํํธ ๋ฐ๊ฒฌ ์ต์ ํ ๋
ผ๋ฌธ์ ChemCrow ์ ๊ทผ๋ฒ์ ์ค์ ์์ฉ ์ฌ๋ก๋ก, ์๋ก์ด ํํ์ ์ธ์ฌ์ดํธ ์คํ ์ฌ๋ก๋ฅผ ์ฐธ๊ณ ํ ์ ์๋ค.