Essence
Figure 1: Hierarchical ReAct agent planning in LLaMP. Two levels of agents are deployed using a
LLaMP๋ ๊ณ์ธต์ ReAct ์์ด์ ํธ ๊ธฐ๋ฐ multimodal RAG ํ๋ ์์ํฌ๋ก, Materials Project์ atomistic simulation ๋๊ตฌ๋ฅผ ํ์ฉํ์ฌ LLM์ hallucination์ ์ค์ด๊ณ ์ฌ๋ฃ๊ณผํ ๋ถ์ผ์์ ๋์ ์ ๋ขฐ๋์ ์ง์ ๊ฒ์๊ณผ ๋ณต์กํ ์์
์ ์ํํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: LLaMP๋ ๊ณ์ธต์ ReAct ์์ด์ ํธ์ domain-specific data source๋ฅผ ๊ฒฐํฉํ์ฌ ๊ณผํ ๋ถ์ผ์์ LLM์ hallucination ๋ฌธ์ ๋ฅผ ์ค์ง์ ์ผ๋ก ์ํํ๋ ์ค์ฉ์ ์ด๊ณ ํ์ ์ ์ธ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, materials informatics์์์ ๊ตฌ์ฒด์ ์ฑ๊ณผ๋ก scientific AI์ ์ ๋ขฐ์ฑ ํฅ์์ ์ค์ํ ๊ธฐ์ฌ๋ฅผ ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ ๋๋ฉ์ธ LLMยท๋ฉํฐ๋ชจ๋ฌ RAG ํ๋ ์์ํฌ์ ๋ํ ์ข
ํฉ์ ์๋ฒ ์ด๋ก, LLaMP ์ ๊ทผ์ ์ด๋ก ์ ๋งฅ๋ฝ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ง์์ถ๋ก ๊ธฐ๋ฐ์ LLM์ ์ฌ๋ฃ๊ณผํ์ ํนํ์ํค๋ ๋ฐฉ์์ ํตํด LLaMP์ ๊ณ ์ ๋ขฐ๋ ๋ฉํฐ๋ชจ๋ฌ ์์
์ฑ๋ฅ์ด ๋ท๋ฐ์นจ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
HoneyComb๋ LLM ๊ธฐ๋ฐ์ ๋ฉํฐ๋ชจ๋ฌ ์์ด์ ํธ๋ก ์ฌ๋ฃ ๊ณผํ ์ ๋ณด ๊ฒ์ ๋ฐ ์ถ๋ก ์๋ํ ์ธก๋ฉด์์ LLaMP์ ๋น๊ต ๋์์ด ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ์ ์ง์ ์ถ์ถ ๋ฐ ํฉ์ฑ์ ์ํ LLM ํ์ฉ์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
MatterChat์ ๋ฉํฐ๋ชจ๋ฌ LLM๊ณผ materials project ๋ฐ์ดํฐ๋ฅผ ํ์ฉํด ์ฌ๋ฃ๊ณผํ ๋ถ์ผ ๊ณ ์ ๋ฌธ์ ํด๊ฒฐ์ ์๋ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง ์์ด ์ต์ ํ๋ฅผ ์ํ ๋์์ ์์ฑ ๋ชจ๋ธ ์ ๊ทผ๋ฒ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLaMP๋ LLM์ ์ํ ๋ฐฐํฐ๋ฆฌ ์์ฌ, ๊ณ ์ฒด ์ ํด์ง ๋ฑ์์ ํน์ฑ ์์ธก์ ์งํฅํ์ฌ, ML ์์ธก ๋ฐ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์ํฌํ๋ก์ฐ์ ์ ์ฉ์ฑ์ ํ๊ฐ ์ธก๋ฉด์์ ๋น๊ต ๊ฐ๋ฅํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ํ์ฉํ ๋ถ์ ์์ฑ ๋ฐ ์ค๊ณ์ ๋์์ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ถ์ ์ธ์ด ๋ชจ๋ธ์ ํ์ฉํ ํํ์ ์ถ๋ก ๋ฐ ๋ฌผ์ฑ ์์ธก์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
LLaMP๋ ์ฌ๋ฃ๊ณผํยท์๋ฎฌ๋ ์ด์
๋๊ตฌ์ RAG ๊ฒฐํฉ์ผ๋ก, GraphCast๋ฅ ๊ธฐ์ ์์ธก์์๋ LLM ๊ธฐ๋ฐ ๊ณ ์ ๋ขฐ๋ ๋ฉํฐ๋ชจ๋ฌ ์์
์ ์ฉ์ ๋ฐ์ ๊ฐ๋ฅ์ฑ์ ์์ฌํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ด ์ฌ๋ฃ๊ณผํ ์ ๋ณด ์ถ์ถ ๋ฐ ์์ฑ์ ๋ฏธ์น๋ ์ํฅ๋ ฅ๊ณผ, ๋ถ์ผ๋ณ ์ ์ด ๊ฐ๋ฅ์ฑ์ ์๋ฒ ์ดํฉ๋๋ค.
์์ฉ ์ฌ๋ก
๋ณธ ๋
ผ๋ฌธ์์ ์ ์๋ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ํ์ฉ ์ด๋ก ์ด, LLaMP๊ฐ ์ค์ง์ ์ผ๋ก Materials Project ๋ฑ ์์ฌ-์๋ฎฌ๋ ์ด์
๋๊ตฌ์์ ๊ตฌํ๋ ์ฌ๋ก๋ฅผ ๋ณด์ฌ์ค๋๋ค.