์ ์: Yongliang Shen, Kaitao Song, Xu Tan, Dongsheng Li, Weiming Lu, Yueting Zhuang, A. Oh, T. Naumann, A. Globerson, K. Saenko, M. Hardt, S. Levine | ๋ ์ง: 2023 | URL: https://proceedings.neurips.cc/paper_files/paper/2023/file/77c33e6a367922d003ff102ffb92b658-Paper-Conference.pdf 📄 PDF
Essence
Figure 1: Language serves as an interface for LLMs (e.g., ChatGPT) to connect numerous AI models
HuggingGPT๋ ChatGPT๋ฅผ ์ปจํธ๋กค๋ฌ๋ก ํ์ฉํ์ฌ Hugging Face์ ๋ค์ํ AI ๋ชจ๋ธ๋ค์ ์๋์ผ๋ก ์ ํํ๊ณ ์กฐ์จํจ์ผ๋ก์จ ๋ณต์กํ ๋ฉํฐ๋ชจ๋ฌ AI ์์
์ ํด๊ฒฐํ๋ LLM ๊ธฐ๋ฐ ์์ด์ ํธ์ด๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: HuggingGPT๋ language๋ฅผ universal interface๋ก ํ์ฉํ์ฌ LLM๊ณผ ๋ค์ํ domain-specific ๋ชจ๋ธ์ ํจ๊ณผ์ ์ผ๋ก ์ฐ๊ฒฐํ๋ ์ฐฝ์์ ์ด๊ณ ์ค์ฉ์ ์ธ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ฉฐ, ๋ฉํฐ๋ชจ๋ฌ ๋ณต์ก ์์
ํด๊ฒฐ๊ณผ AGI ๊ตฌํ์ ์ค์ํ ๊ธฐ์ฌ๋ฅผ ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
AutoGen์ ๋ฉํฐ-์์ด์ ํธ ๊ธฐ๋ฐ LLM ์์
์๋ํ ํ๋ ์์ํฌ๋ก, HuggingGPT์ ์ปจํธ๋กค๋ฌ-ํด ๋ถ์ฐ ๊ตฌ์กฐ์ ๊ทผ๊ฐ์ ํ์ฑํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
464๋ LLM ๊ธฐ๋ฐ ๋ฉํฐ์์ด์ ํธ ์์คํ
์ ๋ฐ์ ์๋ฒ ์ดํ๋ฉฐ, 412์ ๊ตฌ์กฐ์ ์ค๊ณ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
412๋ฒ ๋
ผ๋ฌธ์ ๋ค์ํ ์์ด์ ํธ ํ์
๊ตฌ์กฐ(HuggingGPT)๋ฅผ ์ ์ํ์ฌ, 735๋ฒ์ ๋ฉํฐํด ์ฐ๊ณ ๋ฐ ์คํ ํ๋ ์์ํฌ์ ๊ทผ๊ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
HuggingGPT ๋
ผ๋ฌธ์ ๋ค์ํ ์ธ๋ถ ๋๊ตฌ์ LLM ํตํฉ์ ํตํ Agentic Framework์ ์ด๊ธฐ ๊ฐ๋
์ ์ ์ํ์ฌ ToolUniverse์ ์คํ์์ค ๋๊ตฌ์ํ๊ณ ๊ธฐ๋ฐ ๋ชจ๋ธ์ ์ด๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
HuggingGPT ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋ฉํฐ๋๊ตฌยท์์ด์ ํธ ํ์
์๋ํ ํ๋ ์์ํฌ๋ก, 137 ๋
ผ๋ฌธ์ ์ค์ผ์คํธ๋ ์ด์
๊ฐ๋
์ ๊ธฐ์ ์ ๊ธฐ๋ฐ์ ๋ง๋ จํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
412๋ฒ ๋
ผ๋ฌธ์ HuggingGPT์ ๊ด๋ จํ์ฌ ๋๊ท๋ชจ ๋ฉํฐ๋ชจ๋ฌ ์์
์๋ํ ํ๋ ์์ํฌ๋ก EAA์ ๋ฉํฐ๋ชจ๋ฌ ๋๊ตฌํตํฉ๊ณผ ๋น๊ต๋ ์ ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
412๋ฒ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋ค์ํ ๊ณผํ์ ๋๊ตฌ ์กฐํฉ์ ๋ค๋ฃจ์ด, ๋ค์ค ์์ด์ ํธ ๋ฐ ํด ํ์ฉ์ ์๋ฆฌ์ ๋ฐฐ๊ฒฝ์ ์ค๋ช
ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
HuggingGPT(412)๋ ์ด์ข
์์ด์ ํธ ์ค์ผ์คํธ๋ ์ด์
์ ์ํ LLM ์ค์ฌ ์ธํฐํ์ด์ค ๊ฐ๋
์ ์ ๊ณตํ์ฌ 3126์ Eywa ์ค๊ณ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Hiagent ๋
ผ๋ฌธ์ ๋๊ท๋ชจ ์์ด์ ํธ์ ์ฅ๊ธฐ ๋ฌธ์ ํด๊ฒฐ ์ ๊ณ์ธตํ ๋ฉ๋ชจ๋ฆฌ ๊ด๋ฆฌ๋ก ์์
ํจ์จ์ ๋์ด๋ ๋์์ ๊ตฌ์กฐ๋ฅผ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ค๋ถ์ผ ๊ณผํ(Astronomy, Bio ๋ฑ)์์ LLM์์ด์ ํธ ๊ธฐ๋ฐ ๋ณต์กํ ๋ฐ์ดํฐ ํด์์ด ์ด๋ป๊ฒ ์ด๋ฃจ์ด์ง๋์ง ๋น๊ต์ ์ฌ๋ก๋ก ์ ํฉํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
HuggingGPT ๋
ผ๋ฌธ๋ ๋ค์ํ API์ ํด์ ํ์ฉํด ๋ค์ํ ์์
์ ์๋ํํ๋ LLM-์์ด์ ํธ ํ๋ ์์ํฌ๋ก AnyTool๊ณผ ๋น๊ต ์ฐ๊ตฌ์ ์ ํฉํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
HuggingGPT๋ ChatGPT ๋ฑ LLM์ด ๋ค์ํ ๋๊ตฌ ๋ฐ ๋ถ์ฐํ ์์ด์ ํธ๋ฅผ ๋์ํ๋ ๋ฐฉ์์ ์ ์ํ๋ฉฐ, WebWatcher์ ์์ด์ ํธ ๊ตฌ์กฐ์ ๋น๊ตํด๋ณผ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
412๋ฒ ๋
ผ๋ฌธ์ ์ฌ๋ฌ LLM์ ์ฐ๊ณยทํ์
ํด ๋ณต์กํ ์์
์ ํด๊ฒฐํ๋ HuggingGPT ์์คํ
์๊ฐ๋ก, 499๋ฒ ๋
ผ๋ฌธ์ multi-tool integration ํจ๋ฌ๋ค์์ ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
LLM Agents Making Agent Tools ๋
ผ๋ฌธ์ LLM์ ๋๊ตฌ ์กฐํฉ ๋ฐ ์๋ํ ๊ธฐ๋ฒ์ ์ถ๊ฐ ํ์ฅํ์ฌ, HuggingGPT ์ค์ฉํ ์ดํ์ ์ฐ๊ตฌ๋ฅผ ์ดํด๋ณผ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
352๋ฒ ๋
ผ๋ฌธ์ ์์ด์ ํธ ๊ธฐ๋ฐ ์์จ ๊ณผํ ์๋์ ํต์ฌ ์๋ฆฌ์ ์งํ ๋ฐฉํฅ์ ๋ค๋ฃจ๋ฉฐ, 412๋ฒ HuggingGPT์ ๋ฉํฐ๋ชจ๋ฌ ์์ด์ ํธ ์กฐ์จ ๊ฒฝํ์ด ๋ํํ๋ ์ ์๋ค๋ ๊ฐ๋ฅ์ฑ์ ๋ถ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Foundation-Model Surrogates Enable Data-Efficient Active Learning(346)์ ๋ค์ํ ๋ชจ๋ธ ํตํฉ ๊ธฐ๋ฒ์ ์คํ์ ๊ณผํ ๋ฌธ์ ์ ์ ์ฉํ๋ฉฐ, 412์ ๋ฉํฐ๋ชจ๋ฌ ์์ด์ ํธ ๊ฐ๋
์ ๊ณผํ ๋ฐ๊ฒฌ์ ํ์ฅํ๋ค.
์์ฉ ์ฌ๋ก
412๋ฒ ๋
ผ๋ฌธ์ ๋ค์ํ AI ์์
๋ฌธ์ ์ HuggingGPT ์์ด์ ํธ ํ๋ ์์ํฌ๋ฅผ ์ ์ฉํ ์ฌ๋ก๋ก, 205์ ํตํฉ์ SW๊ฐ๋ฐ ํ๋ก์ธ์ค ๊ฐ๋
์ ์ค์ ๋ก ๋ค๋ฅธ ๊ณผํ๋ถ์ผ์ ํ์ฅํ๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค.
์์ฉ ์ฌ๋ก
HuggingGPT(412)๋ LLM ๊ธฐ๋ฐ ๋ฉํฐ์์ด์ ํธ์ ์ค์ ๊ตฌํ ์ฌ๋ก๋ก, 464์ ๊ฐ๋
์ ๋ถ๋ฅ ๋ฐ ํ๊ณ ๋ถ์๊ณผ ํ์ค์ ์ฐ๊ฒฐ๊ณ ๋ฆฌ๊ฐ ๋๋ค.
์์ฉ ์ฌ๋ก
412๋ฒ HuggingGPT๋ ์ฌ๋ฌ AI ์์
์ ์๋ํํ๋ ํ๋ ์์ํฌ๋ก, 849๋ฒ์์ ๊ฐ์กฐํ GUI ์์ด์ ํธ์ ์ค์ ๋๊ตฌ ํตํฉ ๋ฐ ์์ฉ ์ฌ๋ก๋ฅผ ์ฐ๊ณํด ๋ณผ ์ ์์ต๋๋ค.