์ ์: Laith Alzubaidi, Jinglan Zhang, Amjad J. Humaidi, Ayad Q. Al-Dujaili, Ye Duan, Omran Al-Shamma, Josรฉ Santamarรญa, Mohammed A. Fadhel, Muthana AlโAmidie, Laith Farhan | ๋ ์ง: 2024 | URL: https://arxiv.org/abs/2402.17453 📄 PDF
Essence
Figure 1. (a) Overview of DS-Agent with CBR based LLMs. (b)
DS-Agent๋ LLM ์์ด์ ํธ์ case-based reasoning(CBR)์ ๊ฒฐํฉํ์ฌ ์๋ํ๋ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์์
์ ์ํํ๋ ํ๋ ์์ํฌ์ด๋ค. ๊ฐ๋ฐ ๋จ๊ณ์์ ๋ฐ๋ณต์ ๊ฐ์ ์ ํตํด ์ต์ ์ ML ๋ชจ๋ธ์ ๊ตฌ์ถํ๊ณ , ๋ฐฐํฌ ๋จ๊ณ์์ ์ ์์ ํ๊ฒฝ์ ๋ง์ถฐ ๊ณผ๊ฑฐ ์ฑ๊ณต ์ฌ๋ก๋ฅผ ์ฌ์ฌ์ฉํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: DS-Agent๋ CBR๊ณผ LLM์ ์ฐฝ์์ ์ผ๋ก ๊ฒฐํฉํ์ฌ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์๋ํ์์ ์ค์ง์ ์ธ ์ฑ๋ฅ ๊ฐ์ ๊ณผ ๋น์ฉ ํจ์จ์ฑ์ ๋์์ ๋ฌ์ฑํ๋ค. Kaggle ์ง์ ํ์ฉ๊ณผ ์ด์ํ๋ ํ์ดํ๋ผ์ธ ์ค๊ณ๋ ์ค์ฉ์ ์ด๋ฉฐ, ๋ช
ํํ ์คํ ๊ฒฐ๊ณผ์ ์คํ์์ค ๊ณต๊ฐ๋ก ํ์ ์ฐ๊ตฌ๋ฅผ ์ด์งํ ์ ์๋ ์ฐ์ํ ๊ธฐ์ฌ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Data Interpreter ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์๋ํ ๋ฐ์ดํฐ ๊ณผํ ํ๋ ์์ํฌ ๊ตฌํ์ ๊ธฐ๋ณธ ๊ตฌ์กฐ๋ฅผ ๋ค๋ฃจ๋ฉฐ DS-Agent์ ๊ธฐ๋ฐ์ ์ญํ ์ ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Ds-agent ๋
ผ๋ฌธ์ ๋ค์ค LLM ์์ด์ ํธ ์์คํ
์ ์๋ํ ๋ฐ์ดํฐ ๊ณผํ ํ์ดํ๋ผ์ธ ๊ตฌํ์ ํ์ํ ํต์ฌ ๊ตฌ์ฑ์์๋ฅผ ๋ค๋ฃน๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ์์ด์ ํธ์ ๋ฐ๋ณต์ ๊ฐ์ ๋ฐ ํผ๋๋ฐฑ ๋ฉ์ปค๋์ฆ์ ๋ํ ์ด๋ก ์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
DSBench๋ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์์ด์ ํธ์ ํ๊ณ์ ๋ฐ์ ๊ฐ๋ฅ์ฑ์ ํ๊ฐํ์ฌ DS-Agent ์ ๊ทผ์ ์ฑ๋ฅ ๊ฒ์ฆยท๋น๊ต์ ํ์ฉ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
121๋ฒ ๋
ผ๋ฌธ์ ์๋ํ๋ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์์
์ ์ํ ๋ฉํฐ ์์ด์ ํธ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ DS-agent์ ๋ฐฉ๋ฒ์ ์ ์ฌ์ ์ด๋ ์ฐจ๋ณ์ ์ ์ดํดํ๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Ds-agent ๋
ผ๋ฌธ๋ LLM ๊ธฐ๋ฐ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์๋ํ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๋ฉฐ, Data Interpreter์ ์ค๊ณ์ฒ ํ๊ณผ ์ฑ๋ฅ, ์ ์ฉ๋ฒ์์ ์ฐจ์ด์ ์ ๋น๊ตํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
293๋ฒ ๋
ผ๋ฌธ์ LLM์ ํตํ ์๋ํ ๋ฐ์ดํฐ๊ณผํ ํ๋ ์์ํฌ๋ก, 540๋ฒ์์ ์ ํ๋ฐฉ๋ฒ ๊ฒ์ ์ค์ฌ์ผ๋ก ๋ค๋ฃจ๋ ๋ฌธ์ ๋ฅผ ์ ์ฒด ์ฐ๊ตฌ ๋ผ์ดํ์ฌ์ดํด ์๋ํ ๊ด์ ์์ ๋น๊ตํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
์๋ ๋ฐ์ดํฐ ๋ถ์ ์์ด์ ํธ๋ก์ LLM ๊ธฐ๋ฐ ๋ถ์ ์ฑ๋ฅ์ ์ค์ ๊ตฌํ ๋ฐ ํ๊ฐํ๋ ๋งฅ๋ฝ์ ์ ๊ณตํ๋ค.
ํ์ ์ฐ๊ตฌ
DS-Agent์ ๋ฐ๋ณต์ ๊ฐ์ ๋ฐ ๋ฐฐํฌ ๋จ๊ณ ์ต์ ํ๋ฅผ ํ์ฅํ๋ ๊ด๋ จ ๋ฐฉ๋ฒ๋ก ์ ์ ๊ณตํ๋ค.
์์ฉ ์ฌ๋ก
290๋ฒ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์๋ ์ฝ๋ฌผ ๋ฐ๊ฒฌ ์์ด์ ํธ๋ฅผ ๋ค๋ฃจ๋ฉฐ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์์ด์ ํธ ๊ธฐ์ ์ ์ค์ ๋ฐ์ด์ค๋ฉ๋์ปฌ ์์ฉ ์ฌ๋ก๋ฅผ ์ ๊ณตํฉ๋๋ค.