Essence
Figure 1: Comparative Frameworks in Hyperparameter Optimization: Human Expertise, Traditional
AgentHPO๋ LLM ๊ธฐ๋ฐ์ ์์จ ์์ด์ ํธ๋ฅผ ํ์ฉํ์ฌ ํ์ดํผํ๋ผ๋ฏธํฐ ์ต์ ํ๋ฅผ ์๋ํํ๋ ํ๋ ์์ํฌ์ด๋ค. Creator์ Executor ๋ ๊ฐ์ ํนํ๋ ์์ด์ ํธ๊ฐ ํ๋ ฅํ์ฌ ์ํ์ฐฉ์ค๋ฅผ ์ค์ด๊ณ ํด์ ๊ฐ๋ฅ์ฑ์ ๋์ธ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์์จ ์์ด์ ํธ๋ฅผ ํ์ดํผํ๋ผ๋ฏธํฐ ์ต์ ํ์ ์ฒ์ ์ ์ฉํ ์ฐฝ์์ ์ธ ์ฐ๊ตฌ๋ก, ์ค์ ๋จ์์ฑ๊ณผ ํด์ ๊ฐ๋ฅ์ฑ์์ ๊ธฐ์กด AutoML์ ๊ฐ์ ํ๋ค. ๊ด๋ฒ์ํ ์คํ ๊ฒ์ฆ๊ณผ ๋ช
ํํ ํ๋ ์์ํฌ ์ค๊ณ๊ฐ ๊ฐ์ ์ด๋, LLM ์ฑ๋ฅ ์์กด์ฑ๊ณผ ๋น์ฉ ๋ถ์์ด ๋ณด๊ฐ๋ ํ์๊ฐ ์๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ๊ณ์ธต์ ๋ฌธํ ์กฐ์ง ๊ธฐ๋ฒ์ด ํ์ดํผํ๋ผ๋ฏธํฐ ์ต์ ํ ๊ณผ์ ์ ์๋ํ์ ๊ตฌ์กฐ์ ํต์ฐฐ์ ๋ํด์ค๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Automl in the age of large language models(135)๋ LLM ๊ธฐ๋ฐ ์๋ํ ์ต์ ํ ์์คํ
์ ํ๊ณ์ ๋์ ๊ณผ์ ๋ฅผ ๋
ผ์ํ๋ฉฐ, 463์ ํ์ดํผํ๋ผ๋ฏธํฐ ์๋ํ ์ ๊ทผ ๋
ผ์์ ์ด๋ก ๊ณ๊ธฐ๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋๊ท๋ชจ LLM ์์ด์ ํธ์ ๊ณ์ธต์ ๊ตฌ์กฐ์ ์คํยท๊ณํ ์ญํ ๋ถ๋ด์ด ํ์ดํผํ๋ผ๋ฏธํฐ ์ต์ ํ ์์ด์ ํธ ์์คํ
์ ์ค๊ณ์ ์ ์ฌํ์ฌ, ์ค๊ณ์ ๊ธฐ๋ณธ ์ด๋ก ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
463๋ฒ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ML ์ํฌํ๋ก์ฐ ์๋ํ ์ฌ๋ก๋ฅผ ๋ค๋ค, 548๋ฒ์ AI ์์ด์ ํธ ์คํ์๋๋ ML ์ฐ๊ตฌ ํ๊ฐ ๋ฒค์น๋งํฌ์ ํ์ํ ์ค์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋จธํฐ๋ฆฌ์ผ ํ๋ผ๋ฏธํฐ ์ต์ ํ ๋ฐ LLM ๊ธฐ๋ฐ ์ค๊ณ ์๋ํ๊ฐ ๋๊ธ์ ๊ฒฐ์ ๊ตฌ์กฐ ์์ฑ์ LLM ์์ฉ ์๋ฆฌ์ ๋ง๋ฟ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
MLCopilot ์ญ์ LLM ๊ธฐ๋ฐ์ผ๋ก ํ์ดํผํ๋ผ๋ฏธํฐ ๋ฐ ML ์์
์ต์ ํ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ์ง๋ง, ์ฌ๋์ ๊ฒฝํ ์ ์ด์ ํด์์ฑ์ ๋ ์ง์คํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ๊ธฐ๋ฐ ํ์ดํผํ๋ผ๋ฏธํฐ ์ต์ ํ ์์ด์ ํธ๋ฅผ ํตํด ์ต์ ํ ๋ฌธ์ ์์์ ๋ค์ํ LLM ํ์ฉ ์ ๋ต์ ์ ์ํ๋ค.
ํ์ ์ฐ๊ตฌ
464๋ฒ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋ฉํฐ์์ด์ ํธ์ ์ ๋ฐ์ ๋ฐ์ ์ ๋ค๋ฃจ๋ฉฐ, AgentHPO ๊ฐ์ ๊ตฌ์ฒด์ ํ๋ ์์ํฌ์ ์์น๋ฅผ ์ค๋ช
ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
mlr-copilot(549)์ LLM์ ์ด์ฉํ์ฌ ์๋ํ๋ ๋จธ์ ๋ฌ๋ ์ฐ๊ตฌ ์ง์์ ์คํํ๊ณ , 463์ ์์ด์ ํธ ๊ธฐ๋ฐ ํ์ดํผํ๋ผ๋ฏธํฐ ์ต์ ํ ํ๋ ์์ํฌ๋ฅผ ์คํ์ ํ์ค๋ก ์ด์ด๊ฐ๋ค.
ํ์ ์ฐ๊ตฌ
548๋ฒ ๋
ผ๋ฌธ์ AI ์์ด์ ํธ์ ์คํ์๋๋ ML ์ฐ๊ตฌ ์ํ ๋ฅ๋ ฅ์ ํ๊ฐํ์ฌ, 463๋ฒ์ ํ์ดํผํ๋ผ๋ฏธํฐ ์ต์ ํ ์๋ํ ์ฃผ์ ๋ฅผ ๋ ๋์ ์ฐ๊ตฌ ์๋ํ๋ก ํ์ฅํฉ๋๋ค.
์์ฉ ์ฌ๋ก
๋ณต์กํ ๋จธ์ ๋ฌ๋ ์คํ ๋ฐ ํ์ดํผํ๋ผ๋ฏธํฐ ์ต์ ํ ํ๊ฐ์ ์ค์ ์ฐ๊ตฌ ์๋ํ ๊ฐ ์ฐ๊ณ ์ฑ๊ณผ๋ฅผ ๋ณผ ์ ์์ต๋๋ค.