Essence
๊ทธ๋ฆผ 1: AutoML-GPT์ ๊ฐ์. ๋ฐ์ดํฐ ์ฒ๋ฆฌ๋ถํฐ ๋ชจ๋ธ ์ํคํ
์ฒ, ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋, ์์ธก ํ๋ จ ๋ก๊ทธ ์์ฑ๊น์ง์ ์ ์ฒด ํ์ดํ๋ผ์ธ์ ๋ณด์ฌ์ค
๋ณธ ๋
ผ๋ฌธ์ GPT์ ๊ฐ์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ์๋ ๋จธ์ ๋ฌ๋(AutoML) ์์คํ
์ ์ปจํธ๋กค๋ฌ๋ก ํ์ฉํ์ฌ, ๋ฐ์ดํฐ ์ฒ๋ฆฌ๋ถํฐ ๋ชจ๋ธ ์ํคํ
์ฒ ์ค๊ณ, ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋๊น์ง ์ ์ฒด ๋จธ์ ๋ฌ๋ ํ์ดํ๋ผ์ธ์ ์๋ํํ๋ AutoML-GPT ์์คํ
์ ์ ์ํ๋ค. ๋ชจ๋ธ ์นด๋(Model Card)์ ๋ฐ์ดํฐ ์นด๋(Data Card)๋ฅผ ํ์ฉํ ๊ตฌ์กฐํ๋ ํ๋กฌํํธ๋ฅผ ํตํด LLM์ด ๋ค์ํ AI ์์
์ ์๋์ผ๋ก ์ต์ ํํ ์ ์๊ฒ ํ๋ค.
How
๊ทธ๋ฆผ 2: ๋ฐ์ดํฐ ์นด๋๋ ๋ฐ์ดํฐ ์ด๋ฆ, ์
๋ ฅ ๋ฐ์ดํฐ ํ์
, ๋ ์ด๋ธ ๊ณต๊ฐ, ํ๊ฐ ์งํ๋ก ๊ตฌ์ฑ
๊ทธ๋ฆผ 3: ๋ชจ๋ธ ์นด๋๋ ๋ชจ๋ธ ์ด๋ฆ, ๋ชจ๋ธ ๊ตฌ์กฐ, ๋ชจ๋ธ ์ค๋ช
, ์ํคํ
์ฒ ํ์ดํผํ๋ผ๋ฏธํฐ๋ก ๊ตฌ์ฑ
AutoML-GPT์ ์๋ ๋ฐฉ์:
- ์
๋ ฅ ๋ถํด(Input Decomposition): ์ฌ์ฉ์์ ์์ฒญ์ ๋ฐ์ดํฐ ์นด๋, ๋ชจ๋ธ ์นด๋, ํ๊ฐ ์งํ ๋ฐ ์ถ๊ฐ ์์ฒญ์ฌํญ์ผ๋ก ๊ตฌ์กฐํ
- ๋ฐ์ดํฐ ์ฒ๋ฆฌ(Data Processing): ์ปดํจํฐ ๋น์ ์ ๊ฒฝ์ฐ ์ด๋ฏธ์ง ๋ฆฌ์ฌ์ด์ง, ์ ๊ทํ, ์ฆ๊ฐ(Augmentation), ํํฐ๋ง ๋ฑ์ ์ ์ฉํ๊ณ , NLP์ ๊ฒฝ์ฐ ํ ํฌ๋์ด์ ์ด์
(Tokenization), ๋ถ์ฉ์ด ์ ๊ฑฐ, ์๋ฌธ์ ๋ณํ ๋ฑ์ ์ํ
- ๋ชจ๋ธ ์ํคํ
์ฒ ์ ํ: In-context ์์
-๋ชจ๋ธ ํ ๋น ๋ฉ์ปค๋์ฆ์ผ๋ก ์ฃผ์ด์ง ์์
์ ์ ํฉํ ๋ชจ๋ธ์ ๋์ ์ผ๋ก ์ ํ
- ์์ธก ํ๋ จ ๋ก๊ทธ ๊ธฐ๋ฐ ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋: ์ค์ ํ์ต ์์ด LLM์ด ์์ฑํ ์์ธก ํ๋ จ ๋ก๊ทธ(Epoch, Loss, Accuracy ๋ฑ)๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ต์ ํ์ดํผํ๋ผ๋ฏธํฐ ์ ์
- ์ธ๊ฐ ํผ๋๋ฐฑ ๋ฃจํ: ์์ฑ๋ ํ๋ จ ๋ก๊ทธ์ ๋ํด ์ฌ์ฉ์ ํผ๋๋ฐฑ์ ๋ฐ์ ์ถ๊ฐ ํ๋ ๋ฐ๋ณต
Evaluation
์ดํ: AutoML-GPT๋ LLM์ ๊ฐ๋ ฅํ ์ธ์ด ์ดํด ๋ฅ๋ ฅ์ ๋จธ์ ๋ฌ๋ ์๋ํ์ ์ฐฝ์์ ์ผ๋ก ์ ์ฉํ ํฅ๋ฏธ๋ก์ด ์๋์ด๋ฉฐ, ๋ค์ํ ๋๋ฉ์ธ์์์ ์์ฉ ๊ฐ๋ฅ์ฑ์ด ๋๋ค. ๊ทธ๋ฌ๋ ์์ธก ํ๋ จ ๋ก๊ทธ์ ์ ํ์ฑ ๊ฒ์ฆ ๋ถ์ฌ์ ์ค์ ๊ตฌํ ์ธ๋ถ์ฌํญ์ ๋ถ์กฑ์ผ๋ก ๊ธฐ์ ์ ์์ฑ๋ ์ธก๋ฉด์์ ๊ฐ์ ์ด ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
AutoML๊ณผ LLM ํตํฉ์ ํํฉ๊ณผ ๋์ ๊ณผ์ ๋ฅผ ๋ถ์ํ๋ฉฐ AutoML-GPT์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
AutoGen์ ๋ฉํฐ์์ด์ ํธ ๊ธฐ๋ฐ LLM ์ ํ๋ฆฌ์ผ์ด์
ํ๋ ์์ํฌ๋ก, 136 AutoML-GPT ์์คํ
์ค๊ณ์ ํต์ฌ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
GPT๊ณ์ด LLM ํ์ฉํ ์ต์ AutoML ํ๋ฆ๊ณผ ๋์ ๊ณผ์ ๋ฅผ ๋ค๋ฃจ๋ฉฐ, 016 ์ฐ๊ตฌ์ ๋ฒค์น๋งํน ์ค๊ณ ๋ฐ ํด ์๋ํํต์ฌ์ ๊ด๋ จ๋ ์ด๋ก ์ ํ๋ ์์ ์ ๊ณตํจ.
๋ค๋ฅธ ์ ๊ทผ
LLM์ AutoML ์ปจํธ๋กค๋ฌ๋ก ํ์ฉํ๋ ์ ์ฌํ ์ ๊ทผ ๋ฐฉ์์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ํ์ฉํ ๋ชจ๋ธ ์ ํ ๋ฐ ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋ ์๋ํ์ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
Autokaggle์ LLM ๊ธฐ๋ฐ ๋ค์ค ์์ด์ ํธ ์๋ ๋ฐ์ดํฐ ๊ณผํ ํ๋ ์์ํฌ๋ก AutoML-GPT์ ์ ์ฌํ ์๋ํ ๋ชฉ์ ์ ๊ฐ์ก๋ค.
๋ค๋ฅธ ์ ๊ทผ
mlr-copilot์ LLM ๊ธฐ๋ฐ ์์จ ML ์ฐ๊ตฌ ์ค๊ณ๋ฅผ ๋ค๋ฃจ๋ ์ ์ฌ ์์คํ
์ผ๋ก, 136๊ณผ ๋น๊ตํด ๊ฐ๊ฐ์ ์๋ํ ๋ฐฉ์ ์ฐจ์ด๊ฐ ์ ๊ฒ๋ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ชจ๋ธ ์นด๋๋ ๋ฉํ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ AutoML ์ ๊ทผ์ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ธฐ์กด AutoML ๋๊ตฌ์ ๋ค์ํ ์ฑ๋ฅ๊ณผ ํ๊ณ๋ฅผ ์ค์ ๋ฒค์น๋งํฌ ๊ด์ ์์ ๋
ผ์ํ๋ฉฐ, ์๋ํ ์ ์ฉ ํ์ค์ ๋น๊ตํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ ๊ธฐ๋ฐ ์๋ ๊ธฐ๊ณํ์ต ์์คํ
์ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
GPT ๊ธฐ๋ฐ ๋จธ์ ๋ฌ๋ ํ์ดํ๋ผ์ธ ์๋ํ์ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
AutoML-GPT ๋
ผ๋ฌธ์ LLM์ ํ์ฉํ ์๋ ๊ธฐ๊ณํ์ต ๊ตฌํ ์ฌ๋ก๋ก, 135๋ฒ์ AutoML-LLM ํตํฉ ๋
ผ์์ ์ค์ ์ ์ฉ ์๋ฅผ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
AutoML ๊ณผ์ ์์ GPT์ ๊ณ ๋ํ๋ ๋๊ตฌ ํ์ฉ ๋ฅ๋ ฅ๊ณผ ํด ์ฐ๊ณ ์์
์๋ํ ๋ฐฉ๋ฒ์ ์ฌ์ธต์ ์ผ๋ก ๋ค๋ฃฌ๋ค.