Automl in the age of large language models: Current challenges, future opportunities and risks

์ €์ž: Alexander Tornede, Difan Deng, Theresa Eimer, Joseph Giovanelli, Aditya Mohan, Tim Ruhkopf, Sarah Segel, Daphne Theodorakopoulos, Tanja Tornede, Henning Wachsmuth, Marius Lindauer | ๋‚ ์งœ: 2023 | DOI: arXiv:2306.08107 📄 PDF


Essence

Figure 1

AutoML์ด LLM ์ƒ๋ช…์ฃผ๊ธฐ(์‚ฌ์ „ํ•™์Šต, ๋ฏธ์„ธ์กฐ์ •, ์ถ”๋ก )์˜ ๋ชจ๋“  ๋‹จ๊ณ„์— ์ ์šฉ๋  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๊ฐ ๋‹จ๊ณ„์˜ ์„œ๋กœ ๋‹ค๋ฅธ ๋ชฉํ‘œ, ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ, ์„ค๊ณ„ ๊ฒฐ์ •์— ๋งž์ถฐ ์กฐ์ •๋˜์–ด์•ผ ํ•จ์„ ๋ณด์—ฌ์คŒ

๋ณธ ๋…ผ๋ฌธ์€ AutoML(์ž๋™ ๊ธฐ๊ณ„ํ•™์Šต)๊ณผ LLM(๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ)์˜ ์ƒ์ƒ์ (symbiotic) ํ†ตํ•ฉ์„ ์ œ์•ˆํ•˜๋ฉฐ, ์–‘ ๋ถ„์•ผ๊ฐ€ ์„œ๋กœ๋ฅผ ์–ด๋–ป๊ฒŒ ๊ฐ•ํ™”ํ•  ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ํฌ๊ด„์ ์œผ๋กœ ํƒ์ƒ‰ํ•œ๋‹ค. AutoML์ด LLM ์ตœ์ ํ™”์— ๊ฐ€์ ธ์˜ค๋Š” ๋„์ „๊ณผ์ œ, LLM์ด AutoML ๊ฐœ์„ ์— ์ œ๊ณตํ•˜๋Š” ๊ธฐํšŒ, ๊ทธ๋ฆฌ๊ณ  ํ†ตํ•ฉ ๊ณผ์ •์—์„œ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋Š” ์œ„ํ—˜์„ ์ฒด๊ณ„์ ์œผ๋กœ ๋ถ„์„ํ•œ๋‹ค.

Motivation

Achievement

Figure 1

LLM ์ƒ๋ช…์ฃผ๊ธฐ ์ „์ฒด์— ๊ฑธ์นœ AutoML ์ ์šฉ์˜ ๋„์ „๊ณผ์ œ์™€ ์ตœ์ ํ™” ๋Œ€์ƒ

  1. AutoML for LLM์˜ ์ฃผ์š” ๋„์ „๊ณผ์ œ ๊ทœ์ •:
    • ์‚ฌ์ „ํ•™์Šต์˜ ๊ทน๋„์˜ ๊ณ„์‚ฐ ๋น„์šฉ์œผ๋กœ ์ธํ•œ ์ œํ•œ๋œ ํ•™์Šต ์‹คํ–‰
    • ๋‹ค๋‹จ๊ณ„ ํ›ˆ๋ จ ํ”„๋กœ์„ธ์Šค์—์„œ joint optimization์˜ ๋ถˆ๊ฐ€๋Šฅ์„ฑ
    • Neural Architecture Search(NAS) ์„ฑ์ˆ™๋„ ๋ถ€์กฑ
    • ๋‹จ๊ณ„๋ณ„ ๋‹ค๋ฅธ ํ‰๊ฐ€ ์ง€ํ‘œ์˜ ๋…ธ์ด์ฆˆ์™€ ํŽธํ–ฅ ๋ฌธ์ œ
    • ๋‹ค์–‘ํ•œ ํ•™์Šต ํŒจ๋Ÿฌ๋‹ค์ž„ ๋™์‹œ ๊ณ ๋ ค์˜ ์–ด๋ ค์›€
  2. LLM for AutoML์˜ ๊ธฐํšŒ ์ œ์‹œ:
    • ์ž์—ฐ์–ธ์–ด๋ฅผ ํ†ตํ•œ Human-Machine Interaction (HMI) ๊ฐœ์„ 
    • AutoML ์‹œ์Šคํ…œ ์„ค์ •์˜ ์ž๋™ํ™” ๋ฐ ์„ค๋ช… ๊ฐ€๋Šฅ์„ฑ ๊ฐ•ํ™”
    • Meta-learning์„ ํ†ตํ•œ AutoML ์ปดํฌ๋„ŒํŠธ ๊ฐœ์„ 
    • ๋น„์ •ํ˜• ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ์˜ AutoML ์ง€์‹ ์ถ”์ถœ
  3. ํ†ตํ•ฉ์˜ ์ž ์žฌ์  ์œ„ํ—˜ ๋ถ„๋ฅ˜:
    • LLM hallucination์œผ๋กœ ์ธํ•œ catastrophic failures
    • AutoML ๊ฒฐ๊ณผ์— ๋Œ€ํ•œ ๊ณผ๋„ํ•œ ์‹ ๋ขฐ
    • ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก  ๋ถ€์กฑ
    • ๊ณ„์‚ฐ ์ž์› ์ˆ˜์š”์˜ ์ง€์ˆ˜์  ์ฆ๊ฐ€

How

Figure 1

๊ฐ LLM ์ƒ๋ช…์ฃผ๊ธฐ ๋‹จ๊ณ„๋ณ„ AutoML ์ ์šฉ ๋ฐฉ์‹

AutoML for LLMs ์ ‘๊ทผ๋ฒ•:

LLMs for AutoML ์ ‘๊ทผ๋ฒ•:

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4.5/5 Overall: 4.5/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ AutoML๊ณผ LLM์˜ ์ƒ์ƒ์  ํ†ตํ•ฉ์— ๋Œ€ํ•œ ์ตœ์ดˆ์˜ ํฌ๊ด„์  ๋ถ„์„์œผ๋กœ, ํ˜„์‹ค์ ์ธ ๋„์ „๊ณผ์ œ ๊ทœ์ •๊ณผ ํ•จ๊ป˜ ์–‘๋ฐฉํ–ฅ ๊ธฐํšŒ๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ์ œ์‹œํ•จ์œผ๋กœ์จ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ์„ ๋ช…ํ™•ํžˆ ํ•œ๋‹ค. ๋‹ค๋งŒ ๊ฐœ๋…์  ์ˆ˜์ค€์˜ ์ œ์•ˆ์ด ๋งŽ๊ณ  ๊ตฌ์ฒด์  ๊ตฌํ˜„ ์‚ฌ๋ก€๊ฐ€ ๋ถ€์กฑํ•œ ์ ์ด ์•„์‰ฌ์šฐ๋ฉฐ, ์ œ์‹œ๋œ ์œ„ํ—˜ ์š”์†Œ์— ๋Œ€ํ•œ ๋ฏธํ‹ฐ๊ฒŒ์ด์…˜ ์ „๋žต ๊ฐœ๋ฐœ์ด ํ›„์† ์—ฐ๊ตฌ์˜ ์ค‘์š”ํ•œ ๊ณผ์ œ๊ฐ€ ๋  ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
AutoML๊ณผ LLM ๊ธฐ๋ฐ˜ ์ง€์› ๋ฐฉ์‹์˜ ์žฅ๋‹จ์ , ์‹ค์ œ ํ˜„์žฅ ์ ์šฉ์ƒ์˜ ๋„์ „ ๊ณผ์ œ๋ฅผ ์ตœ์‹  ๊ด€์ ์—์„œ ์ •๋ฆฌํ•ด MLcopilot์˜ ์‹ค์šฉ์„ฑ ๋ฐ ํ•œ๊ณ„๋ฅผ ๋น„ํŒ์ ์œผ๋กœ ์กฐ๋งํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
AutoML๊ณผ LLM ํ†ตํ•ฉ์˜ ํ˜„ํ™ฉ๊ณผ ๋„์ „๊ณผ์ œ๋ฅผ ๋ถ„์„ํ•˜๋ฉฐ AutoML-GPT์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Automl in the age of large language models(135)๋Š” LLM ๊ธฐ๋ฐ˜ ์ž๋™ํ™” ์ตœ์ ํ™” ์‹œ์Šคํ…œ์˜ ํ•œ๊ณ„์™€ ๋„์ „๊ณผ์ œ๋ฅผ ๋…ผ์˜ํ•˜๋ฉฐ, 463์˜ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ์ž๋™ํ™” ์ ‘๊ทผ ๋…ผ์˜์— ์ด๋ก  ๊ณ„๊ธฐ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Œ€๊ทœ๋ชจ LLM ๋ฐ foundation model์„ ํ™œ์šฉํ•œ ์˜ํ•™/๊ณผํ•™ ์ž‘์—… ์ตœ์ ํ™”์˜ ์„ค๊ณ„ ์›๋ฆฌ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AutoML ์‹œ์Šคํ…œ ๊ฐœ์„ ์„ ์œ„ํ•œ LLM ํ™œ์šฉ์˜ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ AutoML ๋˜๋Š” ๊ธฐ๊ณ„ํ•™์Šต ์ž๋™ํ™”์˜ ์œ ์‚ฌํ•œ ์ ‘๊ทผ ๋ฐฉ์‹์„ ๋‹ค๋ฃฌ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ์ตœ์ ํ™” ๋˜๋Š” ์‹ ๊ฒฝ๋ง ์•„ํ‚คํ…์ฒ˜ ํƒ์ƒ‰์˜ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ๋จธ์‹ ๋Ÿฌ๋‹ ํŒŒ์ดํ”„๋ผ์ธ ์ž๋™ํ™”์˜ ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AutoML๊ณผ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์˜ ํ†ตํ•ฉ์— ๊ด€ํ•œ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
From Automation to Autonomy ๋…ผ๋ฌธ์€ LLM๊ณผ AutoML ์‹œ์Šคํ…œ์„ ํ†ตํ•ฉํ•œ ์—์ด์ „ํŠธ์˜ ์ž์œจํ™” ๊ฐ€๋Šฅ์„ฑ๊ณผ ๊ธฐ์ˆ ์  ์žฅ๋ฒฝ์„ ์ง‘์ค‘์ ์œผ๋กœ ๋‹ค๋ฃฌ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AutoML-GPT ๋…ผ๋ฌธ์€ LLM์„ ํ™œ์šฉํ•œ ์ž๋™ ๊ธฐ๊ณ„ํ•™์Šต ๊ตฌํ˜„ ์‚ฌ๋ก€๋กœ, 135๋ฒˆ์˜ AutoML-LLM ํ†ตํ•ฉ ๋…ผ์˜์˜ ์‹ค์ œ ์ ์šฉ ์˜ˆ๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ ๊ตฌ์กฐ์˜ ์ „๋ฐ˜์ ์ธ ๋ฐœ์ „๊ณผ ๋„์ „์„ ๋‹ค๋ฃจ์–ด, AutoML๊ณผ LLM ํ†ตํ•ฉ์˜ ๋‹ค์–‘ํ•œ ์‹œ๋„๋ฅผ ๋ณด์™„ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋„๊ตฌ ํ™œ์šฉ ๋Šฅ๋ ฅ์„ ์ค‘์‹ฌ์œผ๋กœ LLM ๊ธฐ๋ฐ˜ AutoML๊ณผ ์ธ๊ฐ„-LLM ํ†ตํ•ฉ์— ๋Œ€ํ•œ ์ตœ๊ทผ survey๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
135๋Š” ์˜คํ† ML๊ณผ LLM ๊ฒฐํ•ฉ์˜ ํ˜„์‹ค์  ๋„์ „๊ณผ์ œ๋ฅผ ๋ถ„์„ํ•˜์—ฌ, 837์—์„œ ์ œ์•ˆํ•œ reasoning ๊ฐ•ํ™”๋ฅผ ์‹ค์ œํ™”ํ•˜๋Š” ๊ณผ์ •์— ์‹ค์งˆ์  ํ”ผ๋“œ๋ฐฑ์„ ์ œ๊ณตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
016์˜ AutoML ๋„๊ตฌ ์‹ค์ฆํ‰๊ฐ€ ๋‚ด์šฉ์€ 135์˜ LLM ์‹œ๋Œ€ AutoML ๋„๊ตฌ์˜ ํ˜„ํ™ฉ ๋ฐ ๊ณผ์ œ ๋…ผ์˜๋กœ ํ™•์žฅ๋ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์ž๋™ํ™”๋œ ๋จธ์‹ ๋Ÿฌ๋‹(Automl)์—์„œ REALM๊ณผ ์œ ์‚ฌํ•œ ๊ฒ€์ƒ‰์ฆ๊ฐ• ์ ‘๊ทผ๋ฒ•์„ ์‹ค์ œ ๋ฌธ์ œ์— ์ ์šฉํ•˜์—ฌ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ์˜ˆ๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AutoML ์‹œ๋Œ€์˜ LLM ํ‰๊ฐ€ ๋„์ „๊ณผ์ œ๋ฅผ ์‹ค์ œ ์‘์šฉ ์‚ฌ๋ก€์™€ ์ ‘๋ชฉํ•ด, ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์‹ค๋ฌด์  ํ™œ์šฉ ๋ฐฉ์•ˆ์„ ์ œ์‹œํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •