A practical evaluation of AutoML tools for binary, multiclass, and multilabel classification

์ €์ž: Marcelo V. C. Aragรฃo, Augusto G. Afonso, Rafaela C. Ferraz, Rairon G. Ferreira, Sรกvio G. Leite, Felipe A. P. De Figueiredo, Samuel B. Mafra | ๋‚ ์งœ: 2025-05-21 | DOI: 10.1038/s41598-025-02149-x 📄 PDF


Essence

16๊ฐœ์˜ ์ฃผ์š” AutoML ๋„๊ตฌ๋ฅผ 21๊ฐœ์˜ ์‹ค์ œ ๋ฐ์ดํ„ฐ์…‹์—์„œ ์ด์ง„, ๋‹ค์ค‘ํด๋ž˜์Šค, ๋‹ค์ค‘๋ผ๋ฒจ ๋ถ„๋ฅ˜ ์ž‘์—…์œผ๋กœ ์ฒด๊ณ„์ ์œผ๋กœ ๋ฒค์น˜๋งˆํ‚นํ•˜์—ฌ, ๊ฐ ๋„๊ตฌ์˜ ์„ฑ๋Šฅ-ํšจ์œจ์„ฑ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„๋ฅผ ๋ถ„์„ํ•œ ์ข…ํ•ฉ ํ‰๊ฐ€ ์—ฐ๊ตฌ์ด๋‹ค.

Motivation

Achievement

How

Figure 2

Figure 2 illustrates the general workflow of HPO, emphasizing its iterative nature. The problem setup includes

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ์ด ์—ฐ๊ตฌ๋Š” AutoML ๋„๊ตฌ ์„ ํƒ์˜ ์‹ค๋ฌด์  ์–ด๋ ค์›€์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์„ธ ๋ถ„๋ฅ˜ ์œ ํ˜•์„ ๋ชจ๋‘ ํฌํ•จํ•œ ์ตœ์ดˆ์˜ ์ฒด๊ณ„์ ์ด๊ณ  ํ†ต๊ณ„์ ์œผ๋กœ ์—„๊ฒฉํ•œ ๋ฒค์น˜๋งˆํฌ๋ฅผ ์ œ์‹œํ•˜๋ฉฐ, ์žฌํ˜„ ๊ฐ€๋Šฅํ•œ ์‹คํ—˜ ํ”„๋กœํ† ์ฝœ๊ณผ ๊ณต๊ฐœ ์ฝ”๋“œ๋ฅผ ํ†ตํ•ด ํ•™์ˆ  ๋ฐ ์‚ฐ์—…๊ณ„์— ์ฆ‰๊ฐ์ ์ธ ๊ฐ€์น˜๋ฅผ ์ œ๊ณตํ•œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
GPT๊ณ„์—ด LLM ํ™œ์šฉํ•œ ์ตœ์‹  AutoML ํ๋ฆ„๊ณผ ๋„์ „๊ณผ์ œ๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, 016 ์—ฐ๊ตฌ์˜ ๋ฒค์น˜๋งˆํ‚น ์„ค๊ณ„ ๋ฐ ํˆด ์ž๋™ํ™”ํ•ต์‹ฌ์— ๊ด€๋ จ๋œ ์ด๋ก ์  ํ”„๋ ˆ์ž„์„ ์ œ๊ณตํ•จ.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ ํ‰๊ฐ€ ๋ฐ ๋น„๊ต๋ฅผ ์œ„ํ•œ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AutoML ๋„๊ตฌ์˜ ์„ฑ๋Šฅ ํ‰๊ฐ€ ๋ฐ ๋น„๊ต๋ฅผ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ๋ฒค์น˜๋งˆํ‚น ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
016์˜ ๊ธฐ์กด AutoML ๋ฒค์น˜๋งˆํ‚น๊ณผ ๋‹ฌ๋ฆฌ 543์€ LLM์„ ํ™œ์šฉํ•œ ๊ธฐ๊ณ„ํ•™์Šต ํ˜‘์—… ์ž๋™ํ™”์— ์ง‘์ค‘ํ•˜์—ฌ ์„œ๋กœ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ธฐ์กด AutoML ๋„๊ตฌ์˜ ๋‹ค์–‘ํ•œ ์„ฑ๋Šฅ๊ณผ ํ•œ๊ณ„๋ฅผ ์‹ค์ œ ๋ฒค์น˜๋งˆํฌ ๊ด€์ ์—์„œ ๋…ผ์˜ํ•˜๋ฉฐ, ์ž๋™ํ™” ์ ์šฉ ํ˜„์‹ค์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ถ„๋ฅ˜ ์ž‘์—…์—์„œ ์ž๋™ํ™”๋œ ๋จธ์‹ ๋Ÿฌ๋‹ ์ ‘๊ทผ๋ฒ•์˜ ํšจ์œจ์„ฑ์„ ํ‰๊ฐ€ํ•˜๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ์…‹์—์„œ ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ์„ฑ๋Šฅ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„๋ฅผ ๋ถ„์„ํ•˜๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
016์˜ AutoML ๋„๊ตฌ ์‹ค์ฆํ‰๊ฐ€ ๋‚ด์šฉ์€ 135์˜ LLM ์‹œ๋Œ€ AutoML ๋„๊ตฌ์˜ ํ˜„ํ™ฉ ๋ฐ ๊ณผ์ œ ๋…ผ์˜๋กœ ํ™•์žฅ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์–ธ์–ด๋ชจ๋ธ ๊ธฐ๋ฐ˜์˜ ์™„์ „์ž์œจ ๋จธ์‹ ๋Ÿฌ๋‹ ์—ฐ๊ตฌ ์ž๋™ํ™”(MLR-Copilot)๋กœ 016 ๋…ผ๋ฌธ์˜ AutoML ๋„๊ตฌ ํ‰๊ฐ€๋ฅผ AI-์—ฐ๊ตฌ์ž ํ”„๋ ˆ์ž„๊นŒ์ง€ ํ™•์žฅ ์ ์šฉํ•จ.
ํ›„์† ์—ฐ๊ตฌ
295 'Dynamic multi-agent orchestration and retrieval for multi-solution recommendation in AutoML systems' ๋…ผ๋ฌธ์€ AutoML์˜ ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ๋™์  ์ตœ์ ํ™”์™€ 016์˜ AutoML ํ‰๊ฐ€ ๊ฒฐ๊ณผ๋ฅผ ์ ‘๋ชฉํ•ด ์ฝ์œผ๋ฉด ์‹ค์งˆ์ ์ธ ํšจ์œจ-์„ฑ๋Šฅ ๊ฐœ์„  ๋ฐฉ์•ˆ์„ ์–ป์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
016 ๋…ผ๋ฌธ์€ AutoML ๋„๊ตฌ์˜ ๋Œ€๊ทœ๋ชจ ์‹คํ—˜์  ํ‰๊ฐ€๋ฅผ ํ†ตํ•ด, AIRS-Bench์˜ ์—ฐ๊ตฌ ์—์ด์ „ํŠธ๊ฐ€ ์‹ค์ œ ์ž๋™์—ฐ๊ตฌ ์‹œ์Šคํ…œ์— ์–ด๋–ป๊ฒŒ ๊ธฐ์—ฌํ•˜๊ณ  ์„ฑ๊ณผ๋ฅผ ๋‚ผ ์ˆ˜ ์žˆ๋Š”์ง€ ์‹ค์ฆ์ ์œผ๋กœ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •