MLCopilot: Unleashing the power of large language models in solving machine learning tasks

์ €์ž: Lei Zhang, Yuge Zhang, Kan Ren, Dongsheng Li, Yuqing Yang | ๋‚ ์งœ: 2023 | DOI: N/A 📄 PDF


Essence

Figure 1

MLCopilot์˜ ์˜คํ”„๋ผ์ธ ๋ฐ ์˜จ๋ผ์ธ ๋‹จ๊ณ„ ๊ฐœ์š”

๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์„ ํ™œ์šฉํ•˜์—ฌ ๊ณผ๊ฑฐ ML ์ž‘์—…์˜ ๊ฒฝํ—˜์œผ๋กœ๋ถ€ํ„ฐ ์ง€์‹์„ ์ถ”์ถœํ•˜๊ณ , ์ƒˆ๋กœ์šด ML ์ž‘์—…์— ๋Œ€ํ•œ ์†”๋ฃจ์…˜์„ ์ฆ‰์‹œ ์ œ์‹œํ•˜๋Š” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ์ด๋Š” ์‹œ๊ฐ„์ด ๋งŽ์ด ์†Œ์š”๋˜๋Š” AutoML ๋ฐฉ์‹๊ณผ ๋‹ฌ๋ฆฌ ์ธ๊ฐ„์˜ ๋ฌธ์ œ ํ•ด๊ฒฐ ๋ฐฉ์‹์„ ๋ชจ๋ฐฉํ•œ ํ•ด์„ ๊ฐ€๋Šฅํ•œ ์†”๋ฃจ์…˜์„ ์ œ๊ณตํ•œ๋‹ค.

Motivation

Achievement

Figure 1

MLCopilot์˜ ์˜คํ”„๋ผ์ธ ๋ฐ ์˜จ๋ผ์ธ ๋‹จ๊ณ„: ๊ณผ๊ฑฐ ๊ฒฝํ—˜์œผ๋กœ๋ถ€ํ„ฐ ์ง€์‹ ์ถ”์ถœ ๋ฐ ์ƒˆ ์ž‘์—… ํ•ด๊ฒฐ

  1. LLM์„ ML ์ž‘์—… ํ•ด๊ฒฐ์— ์ตœ์ดˆ ์ ์šฉ: LLM์ด ์ •๊ตฌ์กฐํ™”๋œ ์ž…๋ ฅ(structured inputs)์„ ์ดํ•ดํ•˜๊ณ  ML ์ž‘์—…์— ๋Œ€ํ•œ ์‹ฌ์ธต์  ์ถ”๋ก ์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Œ์„ ์ž…์ฆํ–ˆ๋‹ค.
  2. ๊ณ ์† ์†”๋ฃจ์…˜ ์ƒ์„ฑ: ์‹œ๊ฐ„ ์†Œ๋ชจ์ ์ธ ์ตœ์ ํ™” ํƒ์ƒ‰ ์—†์ด ๋‹จ์ผ ๋ผ์šด๋“œ์˜ LLM ์ธํ„ฐ๋ž™์…˜์œผ๋กœ ์—ฌ๋Ÿฌ ML ์†”๋ฃจ์…˜์„ ๊ฑฐ์˜ ์ฆ‰์‹œ ์ œ์‹œํ•  ์ˆ˜ ์žˆ๋‹ค.
  3. ํ•ด์„ ๊ฐ€๋Šฅํ•œ ๊ฒฐ๊ณผ ์ œ๊ณต: LLM์˜ ํ…์ŠคํŠธ ์ดํ•ด ๋ฐ ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ํ™œ์šฉํ•˜์—ฌ ์ธ๊ฐ„์ด ์ดํ•ดํ•˜๊ณ  ๊ฒ€์ฆํ•  ์ˆ˜ ์žˆ๋Š” ์ถ”๋ก  ๊ณผ์ •๊ณผ ํ•จ๊ป˜ ML ์†”๋ฃจ์…˜์„ ์ œ์‹œํ•œ๋‹ค.
  4. ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ์„ฑ๋Šฅ: ๋‹ค์–‘ํ•œ ์‹ค์ œ ML ๋ฒค์น˜๋งˆํฌ์—์„œ ๊ธฐ์กด ๋ฐฉ๋ฒ•๊ณผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๊ฑฐ๋‚˜ ๋” ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•œ๋‹ค.

How

Figure 1

MLCopilot์˜ ์ „์ฒด ์•„ํ‚คํ…์ฒ˜: ์˜คํ”„๋ผ์ธ ๋ฐ ์˜จ๋ผ์ธ ๋‹จ๊ณ„

์˜คํ”„๋ผ์ธ ๋‹จ๊ณ„ (Offline Stage)

์˜จ๋ผ์ธ ๋‹จ๊ณ„ (Online Stage)

ํ•ต์‹ฌ ์„ค๊ณ„ ์›์น™

Originality

Limitation & Further Study

Evaluation

์ดํ‰: MLCopilot์€ LLM์˜ ๊ฐ•๋ ฅํ•œ ์ถ”๋ก  ๋Šฅ๋ ฅ๊ณผ ๊ณผ๊ฑฐ ๊ฒฝํ—˜ ๊ธฐ๋ฐ˜ ํ•™์Šต์„ ๊ฒฐํ•ฉํ•˜์—ฌ ํ•ด์„ ๊ฐ€๋Šฅํ•˜๊ณ  ์‹ ์†ํ•œ ML ์†”๋ฃจ์…˜ ์ƒ์„ฑ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•œ ํ˜์‹ ์  ํ”„๋ ˆ์ž„์›Œํฌ์ด๋‹ค. ๋‹ค๋งŒ ์ˆ˜ํ•™์  ์ถ”๋ก  ํ•œ๊ณ„์™€ ๊ด‘๋ฒ”์œ„ํ•œ ์„ฑ๋Šฅ ๊ฒ€์ฆ์ด ํ•„์š”ํ•˜๋ฉฐ, ํ›„์† ์—ฐ๊ตฌ๋ฅผ ํ†ตํ•ด ๋”์šฑ ๊ฐ•๋ ฅํ•˜๊ณ  ์ผ๋ฐ˜ํ™”๋œ ์ ‘๊ทผ๋ฒ•์œผ๋กœ ๋ฐœ์ „ํ•  ์—ฌ์ง€๊ฐ€ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ReAct๋Š” ์ถ”๋ก ๊ณผ ํ–‰๋™์„ ๊ฒฐํ•ฉํ•œ LLM์˜ ์‹œ๋„ˆ์ง€๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, MLCopilot์˜ ์ธ๊ฐ„ ์œ ์‚ฌ ๋ฌธ์ œํ•ด๊ฒฐ ํ”Œ๋กœ์šฐ์— ๊ทผ๊ฐ„์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
AutoML๊ณผ LLM ๊ธฐ๋ฐ˜ ์ง€์› ๋ฐฉ์‹์˜ ์žฅ๋‹จ์ , ์‹ค์ œ ํ˜„์žฅ ์ ์šฉ์ƒ์˜ ๋„์ „ ๊ณผ์ œ๋ฅผ ์ตœ์‹  ๊ด€์ ์—์„œ ์ •๋ฆฌํ•ด MLcopilot์˜ ์‹ค์šฉ์„ฑ ๋ฐ ํ•œ๊ณ„๋ฅผ ๋น„ํŒ์ ์œผ๋กœ ์กฐ๋งํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
568๋ฒˆ ๋…ผ๋ฌธ์€ ์ˆ˜ํ•™ ์ •๋ฆฌ์™€ ์ฆ๋ช… ๋ฐ์ดํ„ฐ์˜ ๋Œ€๋Ÿ‰ ํ•ฉ์„ฑ ์‹œ์Šคํ…œ์„ ์†Œ๊ฐœํ•˜์—ฌ, 543๋ฒˆ์˜ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์†”๋ฃจ์…˜ ์ œ์•ˆ ๋ฐ ์ž๋™ํ™”์— ํ•„์š”ํ•œ ๋ฐ์ดํ„ฐ ์šด์šฉ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Œ€ํ˜•์–ธ์–ด๋ชจ๋ธ์„ ๋‹ค์–‘ํ•œ ๊ณผํ•™ ์‹คํ—˜ ๋กœ๋ด‡/์„ผ์„œ ์ œ์–ด์— ์ ‘๋ชฉํ•˜๋Š” ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, QCopilot์˜ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ์ „๋žต ์„ค๊ณ„์— ๊ทผ๊ฑฐ๊ฐ€ ๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ AutoML ๋˜๋Š” ๊ธฐ๊ณ„ํ•™์Šต ์ž๋™ํ™”์˜ ์œ ์‚ฌํ•œ ์ ‘๊ทผ ๋ฐฉ์‹์„ ๋‹ค๋ฃฌ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์˜๋ฏธ๋ก ์  ํ…์ŠคํŠธ ๋ถ„์„์„ ์œ„ํ•œ ๊ตฌ๋ฌธ ์ •๋ณด ํ™œ์šฉ ๋ชจ๋ธ์„ ์ œ์•ˆํ•œ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
121๋ฒˆ์€ ์™„์ „ ์ž๋™ํ™” ์˜คํ† ML ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ ๋ฐฉ์‹์œผ๋กœ, MLCopilot์˜ ํ•ด์„์  ์—์ด์ „ํŠธ ๊ตฌ์กฐ์™€ ๋Œ€์กฐ์  ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
MLCopilot ์—ญ์‹œ LLM ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ๋ฐ ML ์ž‘์—… ์ตœ์ ํ™” ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ์ง€๋งŒ, ์‚ฌ๋žŒ์˜ ๊ฒฝํ—˜ ์ „์ด์™€ ํ•ด์„์„ฑ์— ๋” ์ง‘์ค‘ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
016์˜ ๊ธฐ์กด AutoML ๋ฒค์น˜๋งˆํ‚น๊ณผ ๋‹ฌ๋ฆฌ 543์€ LLM์„ ํ™œ์šฉํ•œ ๊ธฐ๊ณ„ํ•™์Šต ํ˜‘์—… ์ž๋™ํ™”์— ์ง‘์ค‘ํ•˜์—ฌ ์„œ๋กœ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ถ„์ž ํ‘œํ˜„ ํ•™์Šต์„ ํ†ตํ•ด ํ™”ํ•™ ๋ฌผ์„ฑ ์˜ˆ์ธก์˜ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™โ€ง๊ณตํ•™ ์ฝ”๋“œ ์ž‘์„ฑ ๋ณด์กฐ๋ฅผ ์œ„ํ•œ LLM ์ฝ”ํŒŒ์ผ๋Ÿฟ์˜ ๋‹ค๊ฐ์  ๊ธฐ๋Šฅ๊ณผ ์‹ค์ œ ์‚ฌ๋ก€๋ฅผ ๋น„๊ตํ•ด๋ณผ ์ˆ˜ ์žˆ์Œ.
ํ›„์† ์—ฐ๊ตฌ
MLR-COPILOT์€ LLM ๊ธฐ๋ฐ˜ ํŒŒ์ผ ์กฐ์ž‘ ๋ฐ ์‹คํ—˜ ์ž๋™ํ™” ์ „๋ฐ˜์œผ๋กœ ์ ์šฉ ๋ฒ”์œ„๋ฅผ ๋„“ํ˜€, LLM์„ ์ด์šฉํ•œ AI ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์ž๋™ํ™”์˜ ์‹ค์งˆ์  ํ™•์žฅ ์˜ˆ์‹œ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
543(MLCopilot)์€ LLM ๊ธฐ๋ฐ˜ ๋ณต์žกํ•œ ํ…์ŠคํŠธ ๋ถ„์„๊ณผ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ํ•ด์„์„ ์ง€์›ํ•˜๋Š” ์‹œ์Šคํ…œ์œผ๋กœ, 511์˜ ์ธ๊ฐ„์ฝ”๋” ๋Šฅ๊ฐ€ ์‚ฌ๋ก€์˜ ์‹ค์งˆ์  ๋„๊ตฌํ™”ยท์‘์šฉ ์˜ˆ์‹œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
MLCopilot์€ ReAct๊ฐœ์˜ reasoning-action ๊ฒฐํ•ฉ ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ์ž๋™ํ™”๋œ ML ์‹คํ—˜์— ์‘์šฉํ•œ ์‹ค์ œ ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค€๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ์ฝ”๋“œ ๊ธฐ๋ฐ˜ ํ–‰์œ„์˜ ์‹œ๋ฒ” ์‚ฌ๋ก€๋ฅผ ํ†ตํ•ด, ML ์ž‘์—… ์†”๋ฃจ์…˜ ์ž๋™ ์ƒ์„ฑ์—์„œ LLM์˜ ๋„๊ตฌ ์‚ฌ์šฉ/ํ–‰๋™ ์—ฐ๊ณ„ ๋ฐฉ๋ฒ•์„ ์‹ค๋ฌด์— ์ ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Domain-specific ReAct for physics-integrated iterative modeling์€ ReAct ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์‹ค์ œ ๋ฌผ๋ฆฌ ๋ชจ๋ธ๋ง ๋ฌธ์ œ์— ์ ์šฉํ•œ ์‚ฌ๋ก€๋กœ, MLCopilot์˜ ํ™•์žฅ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค€๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •