DeepAnalyze: Agentic Large Language Models for Autonomous Data Science

์ €์ž: Shaolei Zhang, Ju Fan, Meihao Fan, Guoliang Li, Xiaoyong Du | ๋‚ ์งœ: 2025-10-19 | DOI: ๋ฏธ์ œ๊ณต 📄 PDF


Essence

Figure 1

DeepAnalyze-8B: ๋ฐ์ดํ„ฐ ์†Œ์Šค์—์„œ ๋ถ„์„๊ฐ€๊ธ‰ ๋ฆฌํฌํŠธ๊นŒ์ง€ ์—”๋“œ-ํˆฌ-์—”๋“œ ์ž๋™ ๋ฐ์ดํ„ฐ ๊ณผํ•™์„ ์ˆ˜ํ–‰ํ•˜๋Š” ์—์ด์ „ํ‹ฑ LLM

๋ณธ ๋…ผ๋ฌธ์€ ์›์‹œ ๋ฐ์ดํ„ฐ์—์„œ ๋ถ„์„๊ฐ€๊ธ‰ ์‹ฌ์ธต ์—ฐ๊ตฌ ๋ณด๊ณ ์„œ๊นŒ์ง€ ์™„์ „ ์ž๋™ํ™”๋œ ๋ฐ์ดํ„ฐ ๊ณผํ•™(autonomous data science)์„ ๋‹ฌ์„ฑํ•˜๋Š” ์ตœ์ดˆ์˜ ์—์ด์ „ํ‹ฑ LLM์ธ DeepAnalyze-8B๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ๋‹จ 8B ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ ๊ณ ๊ธ‰ ๋…์  LLM ๊ธฐ๋ฐ˜์˜ ๊ธฐ์กด ์›Œํฌํ”Œ๋กœ์šฐ ์—์ด์ „ํŠธ๋ฅผ ๋Šฅ๊ฐ€ํ•˜๋Š” ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค€๋‹ค.

Motivation

Achievement

Figure 3

DeepAnalyze ์•„ํ‚คํ…์ฒ˜: ์ž์œจ ์กฐ์œจ(autonomous orchestration)๊ณผ ์ ์‘ํ˜• ์ตœ์ ํ™”(adaptive optimization) ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ˜ ์—์ด์ „ํ‹ฑ ์‹œ์Šคํ…œ

  1. ์—”๋“œ-ํˆฌ-์—”๋“œ ์ž๋™ํ™”: ๋ฐ์ดํ„ฐ ์ค€๋น„(data preparation), ๋ถ„์„(analysis), ๋ชจ๋ธ๋ง(modeling), ์‹œ๊ฐํ™”(visualization), ๋ฆฌํฌํŠธ ์ƒ์„ฑ๊นŒ์ง€ ์ „์ฒด ํŒŒ์ดํ”„๋ผ์ธ์„ ์ž๋™์œผ๋กœ ์™„์„ฑ
  2. ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์ž‘์—… ์ง€์›: ๋ฐ์ดํ„ฐ ์งˆ๋ฌธ ๋‹ต๋ณ€(data QA), ํŠนํ™”๋œ ๋ถ„์„ ์ž‘์—…(specialized analytics), ๊ฐœ๋ฐฉํ˜• ๋ฐ์ดํ„ฐ ์—ฐ๊ตฌ(open-ended data research) ๋“ฑ ๊ด‘๋ฒ”์œ„ํ•œ ๋ฐ์ดํ„ฐ ๊ณผํ•™ ์ž‘์—… ์ˆ˜ํ–‰
  3. ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ: 8B ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ ์ตœ๊ณ ๊ธ‰ ๋…์  LLM ๊ธฐ๋ฐ˜์˜ ๊ธฐ์กด ์›Œํฌํ”Œ๋กœ์šฐ ์—์ด์ „ํŠธ ๋Šฅ๊ฐ€
  4. ์™„์ „ ๊ณต๊ฐœ: ๋ชจ๋ธ, ์ฝ”๋“œ, ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ(DataScience-Instruct-500K) ์ „๋Ÿ‰ ์˜คํ”ˆ์†Œ์Šค ์ œ๊ณต

How

Figure 4

์—์ด์ „ํ‹ฑ ๊ฐ•ํ™”ํ•™์Šต(Agentic RL) ๊ฐœ์š”: ํ™˜๊ฒฝ๊ณผ์˜ ์ƒํ˜ธ์ž‘์šฉ์„ ํ†ตํ•œ ํ”ผ๋“œ๋ฐฑ ๊ธฐ๋ฐ˜ ํ•™์Šต

Figure 5

๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ๊ถค์  ํ•ฉ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ: ๊ณ ํ’ˆ์งˆ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ๊ตฌ์„ฑ ํ”„๋กœ์„ธ์Šค

Originality

Limitation & Further Study

Evaluation

์ดํ‰: DeepAnalyze๋Š” ์ž๋™ํ™”๋œ ๋ฐ์ดํ„ฐ ๊ณผํ•™์„ ํ–ฅํ•œ ์‹ค์งˆ์ ์ด๊ณ  ์ค‘์š”ํ•œ ์ฒซ ๊ฑธ์Œ์„ ์ œ์‹œํ•˜๋ฉฐ, ์ปค๋ฆฌํ˜๋Ÿผ ๊ธฐ๋ฐ˜ ํ›ˆ๋ จ๊ณผ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ๊ถค์  ํ•ฉ์„ฑ์€ LLM ์—์ด์ „ํŠธ ํ›ˆ๋ จ์˜ ์ƒˆ๋กœ์šด ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์ œ์•ˆํ•œ๋‹ค. 8B ๋ชจ๋ธ๋กœ ๋Œ€ํ˜• ๋…์  ๋ชจ๋ธ์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ํšจ์œจ์„ฑ๊ณผ ์™„์ „ ๊ณต๊ฐœ ์ „๋žต์€ ์˜์˜๊ฐ€ ํฌ์ง€๋งŒ, ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ๊ณผ ๋ณต์žกํ•œ ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ์˜ ๊ฐ•๊ฑด์„ฑ ๊ฒ€์ฆ๊ณผ ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ ํ™•์ถฉ์ด ํ›„์† ๊ฐœ์„  ๊ณผ์ œ์ด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
542๋ฒˆ ๋…ผ๋ฌธ์€ ML ๊ณผ์ œ๋ฅผ ์œ„ํ•œ ์–ธ์–ด๋ชจ๋ธ ๊ธฐ๋ฐ˜์˜ ์—์ด์ „ํŠธ ํ‰๊ฐ€์ฒด๊ณ„๋ฅผ ์ œ๊ณตํ•˜์—ฌ, 259๋ฒˆ์˜ ์ž๋™ํ™”๋œ ๋ฐ์ดํ„ฐ ๋ถ„์„ ์„ฑ๊ณผ ๊ฒ€์ฆ์— ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
259๋ฒˆ ๋…ผ๋ฌธ์€ ๋ฐ์ดํ„ฐ ํ•ด์„ ๋ฐ ๋ถ„์„์—์„œ AI ์—์ด์ „ํŠธ ํ™œ์šฉ ์ „๋žต์„ ๋‹ค๋ค„, ํฌ์†Œ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ๋ถ„์žํŠน์„ฑ ์˜ˆ์ธก ๋ชจ๋ธ ๊ตฌ์ถ•์˜ ์ด๋ก ์  ์ฒด๊ณ„๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
259๋ฒˆ ๋…ผ๋ฌธ์€ ์•ฝ๋ฌผ ๋ฐ˜์‘ ํƒ์ƒ‰์„ ์œ„ํ•œ deep active learning ์‹คํ—˜ ์„ค๊ณ„ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•ด, 3081์˜ ํ•ญ์ฒด ํƒ์ƒ‰ ๋ฐ ๊ฒ€์ฆ์˜ ์‹คํ—˜์  ๊ธฐ๋ฐ˜์„ ๊ฐ•ํ™”ํ•˜๋Š” ์ฐธ๊ณ  ์ž๋ฃŒ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Data Interpreter ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ ๊ณผํ•™ ์ž๋™ํ™” ์—์ด์ „ํŠธ๋ฅผ ์ œ์•ˆํ•ด DeepAnalyze์˜ ๋ฌธ์ œ ํ•ด๊ฒฐ ๋ฐฉ์‹์„ ๋น„๊ต ๋ถ„์„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
294๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ์‚ฌ์ด์–ธ์Šค ์—์ด์ „ํŠธ์˜ ๋ฒค์น˜๋งˆํ‚น ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, DeepAnalyze-8B์™€ ๋‹ค๋ฅธ ์‹คํ—˜์กฐ๊ฑด์˜ ์„ฑ๋Šฅ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
259๋ฒˆ ๋…ผ๋ฌธ์€ ์ƒ๋ช…๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์ž๋™ํ™” ๋ฐ ๋ฐ์ดํ„ฐ ์ค‘์‹ฌ ์‹คํ—˜ ์ตœ์ ํ™”๋ฅผ ์ถ”๊ตฌํ•˜์—ฌ, PerTurboAgent์™€ ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฐ์ดํ„ฐ ํ•ด์„ํ˜• ์ž๋™ํ™” ๊ธฐ๋ฐ˜ ๋Œ€๊ทœ๋ชจ LLM ์—์ด์ „ํŠธ๋ฅผ ํ™œ์šฉํ•œ ๋ฐ์ดํ„ฐ ๋ถ„์„ ์ž๋™ํ™” ์‚ฌ๋ก€๋กœ, ์œ ์‚ฌ ๋ฌธ์ œ์˜ ๋‹ค์–‘ํ•œ ์ ‘๊ทผ์„ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
R&D-Agent ๋…ผ๋ฌธ์€ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ AI ์†”๋ฃจ์…˜ ๊ตฌ์ถ•์—์„œ ์ž๋™ํ™”๋œ ๋ฐ์ดํ„ฐ ๊ณผํ•™ ์—์ด์ „ํŠธ์˜ ์„ฑ๋Šฅ๊ณผ DeepAnalyze์™€ ๋น„๊ตํ• ๋งŒํ•œ ๋Œ€์•ˆ ๋ชจ๋ธ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
mlr-copilot ๋…ผ๋ฌธ์€ LLM ํ”„๋กฌํ”„ํŠธ ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ ๊ณผํ•™ ์—์ด์ „ํŠธ๋กœ DeepAnalyze์˜ ์™„์ „ ์ž๋™ํ™”๋ฅผ ์‹ค์ œ ๋จธ์‹ ๋Ÿฌ๋‹ ์—ฐ๊ตฌ ๋ฌธ์ œ์— ์ ์šฉํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
DeepAnalyze ๋…ผ๋ฌธ์€ ๋ณ‘์›์ด ์•„๋‹Œ ๋ฐ์ดํ„ฐ ๊ณผํ•™ ํ™˜๊ฒฝ์—์„œ ์—์ด์ „ํ‹ฑ LLM์ด ์ „๋ฌธ๊ฐ€ ์ˆ˜์ค€ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” ์‚ฌ๋ก€๋กœ, Agent Hospital์˜ ๊ฒฐ๊ณผ ์‘์šฉ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
๋ถ„์ž ํƒ์ƒ‰ ๋ฐ ์„ค๊ณ„ ๋ฌธ์ œ์— ๋Œ€ํ•ด LLM ๊ธฐ๋ฐ˜ ์ž์œจ์  ๋ถ„์„ ์—์ด์ „ํŠธ๋ฅผ ๋„์ž…ํ•ด, ์ˆœ์„œ ๋ฐ ๊ตฌ์กฐ ์ •๋ณด๊ฐ€ ์•„๋‹Œ ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ ์ „๋žต์„ ์ทจํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •