LLM ร— MapReduce-V2: Entropy-Driven Convolutional Test-Time Scaling for Generating Long-Form Articles from Extremely Long Resources

์ €์ž: Haoyu Wang, Yujia Fu, Zhu Zhang, Shuo Wang, Zirui Ren, Xiaorong Wang, Zhili Li, Chaoqun He, Bo An, Zhiyuan Liu, Maosong Sun (Tsinghua University ๋“ฑ) | ๋‚ ์งœ: 2025 | DOI: arXiv:2504.05732 📄 PDF


Essence

Figure 1

๊ทธ๋ฆผ 1: ์ž์› ํ™œ์šฉ์—์„œ ์ „ํ†ต์ ์ธ ์ถ”์ถœ์  ๋ฐฉ๋ฒ•(์™ผ์ชฝ)๊ณผ ํ†ตํ•ฉ์  ์ ‘๊ทผ๋ฒ•(์˜ค๋ฅธ์ชฝ)์˜ ๋น„๊ต

๋ณธ ๋…ผ๋ฌธ์€ ๊ทน๋„๋กœ ๊ธด ์ž…๋ ฅ ์ž์›์œผ๋กœ๋ถ€ํ„ฐ ์žฅ๋ฌธ ๊ธฐ์‚ฌ๋ฅผ ์ƒ์„ฑํ•˜๋Š” LLM์˜ ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด, ์ •๋ณด ๋ณ‘๋ชฉ ์ด๋ก ์— ๊ธฐ๋ฐ˜ํ•œ ํ•ฉ์„ฑ๊ณฑ ์‹ ๊ฒฝ๋ง ์˜๊ฐ์˜ ํ…Œ์ŠคํŠธ ํƒ€์ž„ ์Šค์ผ€์ผ๋ง ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•œ๋‹ค. ์ถ”์ถœ์  ๋ฐฉ๋ฒ•์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด ์ž์›์„ ํ†ตํ•ฉ์ ์œผ๋กœ ํ™œ์šฉํ•˜๋Š” ์—”ํŠธ๋กœํ”ผ ๊ธฐ๋ฐ˜ ์ตœ์ ํ™” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์†Œ๊ฐœํ•œ๋‹ค.

Motivation

Achievement

Figure 3

๊ทธ๋ฆผ 3: LLMร—MapReduce-V2์˜ ์ „์ฒด ํŒŒ์ดํ”„๋ผ์ธ. ์ดˆ๊ธฐํ™”, ์Šค์ผˆ๋ ˆํ†ค ๊ฐœ์„ , ์กฐ์‚ฌ ๊ตฌ์„ฑ 3๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ

  1. ์ด๋ก ์  ๊ธฐ๋ฐ˜: ์ •๋ณด ๋ณ‘๋ชฉ ๋ถ„์„์„ ํ†ตํ•ด ์žฅ๋ฌธโ†’์žฅ๋ฌธ ์ƒ์„ฑ์˜ 4๊ฐ€์ง€ ์ตœ์ ํ™” ๋ชฉํ‘œ(๋‹ค์ด์ œ์ŠคํŠธ ์ •๋ณด ์ตœ๋Œ€ํ™”, ์Šค์ผˆ๋ ˆํ†ค ์ •๋ณด ์ตœ๋Œ€ํ™”, ๋ถˆํ•„์š”ํ•œ ์ •๋ณด ์ตœ์†Œํ™”, ์ถ”๊ฐ€ ์ •๋ณด ํฌํ•จ) ๋„์ถœ
  2. ์‹ค์ฆ์  ์„ฑ๊ณผ: ์ œ์•ˆ ๋ฐฉ๋ฒ•์ด ๊ธฐ์ค€์„  ๋Œ€๋น„ ์ฐธ๊ณ ๋ฌธํ—Œ ํ™œ์šฉ์œจ์—์„œ ์ตœ์†Œ 32.9% ํ–ฅ์ƒ์„ ๋‹ฌ์„ฑํ•˜์˜€์œผ๋ฉฐ, ๋‹ค๋ฅธ ํ‰๊ฐ€ ์ง€ํ‘œ์—์„œ๋„ ์ถ”์ถœ์  ๋ฐฉ๋ฒ•๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ ์ž…์ฆ
  3. ๋ฒค์น˜๋งˆํฌ ๊ตฌ์ถ•: ์ปดํ“จํ„ฐ ๊ณผํ•™ ๋ถ„์•ผ ํ•™์ˆ  ์กฐ์‚ฌ(survey)์™€ ์ „์ฒด ์ฐธ๊ณ ๋ฌธํ—Œ์„ ์Œ์œผ๋กœ ํฌํ•จํ•˜๋Š” ์ฒซ ๋Œ€๊ทœ๋ชจ ์žฅ๋ฌธโ†’์žฅ๋ฌธ ์ƒ์„ฑ ํ‰๊ฐ€ ๋ฒค์น˜๋งˆํฌ SurveyEval ๊ฐœ๋ฐœ

How

Figure 2

๊ทธ๋ฆผ 2: ์Šค์ผˆ๋ ˆํ†ค์˜ ๊ตฌ์กฐ ์˜ˆ์‹œ. ๊ฐ ์„น์…˜์— ๋‹ค์ด์ œ์ŠคํŠธ ๊ตฌ์„ฑ๊ณผ ๋ถ„์„ ์ง€์นจ ํฌํ•จ

์ดˆ๊ธฐํ™” ๋‹จ๊ณ„

์Šค์ผˆ๋ ˆํ†ค ๊ฐœ์„  ๋‹จ๊ณ„

์กฐ์‚ฌ ๊ตฌ์„ฑ ๋‹จ๊ณ„

์ •๋ณด ์—”ํŠธ๋กœํ”ผ ๊ณ„์‚ฐ

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ์ •๋ณด ์ด๋ก  ๊ธฐ๋ฐ˜์˜ ๊ฒฌ๊ณ ํ•œ ๋ถ„์„๊ณผ ์‹ค์šฉ์  ํŒŒ์ดํ”„๋ผ์ธ ์„ค๊ณ„๋ฅผ ํ†ตํ•ด ์žฅ๋ฌธโ†’์žฅ๋ฌธ ์ƒ์„ฑ์˜ ์ž์› ํ™œ์šฉ ๋ฌธ์ œ๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ํ•ด๊ฒฐํ•œ ์šฐ์ˆ˜ํ•œ ์—ฐ๊ตฌ์ด๋‹ค. SurveyEval ๋ฒค์น˜๋งˆํฌ์˜ ๊ตฌ์ถ•๊ณผ 32.9% ์ด์ƒ์˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ์€ ์‹ค์งˆ์  ๊ฐ€์น˜๊ฐ€ ์žˆ์œผ๋‚˜, ๋†’์€ ๊ณ„์‚ฐ ๋น„์šฉ๊ณผ ์ผ๋ถ€ ์„ค๊ณ„ ์„ ํƒ์˜ ๋™๊ธฐ ๋ถ€์กฑ์ด ์‹ค๋ฌด ์ ์šฉ์„ ์ œํ•œํ•  ์ˆ˜ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Physics Informed Deep Learning ๋…ผ๋ฌธ์€ ์ •๋ณด ๋ณ‘๋ชฉ์ด๋ก  ๋“ฑ ๋ฌผ๋ฆฌ์  ์ œ์•ฝ์„ LLM ํ™œ์šฉ ๊ตฌ์กฐ์— ์ ์šฉํ•˜๋Š” ๊ธฐ๋ณธ ์›๋ฆฌ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
721๋ฒˆ ๋…ผ๋ฌธ์€ ๋ฌผ๋ฆฌ์ •๋ณด์‹ ๊ฒฝ์—ฐ์‚ฐ(PINO) ๊ฐœ๋…์„ ํฌ๊ด„์ ์œผ๋กœ ๋…ผ์˜ํ•ด, 495๋ฒˆ ๋…ผ๋ฌธ์˜ ์‹ ๊ฒฝ์—ฐ์‚ฐ์ž์™€ LLM ๊ฒฐํ•ฉ ํ”„๋ ˆ์ž„์›Œํฌ์— ํ•„์ˆ˜์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ธด ๋ฌธ๋งฅ ์ฒ˜๋ฆฌ ๋ฐ ๋‰ด์Šค/๊ณผํ•™๋ฌธ์„œ ์ƒ์„ฑ์—์„œ ๋“ฑ์žฅํ•˜๋Š” ๋‹ค์–‘ํ•œ ์–ธ์–ด๋ชจ๋ธ context handling ์ „๋žต๊ณผ ์ตœ์‹  ๋ฐฉํ–ฅ์„ ์—ฐ๊ตฌํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
346๋ฒˆ ๋…ผ๋ฌธ์€ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ๊ธฐ๋ฐ˜์˜ ๋ฐ์ดํ„ฐ ํšจ์œจ์  ํ™œ์„ฑํ•™์Šต์„ ๋‹ค๋ฃจ๋ฉฐ, ๊ธด ์ž…๋ ฅ ํ™œ์šฉ ๋ฐ ์ตœ์ ํ™” ์•„์ด๋””์–ด์™€ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Galactica ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋„๋ฉ”์ธ์šฉ LLM ๋Œ€๊ทœ๋ชจ ์„ค๊ณ„์™€ ๋น„๊ตํ•ด, MapReduce-V2 ์ ‘๋ชฉ์œผ๋กœ ์žฅ๋ฌธ ์š”์•ฝ ์ ํ•ฉ์„ฑ์„ ๋†’์ด๋Š” ๋ฐฉ๋ฒ•๋ก ์„ ๊ตฌ์‚ฌํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
547๋ฒˆ ๋…ผ๋ฌธ์€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์„ ์ด์šฉํ•œ ๋™์˜์ƒ ๊ธฐ๋ฐ˜ ๋ฐฉ์ •์‹ ๋ฐœ๊ฒฌ์œผ๋กœ, 495๋ฒˆ์˜ ๊ธธ์ด ๋ฌธ์ œ ํ•ด๊ฒฐ๊ณผ ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ ์†Œ์Šค ๋ฐ ์ตœ์ ํ™” ๊ด€์  ์ ‘๊ทผ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Physics-Informed Neural Operator ๋…ผ๋ฌธ์€ ๋ฌผ๋ฆฌ ์ œ์•ฝ ์‹ ๊ฒฝ ์—ฐ์‚ฐ์ž๋ฅผ ๋‹ค์–‘ํ•œ ์—ญ๋ฌธ์ œ์— ์‹ค์ œ ์ ์šฉํ•˜๋Š” ๋ฐฉ์‹์„ ํ†ตํ•ด LLM ๊ธฐ๋ฐ˜ ๋ฒ”์šฉ ์Šค์ผ€์ผ๋ง ๋ฐฉ๋ฒ•๋ก ์˜ ์ ์šฉ์„ฑ๊ณผ ํ•œ๊ณ„๋ฅผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM์˜ ํ…Œ์ŠคํŠธ ํƒ€์ž„ ์ตœ์ ํ™” ์ „๋žต(์ •๋ณด ๋ณ‘๋ชฉ ๊ธฐ๋ฐ˜)์ด diffusion ๋ชจ๋ธ์˜ inference-time alignment์— ์‘์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
OSDA Agent๋Š” LLM์œผ๋กœ de novo ๋ถ„์ž ์„ค๊ณ„ ์‹œ๊ทน๋„๋กœ ๊ธด ์ž…๋ ฅ ์ •๋ณด ํ™œ์šฉ ๋ฐ ์—”ํŠธ๋กœํ”ผ ์ตœ์ ํ™” ๊ด€๋ จ ์ ์šฉ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ํ…Œ์ŠคํŠธ ํƒ€์ž„ ๊ฐœ์„ , ๋ฐ˜๋ณต์  ๋””ํ“จ์ „ ๋ฐ ์ƒ˜ํ”Œ ๋ฆฌํŒŒ์ธ๋จผํŠธ์— Entropy-Driven ์ปจ์…‰์„ ํ™•์žฅํ•ด ์ ์šฉํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
495๋ฒˆ์˜ ์—”ํŠธ๋กœํ”ผ ๊ธฐ๋ฐ˜ ์žฅ๋ฌธ ํ…์ŠคํŠธ ์ƒ์„ฑ ๋ฐ ํ†ตํ•ฉ์  ์ตœ์ ํ™” ์•„์ด๋””์–ด๊ฐ€ 589๋ฒˆ ๋…ผ๋ฌธ์˜ CFD ๋ฐ์ดํ„ฐ ์‘์šฉ ์˜ˆ์‹œ์™€ ๋งž๋‹ฟ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
ํ…Œ์ŠคํŠธ ํƒ€์ž„ ์ตœ์ ํ™”์™€ inference-time alignment ์•„์ด๋””์–ด๊ฐ€ ์ •๋ณด ๋ณ‘๋ชฉ ์ด๋ก  ๋ฐ LLM์˜ ์‹ค์ œ ์ž…๋ ฅ ์ •์ฑ…๊ณผ ์—ฐ๊ฒฐ๋˜์–ด diffusion ๋ชจ๋ธ์—๋„ ์ ์šฉ๋  ์ˆ˜ ์žˆ์Œ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •