Estimating optimal context length for hybrid retrieval-augmented multi-document summarization

์ €์ž: Adithya Pratapa, Teruko Mitamura | ๋‚ ์งœ: 2025 | DOI: arXiv:2504.12972


Essence

์ตœ๊ทผ ๋Œ€ํ˜• ์–ธ์–ด๋ชจ๋ธ(LLM)์˜ ์žฅ๋ฌธ๋งฅ ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ ํ–ฅ์ƒ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ์‹ค์ œ๋กœ๋Š” ์„ ์–ธ๋œ ๋ฌธ๋งฅ ๊ธธ์ด์—์„œ ํšจ๊ณผ์ ์ด์ง€ ๋ชปํ•œ ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค. ๋ณธ ๋…ผ๋ฌธ์€ ๊ฒ€์ƒ‰์ฆ๊ฐ•์ƒ์„ฑ(RAG)๊ณผ ์žฅ๋ฌธ๋งฅ ๋ชจ๋ธ์„ ๊ฒฐํ•ฉํ•˜๋˜, ๋‹ค์ค‘๋ฌธ์„œ ์š”์•ฝ ์ž‘์—…์— ์ตœ์ ํ™”๋œ ๊ฒ€์ƒ‰ ๋ฌธ๋งฅ ๊ธธ์ด๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ์ถ”์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•œ๋‹ค.

Motivation

Achievement

Figure 1

์ œ์•ˆ ๋ฐฉ๋ฒ•์˜ ๊ฐœ์š”: ๊ธฐ์กด ๋ฒค์น˜๋งˆํฌ์™€ ๋‹ฌ๋ฆฌ ๋ฐ์ดํ„ฐ์…‹, ๊ฒ€์ƒ‰๊ธฐ, ์š”์•ฝ๊ธฐ์˜ ํ•จ์ˆ˜๋กœ์„œ ์ตœ์  ๊ฒ€์ƒ‰ ๊ธธ์ด ์ถ”์ •

  1. ๋‹ค์–‘ํ•œ ๋ชจ๋ธ ๊ทœ๋ชจ์—์„œ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ: 0.5B~72B ๋งค๊ฐœ๋ณ€์ˆ˜ ๋ฒ”์œ„์˜ ๋ชจ๋ธ๋“ค์—์„œ ์ „์ฒด ๋งฅ๋ฝ(full-context) ์„ค์ •์„ ํฌ๊ฒŒ ๋Šฅ๊ฐ€
  2. ์ดˆ์žฅ๋ฌธ๋งฅ ๋ชจ๋ธ์—์„œ ํŠนํžˆ ํšจ๊ณผ์ : Qwen 2.5 1M, ProLong 512K ๊ฐ™์€ ๋งค์šฐ ํฐ ๋ฌธ๋งฅ์„ ์ง€์›ํ•˜๋Š” ๋ชจ๋ธ์—์„œ RULER/HELMET ๊ธฐ๋ฐ˜ ์ถ”์ •๋ณด๋‹ค ํ˜„์ €ํžˆ ์šฐ์ˆ˜
  3. ๋ชจ๋ธ ํด๋ž˜์Šค ์™ธ ์ผ๋ฐ˜ํ™”: LLM ํŒจ๋„์— ํฌํ•จ๋˜์ง€ ์•Š์€ Phi-3 ๊ฐ™์€ ๋ชจ๋ธ ํด๋ž˜์Šค์—๋„ ์šฐ์ˆ˜ํ•œ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ ์ž…์ฆ
  4. ์ผ๊ด€๋œ ์„ฑ๋Šฅ ์šฐ์œ„: ๋Œ€๋ถ€๋ถ„์˜ ์„ค์ •์—์„œ HELMET ๋ฐ RULER ๊ธฐ๋ฐ˜ ์ถ”์ •์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ์ผ๊ด€๋œ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ

How

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ RAG ๊ธฐ๋ฐ˜ ๋‹ค์ค‘๋ฌธ์„œ ์š”์•ฝ์—์„œ ๊ฒ€์ƒ‰ ๋ฌธ๋งฅ ๊ธธ์ด ์ตœ์ ํ™”์˜ ์‹ค๋ฌด์  ๋ฌธ์ œ๋ฅผ ํƒ€๋‹นํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ ํ•ด๊ฒฐํ•œ๋‹ค. ๋‹ค๋งŒ ๋‹จ์ผ ๋ฐ์ดํ„ฐ์…‹ ํ‰๊ฐ€, ์ œํ•œ์  ๊ณ„์‚ฐ ์˜ค๋ฒ„ํ—ค๋“œ ๋ถ„์„, ์„ค๊ณ„ ์„ ํƒ์˜ ์ •๋‹น์„ฑ ๋ถ€์กฑ ๋“ฑ์œผ๋กœ ์ธํ•ด ํ•™์ˆ ์  ๊ธฐ์—ฌ๋„๋Š” ์ค‘๊ฐ„ ์ˆ˜์ค€์ด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
335๋Š” ๊ฒ€์ƒ‰์ฆ๊ฐ• LLM์˜ few-shot ์„ฑ๋Šฅ๊ณผ ๋ฌธ๋งฅ ์ฒ˜๋ฆฌ ํ•œ๊ณ„ ์—ฐ๊ตฌ๋กœ, 318์˜ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ RAG์™€ ์žฅ๋ฌธ๋งฅ ์กฐ์ • ๋ฌธ์ œ์˜ ์ด๋ก ์  ์ถœ๋ฐœ์ ์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Retrieval-Augmented Generation for Large Language Models: A Survey๋Š” RAG์˜ ํ•œ๊ณ„ ๋ฐ ๋ฌธ๋งฅ ๊ธธ์ด ๋ฌธ์ œ์— ๋Œ€ํ•œ ์ด๋ก ์ ยท์‹ค์ฆ์  ์ •๋ฆฌ๋กœ 318์˜ ์—ฐ๊ตฌ ์„ค๊ณ„์— ๊ธฐ๋ฐ˜์  ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋กฑ์ปจํ…์ŠคํŠธ LLM์˜ ํ•œ๊ณ„์™€ ํ‰๊ฐ€ ๋ฒค์น˜๋งˆํฌ๋ฅผ ํญ๋„“๊ฒŒ ๋‹ค๋ฃจ์–ด, ๊ฒ€์ƒ‰ ๋ฌธ๋งฅ ๊ธธ์ด ์ตœ์ ํ™” ์—ฐ๊ตฌ์˜ ์ด๋ก  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ปจํ…์ŠคํŠธ ๊ธธ์ด ์ตœ์ ํ™” ๋ฐ ๋ฉ€ํ‹ฐ RAG ์ „๋žต ์—ฐ๊ตฌ๋กœ, ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ์ž๋™ํ™”์—์„œ ํ•„์š”ํ•œ ๊ธฐ์ˆ ์  ํ†ต์ฐฐ์„ ์ œ๊ณตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
675๋Š” RAG(Retrieval-Augmented Generation) ๋ชจ๋ธ ์ „๋ฐ˜์˜ ์ตœ์‹  ๋ฐฉ๋ฒ•๊ณผ ๊ณผ์ œ๋ฅผ ์ œ์‹œํ•˜์—ฌ, 318์˜ ๋ฌธ๋งฅ ์ตœ์ ํ™” ์—ฐ๊ตฌ๋ฅผ ๋„“์€ ๋งฅ๋ฝ์—์„œ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
318์€ RAG์˜ ์ปจํ…์ŠคํŠธ ๊ธธ์ด ์„ค์ • ์ตœ์ ํ™” ๋“ฑ์„ ๋‹ค๋ค„ 036์˜ ์ ‘๊ทผ ๋ถ„๋ฅ˜๋ฅผ ์‹ค์ œ ์‹คํ—˜ ํŒŒ๋ผ๋ฏธํ„ฐ ๊ฒฐ์ • ์ธก๋ฉด์œผ๋กœ ํ™•์žฅํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Litllm์€ RAG์™€ LLM์„ ๊ฒฐํ•ฉํ•˜์—ฌ ๊ด€๋ จ ๋…ผ๋ฌธ ์š”์•ฝ์„ ์ž๋™ํ™”ํ•˜๋ฉฐ, ์‹ค์ œ๋กœ ์–ด๋–ค ๋ฌธ๋งฅ ๊ธธ์ด ๋ฐ ์ฆ๊ฐ• ๋ฐฉ๋ฒ•์ด ํšจ๊ณผ์ ์ธ์ง€ ํƒ๊ตฌํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
318์€ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ RAG ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋ถ„์•ผ ๋ฌธํ—Œ ์ž๋™ํ™” ๋„๊ตฌ๋กœ, ํ™˜๊ฒฝ ๋ฐ ์ž์—ฐ๊ณผํ•™ ์‘์šฉ์— ์žˆ์–ด ์‹ค์ œ์  ๋„๊ตฌ ํ‰๊ฐ€ ์˜ˆ์‹œ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •