Personalized graph-based retrieval for large language models

์ €์ž: Steven Au, Cameron J. Dimacali, Ojasmitha Pedirappagari, Namyong Park, Franck Dernoncourt, Yu Wang, Nikos Kanakaris, Hanieh Deilamsalehy, Ryan A. Rossi, Nesreen K. Ahmed | ๋‚ ์งœ: 2025 | DOI: N/A 📄 PDF


Essence

Figure 1

PGraphRAG ํ”„๋ ˆ์ž„์›Œํฌ ๊ฐœ์š”. ์‚ฌ์šฉ์ž ํ”„๋กœํ•„๊ณผ ์ƒํ˜ธ์ž‘์šฉ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ์‚ฌ์šฉ์ž ์ค‘์‹ฌ ๊ทธ๋ž˜ํ”„๋ฅผ ๊ตฌ์„ฑํ•˜๊ณ , ๊ทธ๋ž˜ํ”„์—์„œ ๊ตฌ์กฐํ™”๋œ ์‚ฌ์šฉ์ž ๊ด€๋ จ ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ํ•˜์—ฌ ์–ธ์–ด ๋ชจ๋ธ์˜ ์ƒ์„ฑ์„ ์กฐ๊ฑด๋ถ€ํ™”ํ•จ

๋ณธ ๋…ผ๋ฌธ์€ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜์˜ ๊ฐœ์ธํ™”๋œ ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ(PGraphRAG)์„ ์ œ์•ˆํ•˜์—ฌ ์‚ฌ์šฉ์ž ์ด๋ ฅ์ด ๋ถ€์กฑํ•œ ์ฝœ๋“œ์Šคํƒ€ํŠธ ํ™˜๊ฒฝ์—์„œ๋„ LLM์˜ ๊ฐœ์ธํ™”๋œ ํ…์ŠคํŠธ ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚จ๋‹ค. ๊ตฌ์กฐํ™”๋œ ์‚ฌ์šฉ์ž ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ ๊ณผ์ •์— ํ†ตํ•ฉํ•˜์—ฌ ํฌ์†Œ ํ”„๋กœํ•„ ์ƒํ™ฉ์—์„œ๋„ ์œ ์˜๋ฏธํ•œ ๊ฐœ์ธํ™”๋ฅผ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•œ๋‹ค.

Motivation

Achievement

Figure 2

Amazon ์‚ฌ์šฉ์ž-์ œํ’ˆ ๋ฐ์ดํ„ฐ์…‹์—์„œ ์‚ฌ์šฉ์ž ํ”„๋กœํ•„ ํฌ๊ธฐ์˜ ๋ถ„ํฌ. ๋Œ€๋ถ€๋ถ„์˜ ์‚ฌ์šฉ์ž๊ฐ€ ์†Œ์ˆ˜์˜ ๋ฆฌ๋ทฐ๋งŒ ๋ณด์œ ํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, ๋นจ๊ฐ„ ์ˆ˜์ง์„ ์€ LaMP์™€ LongLaMP ๊ฐ™์€ ์„ ํ–‰ ๋ฒค์น˜๋งˆํฌ์—์„œ ์‚ฌ์šฉํ•œ ์ตœ์†Œ ํ”„๋กœํ•„ ํฌ๊ธฐ ์ž„๊ณ„๊ฐ’์„ ํ‘œ์‹œ

  1. ๋ฒค์น˜๋งˆํฌ ๊ธฐ์—ฌ: ์žฅ๋ฌธ ์ƒ์„ฑ(4๊ฐœ ์ž‘์—…), ๋‹จ๋ฌธ ์ƒ์„ฑ(4๊ฐœ ์ž‘์—…), ์„œ์ˆ˜ ๋ถ„๋ฅ˜(4๊ฐœ ์ž‘์—…)๋กœ ๊ตฌ์„ฑ๋œ 12๊ฐœ ์ž‘์—…์˜ ๊ฐœ์ธํ™”๋œ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ํ…์ŠคํŠธ ์ƒ์„ฑ ๋ฒค์น˜๋งˆํฌ ์ œ์‹œ. ์‹ค์ œ ํฌ์†Œ ํ”„๋กœํ•„ ํ™˜๊ฒฝ์„ ๋ฐ˜์˜ํ•˜๋Š” ์ตœ์ดˆ์˜ ํฌ๊ด„์  ํ‰๊ฐ€ ์ž๋ฃŒ
  2. ์„ฑ๋Šฅ ํ–ฅ์ƒ: ์žฅ๋ฌธ ์ƒ์„ฑ์—์„œ ํ‰๊ท  ROUGE-1 14.8% ๊ฐœ์„ , ๋‹จ๋ฌธ ์ƒ์„ฑ์—์„œ 4.6% ๊ฐœ์„ . ํฌ์†Œ ํ”„๋กœํ•„ ํ™˜๊ฒฝ์—์„œ LaMP ๋Œ€๋น„ ํ˜„์ €ํžˆ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ

How

Figure 3

์‚ฌ์šฉ์ž, ์•„์ดํ…œ, ์ƒํ˜ธ์ž‘์šฉ ๊ฐ„์„ (์˜ˆ: ๋ฆฌ๋ทฐ)์„ ๋ณด์—ฌ์ฃผ๋Š” ์ด๋ถ„ ์‚ฌ์šฉ์ž ์ค‘์‹ฌ ๊ทธ๋ž˜ํ”„ G = (U, V, E)์˜ ์˜ˆ์‹œ

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ์‹ค์ œ ํฌ์†Œ ํ”„๋กœํ•„ ํ™˜๊ฒฝ์„ ๋ฐ˜์˜ํ•œ ํฌ๊ด„์  ๋ฒค์น˜๋งˆํฌ๋ฅผ ์ œ์‹œํ•˜๊ณ  ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰์„ ํ†ตํ•ด ๊ฐœ์ธํ™”๋œ LLM ์ƒ์„ฑ ๋ฌธ์ œ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ•ด๊ฒฐํ•œ๋‹ค๋Š” ์ ์—์„œ ์‹ค๋ฌด์  ๊ฐ€์น˜๊ฐ€ ํฌ์ง€๋งŒ, ๊ธฐ์ˆ ์  ์ƒ์„ธ์„ฑ๊ณผ ์ƒˆ๋กœ์šด ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ฐœ๋ฐœ ์ธก๋ฉด์—์„œ๋Š” ๊ฐœ์„ ์˜ ์—ฌ์ง€๊ฐ€ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
REALM ๋…ผ๋ฌธ์€ ๊ตฌ์กฐํ™”๋œ ๊ฒ€์ƒ‰๊ณผ LLM ์ƒ์„ฑ์˜ ๊ฒฐํ•ฉ ๊ธฐ์ดˆ ์›๋ฆฌ๋ฅผ ์„ค๋ช…ํ•˜์—ฌ, ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ๋ชจ๋ธ์˜ ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
675๋ฒˆ ๋…ผ๋ฌธ์€ RAG(retrieval-augmented generation) ๊ตฌ์กฐ์˜ ์ „๋ฐ˜ ์›๋ฆฌ์™€ ๋„์ „๊ณผ์ œ๋ฅผ ๋‹ด์•„, 613๋ฒˆ์˜ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๊ฐœ์ธํ™” RAG ๋ฐฉ๋ฒ•์— ์ผ๋ฐ˜์  ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Agentic retrieval-augmented generation ๋…ผ๋ฌธ์€ RAG/์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๊ฐœ์ธํ™” ํ”„๋ ˆ์ž„์›Œํฌ์— ๋Œ€ํ•œ ์ตœ๊ทผ ์Ÿ์ ๊ณผ ์„ค๊ณ„ ๋ฐฉํ–ฅ์„ ํ’๋ถ€ํ•˜๊ฒŒ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Few-shot Learning with Retrieval Augmented Language Models ๋…ผ๋ฌธ์€ RAG์˜ ๋‹ค๋ฅธ ํ™œ์šฉ ํ˜•ํƒœ๋ฅผ ๋ณด์—ฌ์ฃผ๋ฉด์„œ, PGraphRAG ๊ตฌ์กฐ ๋ฐ ์„ฑ๋Šฅ์„ ๋น„๊ต๋ถ„์„ํ•˜๋Š” ๋ฐ ํ™œ์šฉ๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
448๋ฒˆ์€ AI ์—์ด์ „ํŠธ๊ฐ€ ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์ •๋ณด ๊ฒ€์ฆยท์œ ํšจ์„ฑ ํ‰๊ฐ€๋ฅผ ๋‹ค๋ฃจ์–ด 613๋ฒˆ์˜ PGraphRAG ์‹œ์Šคํ…œ๊ณผ ๋‹ค๋ฅธ ๊ด€์ ์—์„œ ๊ทธ๋ž˜ํ”„ ํ™œ์šฉ๋ฒ•์„ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ฐœ์ธํ™”๋œ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์ธ์šฉ ์ถ”์ฒœ ๋ฐ evidence span ๋งคํ•‘์˜ LLM ํ™œ์šฉ ์‚ฌ๋ก€๋ฅผ ํ†ตํ•ด, ILCiteR๊ณผ ์ƒ์ดํ•œ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Step-back profiling ์—ฐ๊ตฌ๋Š” ์‚ฌ์šฉ์ž์˜ ํžˆ์Šคํ† ๋ฆฌ ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰ ๊ฐœ์ธํ™” ๊ด€๋ จ ๋ฌธ์ œ๋ฅผ ๋…ผํ•˜๊ณ  ํ˜ธํ™˜์„ฑ์„ ๋‹ด๋ณดํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Personalized graph-based retrieval for large language models ๋…ผ๋ฌธ์€ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ RAG ์ ‘๊ทผ๋ฒ•์—์„œ ๊ฐœ์ธํ™”์™€ ํ’ˆ์งˆ ํ–ฅ์ƒ์„ ์‹œ๋„ํ•˜์—ฌ, FRAG์˜ ๋ชจ๋“ˆํ™” ์•„์ด๋””์–ด๋ฅผ ๋ณด์™„์ ์œผ๋กœ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
LLM์„ ํ™œ์šฉํ•œ ๊ฐœ์ธํ™”๋œ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰ ๋ฐฉ๋ฒ•์€ ์ปจํ…์ธ  ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ-์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ตฌ์ถ•์˜ ์‹ค์ œ ํ™œ์šฉ ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •