์ ์: Yunfan Gao, Yun Xiong, Xinyu Gao, Kangxiang Jia, Jin Pan | ๋ ์ง: 2023 | URL: https://arxiv.org/abs/2312.10997 📄 PDF
Fig. 2. A representative instance of the RAG process applied to question answering. It mainly consists of 3 steps. 1) In
์ด ๋ ผ๋ฌธ์ Large Language Models(LLMs)์ hallucination, ์ง์ ๋ถ์กฑ, ์ถ๋ก ๊ณผ์ ์ ๋ถํฌ๋ช ์ฑ ๋ฑ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด Retrieval-Augmented Generation(RAG) ๊ธฐ์ ์ ๋ฐ์ ์ ์ฒด๊ณ์ ์ผ๋ก ์กฐ์ฌํ๋ ์ข ํฉ ์ค๋ฌธ ๋ ผ๋ฌธ์ด๋ค. RAG ์ฐ๊ตฌ๋ฅผ Naive RAG, Advanced RAG, Modular RAG์ ์ธ ๊ฐ์ง ํจ๋ฌ๋ค์์ผ๋ก ๋ถ๋ฅํ๊ณ , retrieval, generation, augmentation์ ํต์ฌ ๊ธฐ์ ์์๋ฅผ ์์ธํ ๋ถ์ํ๋ค.
Fig. 1. Technology tree of RAG research. The stages of involving RAG mainly include pre-training, fine-tuning, and infer
โข RAG ํจ๋ฌ๋ค์ ๋ถ๋ฅ: Naive RAG(Retrieve-Read), Advanced RAG, Modular RAG์ ์งํ ๋จ๊ณ๋ฅผ ๋ช ํํ ์ ์ํ๊ณ ๊ฐ ๋จ๊ณ์ ํน์ง๊ณผ ๊ฐ์ ์ ์ ์ฒด๊ณํ.
โข ํต์ฌ ๊ธฐ์ ๋ถ์: Retrieval(indexing, query optimization, embedding), Generation(post-retrieval processing, fine-tuning), Augmentation ์ธ ๊ฐ์ง ํต์ฌ ์์์ ์์ธ ๋ถ์.
โข ํ๊ฐ ํ๋ ์์ํฌ: 26๊ฐ ํ์คํฌ, ์ฝ 50๊ฐ ๋ฐ์ดํฐ์ ์ ํฌํจํ๋ ํฌ๊ด์ ์ธ ํ๊ฐ ๋ชฉํ, ํ๊ฐ ์งํ, ๋ฒค์น๋งํฌ ๋ฐ ํ๊ฐ ๋๊ตฌ๋ฅผ ์ ๋ฆฌ.
โข ๊ธฐ์ ํธ๋ฆฌ ์ ์: RAG ์ฐ๊ตฌ์ ๋ฐ์ ๊ฒฝ๋ก๋ฅผ pre-training, fine-tuning, inference ๋จ๊ณ๋ณ๋ก ์๊ฐํํ์ฌ ์ญ์ฌ์ ์งํ ๊ณผ์ ์ ๋ช ํํ ํจ.
Fig. 2. A representative instance of the RAG process applied to question answering. It mainly consists of 3 steps. 1) In
โข Naive RAG์ ์ธ ๋จ๊ณ ํ๋ก์ธ์ค(indexing, retrieval, generation)์์ ๊ฐ ๋จ๊ณ์ ๊ธฐ์ ์ ๊ณผ์ ๋ช ์ (precision/recall ๋ฌธ์ , hallucination, augmentation coherence ๋ฑ)
โข Advanced RAG์ Modular RAG๊ฐ ์ ๊ณผ์ ๋ค์ ์ด๋ป๊ฒ ํด๊ฒฐํ๋์ง ๋จ๊ณ์ ์ผ๋ก ๋ถ์
โข retrieval ๋จ๊ณ์ ์ต์ ํ ๋ฐฉ๋ฒ (๋ฒกํฐ ์ธ๋ฑ์ฑ, ์ฟผ๋ฆฌ ๋ณํ, embedding ๊ฐ์ )
โข generation ๋จ๊ณ์ post-retrieval processing๊ณผ LLM fine-tuning ๊ธฐ๋ฒ
โข ์ธ ๊ฐ์ง augmentation ๊ณผ์ ์ ํน์ฑ๊ณผ ํจ์จ์ฑ ๋น๊ต
โข ๋ค์ด์คํธ๋ฆผ ํ์คํฌ๋ณ(question answering, summarization, domain-specific tasks ๋ฑ) ์ ์ฉ ์ฌ๋ก์ ํ๊ฐ ๋ฉํธ๋ฆญ ์ ์
โข RAG๋ฅผ ์ธ ๊ฐ์ง ๋ช ํํ ํจ๋ฌ๋ค์์ผ๋ก ๋ถ๋ฅํ์ฌ ์งํ ๊ฒฝ๋ก๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ์ ์ (๊ธฐ์กด ์์ ์์๋ RAG ๋ฐฉ๋ฒ๋ค์ ์ฐ๋ฐ์ ์ผ๋ก ๋ค๋ฃธ)
โข retrieval, generation, augmentation์ ๊ตฌ๋ถํ์ฌ ๊ฐ ์์์ ๋ ๋ฆฝ์ ํน์ฑ๊ณผ ์ํธ์์ฉ์ ๋ถ์ํ๋ ํ๋ ์์ํฌ
โข LLM ์๋์ RAG ๋ฐ์ ์ pre-training, fine-tuning, inference ์ธ ๋จ๊ณ๋ก ๊ตฌ์กฐํ
โข ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ์ฌ ๊ธฐ์กด์ ๋ฐฉ๋ฒ๋ก ํธํฅ์ ์์
โข ๋ ผ๋ฌธ์ ๋ฒ์๊ฐ ๋งค์ฐ ๊ด๋ฒ์ํ์ฌ, ๊ฐ ์ธ๋ถ ๊ธฐ์ ์ ์ฌํ ๋ถ์์ด ์ ํ์ ์ผ ๊ฐ๋ฅ์ฑ ์์
โข Naive RAG์ ํ๊ณ(precision/recall ๋ฌธ์ , hallucination)๊ฐ Advanced ๋ฐ Modular RAG์์ ์์ ํ ํด๊ฒฐ๋๋์ง์ ๋ํ ์ ๋์ ๋น๊ต ๋ถ์ ๋ถ์ฌ
โข ํ๊ฐ ๋ฒค์น๋งํฌ ์ ์๋ ํฌ๊ด์ ์ด๋, ๋ค์ํ ํ๊ฐ ๋ฉํธ๋ฆญ ๊ฐ์ ์ผ๊ด์ฑ๊ณผ ํ๋น์ฑ์ ๋ํ ๋ฉํ-๋ถ์ ๋ถ์กฑ
โข ๊ณ์ฐ ๋น์ฉ, ๋ ์ดํด์ ๋ฑ์ ์ค๋ฌด์ ํจ์จ์ฑ ์ธก๋ฉด์ ๋ํ ๋ ผ์ ์ ํ์
โข ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ์ ๋ํ ์ ์์ด ๊ฐ๊ด์ ์ด์ด์ ๊ตฌ์ฒด์ ์ธ ๊ธฐ์ ๋ก๋๋งต์ด ๋ถ์กฑํ ๊ฐ๋ฅ์ฑ
์ดํ: ์ด ์ค๋ฌธ ๋ ผ๋ฌธ์ RAG์ ๋น ๋ฅธ ๋ฐ์ ์ ๋์ํ์ฌ 100๊ฐ ์ด์์ ์ฐ๊ตฌ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ๊ณ ์ธ ๊ฐ์ง ํจ๋ฌ๋ค์์ผ๋ก ๋ถ๋ฅํ๋ฉฐ ํฌ๊ด์ ์ธ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ ์ํจ์ผ๋ก์จ ํ๊ณ์ ์ฐ์ ์ ์ค์ง์ ์ธ ๊ธฐ์ฌ๋ฅผ ํ๋ค. ํนํ LLM ์๋์ RAG ์งํ๋ฅผ ๋ช ํํ ํ๊ณ retrieval-generation-augmentation์ ์ํธ์์ฉ์ ๋ถ์ํ ์ ์ด ๊ฐ์ ์ด๋ค. ๋ค๋ง ๊ฐ ์ธ๋ถ ๊ธฐ์ ์ ๋ํ ์ฌํ ๋ถ์๊ณผ ์ ๋์ ๋น๊ต, ์ค๋ฌด์ ํจ์จ์ฑ ๋ ผ์๊ฐ ๋ณด์๋๋ฉด ๋์ฑ ์์ฑ๋ ๋์ ์๋ฃ๊ฐ ๋ ๊ฒ์ผ๋ก ํ๋จ๋๋ค.