Essence
๊ทธ๋ฆผ 2: ์ง์์๋ต์ ์ ์ฉ๋ RAG ํ๋ก์ธ์ค - ์ธ๋ฑ์ฑ, ๊ฒ์, ์์ฑ์ 3๋จ๊ณ
๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ํ๊ฐ(hallucination), ์ง์ ๋
ธํํ, ์ถ๋ก ๊ณผ์ ์ ๋ถํฌ๋ช
์ฑ์ ํด๊ฒฐํ๊ธฐ ์ํด ์ธ๋ถ ๋ฐ์ดํฐ๋ฒ ์ด์ค์์ ๊ด๋ จ ์ ๋ณด๋ฅผ ๊ฒ์ํ์ฌ ์์ฑ ๊ณผ์ ์ ๋ณด๊ฐํ๋ Retrieval-Augmented Generation (RAG) ๊ธฐ์ ์ ์ข
ํฉ์ ์ผ๋ก ๋ถ์ํ ๋
ผ๋ฌธ์ด๋ค. ๋ณธ ๋
ผ๋ฌธ์ RAG์ ๋ฐ์ ๋จ๊ณ๋ฅผ Naive RAG, Advanced RAG, Modular RAG๋ก ์ฒด๊ณํํ๊ณ ๊ฐ ๋จ๊ณ์ ํต์ฌ ๊ธฐ์ ๊ณผ ํ๊ฐ ๋ฐฉ๋ฒ๋ก ์ ์์ธํ ์ ์ํ๋ค.
Achievement
๊ทธ๋ฆผ 1: RAG ์ฐ๊ตฌ์ ๊ธฐ์ ํธ๋ฆฌ - ์ฌ์ ํ์ต, ํ์ธํ๋, ์ถ๋ก ๋จ๊ณ๋ณ RAG ์ ์ฉ
๊ทธ๋ฆผ 3: ์ธ ๊ฐ์ง RAG ํจ๋ฌ๋ค์ ๋น๊ต - Naive RAG(์์ฐจ์ ), Advanced RAG(์ต์ ํ), Modular RAG(๋ชจ๋์)
- ์ฒด๊ณ์ ํจ๋ฌ๋ค์ ๋ถ๋ฅ:
- Naive RAG: ์ธ๋ฑ์ฑ โ ๊ฒ์ โ ์์ฑ์ ๊ธฐ๋ณธ 3๋จ๊ณ ํ๋ก์ธ์ค๋ก ๋จ์ํ์ง๋ง ๊ฒ์ ์ ํ๋, ์์ฑ ํ๊ฐ, ์ ๋ณด ํตํฉ์ ๋ฌธ์ ์กด์ฌ
- Advanced RAG: ์ฌ์ ๊ฒ์ ์ต์ ํ(์ฟผ๋ฆฌ ์ฌ์์ฑ, ํ์ฅ) ๋ฐ ์ฌํ ๊ฒ์ ์ฒ๋ฆฌ(์ฌ์์ํ, ์ปจํ
์คํธ ์์ถ)๋ก Naive RAG์ ํ๊ณ ๋ณด์
- Modular RAG: ๋ชจ๋์ ์ค๊ณ๋ก ๋ฐ๋ณต ๊ฒ์, ์ ์ํ ๊ฒ์, ๋ชจ๋ ๊ต์ฒด ๋ฑ ์ ์ฐํ ๊ตฌ์กฐ ์ ๊ณต
- ํต์ฌ ๊ธฐ์ ํตํฉ ๋ถ์:
- ์๋ฒ ๋ฉ ์ต์ ํ, ์ธ๋ฑ์ฑ ๊ธฐ๋ฒ, ์ฟผ๋ฆฌ ๋ณํ, ์ฌ์์ํ, ์ปจํ
์คํธ ์์ถ, ํ์ธํ๋ ๋ฑ ๊ฐ ๋จ๊ณ๋ณ ์ธ๋ถ ๊ธฐ์ ๋ถ๋ฅ
- ๊ฒ์๊ณผ ์์ฑ ๊ฐ์ ์๋์ง ํจ๊ณผ ๋ฐ ๊ฐ ๊ธฐ์ ์ ์ํธ์์ฉ ๋ฉ์ปค๋์ฆ ๋ช
์
- ํฌ๊ด์ ํ๊ฐ ์ฒด๊ณ ์ ์:
- 26๊ฐ ๋ค์ด์คํธ๋ฆผ ํ์คํฌ, ์ฝ 50๊ฐ ๋ฐ์ดํฐ์
๋ฐ ํ๊ฐ ์งํ ์ ๋ฆฌ
- ํ์กด ๋ฒค์น๋งํฌ(TREC, MS MARCO, SQuAD ๋ฑ) ๋ฐ ํ๊ฐ ๋๊ตฌ ๋ถ๋ฅ
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ RAG ๋ถ์ผ์ ์ต์ด ๋๊ท๋ชจ ์ข
ํฉ ์กฐ์ฌ๋ก์ ์ฒด๊ณ์ ์ธ ๋ถ๋ฅ ์ฒด๊ณ์ ๊ธฐ์ ํธ๋ฆฌ๋ฅผ ์ ์ํ์ฌ ํ๊ณ์ ์ฐ์
๊ณ์ RAG ์ดํด๋ฅผ ํฌ๊ฒ ํฅ์์ํจ ์๋ฏธ ์๋ ๊ธฐ์ฌ๋ฅผ ํ๋ค. ๋ค๋ง ๊ฐ๋ณ ๊ธฐ์ ์ ์ ๋์ ์ฑ๋ฅ ๋น๊ต์ ์ค๋ฌด ์ ์ฉ ์ ์์ฌ๊ฒฐ์ ๊ฐ์ด๋๋ผ์ธ์ด ๋ณด๊ฐ๋๋ฉด ๋์ฑ ๊ฐ์น ์๋ ์๋ฃ๊ฐ ๋ ๊ฒ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Retrieval-Augmented Generation for Large Language Models ๋
ผ๋ฌธ์ PaperQA๊ฐ ํ์ฉํ๋ retrieval-augmented generation์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Retrieval-augmented generation(RAG)์ ๋ํ ์ฒด๊ณ์ ๋ถ์์ ์ฅ๋ฌธ๋งฅ RAGํ LLM ํ๋ จ ๋ฐ์ดํฐ ๊ตฌ์ฑ์ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
675 ์ญ์ Retrieval-Augmented Generation(RAG) ์์คํ
์๋ฒ ์ด๋ก, 034์ ๋ถ์๊ณผ ๊ทผ๊ฑฐ ๋ฐ ๊ด๋ จ ์์ญ ํ์ฅ์ ๋์์ ์ค๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
675๋ RAG ๊ธฐ์ ์ ์ ๋ฐ์ ๊ฐ์๋ฅผ ์ ๊ณตํ์ฌ, 109์ Wikipedia-like ์ํฐํด ์์ฑ ์ง์ ์์คํ
์ ๊ธฐ๋ฐ ์ด๋ก ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM๊ณผ RAG ๊ธฐ๋ฐ ํ์์ ์ฃผ์ ์กฐ์งํ ๊ธฐ๋ฒ์ ์ด๋ก ยท์์ฉ ๋ํฅ์ ์ ์ํ์ฌ, Knowledge Navigator์ ๊ตฌ์กฐ์ ์ค๊ณ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
RAG ๊ธฐ๋ฒ์ ๋ํ ํญ๋์ ๊ฐ์์ ์ต์ ๋ํฅ์ ๋ค๋ฃจ๋ฉฐ, Agentic RAG์ ๋ฐฐ๊ฒฝ ์ง์์ผ๋ก ํ์ฉํ ์ ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
RAG ์ํคํ
์ฒ ์ ๋ฐ์ ์ต์ ๋ํฅ์ ๋ค๋ฃธ์ผ๋ก์จ, HPC ๊ธฐ๋ฐ ์ด๋๊ท๋ชจ ๊ณผํ ๋
ผ๋ฌธ ๊ฒ์-์์ฑ ์์คํ
์ ์ด๋ก ์ ๋ฐํ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Retrieval-Augmented Generation for Large Language Models ๋
ผ๋ฌธ์ RAG ๊ธฐ๋ฐ ์๋ survey ์์ฑ ๋ฑ SurveyX์ ํต์ฌ ๊ธฐ์ ์ ๊ธฐ๋ฐ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Retrieval-Augmented Generation(RAG) ์ด๋ก ๊ณผ ๊ตฌํ์ ๋ํ ์ต์ ์๋ฒ ์ด๋ฅผ ํตํด Agentic RAG ๋ฐฉ์์ ๊ธฐ๋ณธ ๊ตฌ์กฐ์ ํ๊ณ๋ฅผ ์ดํดํ ์ ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Retrieval-Augmented Generation for Large Language Models ๋
ผ๋ฌธ์ RAG ์์คํ
์ ํต์ฌ ์ด๋ก ๊ณผ ๊ธฐ์ ํ๋ฆ์ ์ฒด๊ณ์ ์ผ๋ก ์์ฝํ์ฌ FRAG ํ๋ ์์ํฌ์ ์ค๊ณ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
675๋ฒ ๋
ผ๋ฌธ์ RAG(retrieval-augmented generation) ๊ตฌ์กฐ์ ์ ๋ฐ ์๋ฆฌ์ ๋์ ๊ณผ์ ๋ฅผ ๋ด์, 613๋ฒ์ ๊ทธ๋ํ ๊ธฐ๋ฐ ๊ฐ์ธํ RAG ๋ฐฉ๋ฒ์ ์ผ๋ฐ์ ์ด๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
RAG(Retrieval-Augmented Generation)์ ๊ดํ ์ฌ๋์๋ ๋ฆฌ๋ทฐ ๋
ผ๋ฌธ์ผ๋ก, [530]์ด ์ฑํํ RAG ๊ธฐ๋ฐ QA ์์คํ
์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Retrieval-Augmented Generation(RAG)์ ๊ดํ ์ด๋ก ์ ๋ถ์์ ๊ณผํ์ฐ๊ตฌ LLM ์ ์ฉ(506)์์ ์ ๋ขฐ๋ยท์ง์ ์ ๊ทผ ๋ฐฉ์ ๋
ผ์์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
RAG ๊ณ์ด์ ์ฌ์ ํ์ต ๋ชจ๋ธ(REALM)์ ํตํ retrieval-augmented paradigm์ ์คํ์ ๊ฒ์ฆ ์ฌ๋ก๋ฅผ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Retrieval-Augmented Generation์ ๋ํ ์ด๋ก ์ ยท์ค์ง์ ๋ฐ์ ์ ๋ชจ๋ ๋ค๋ฃจ๋ ์ข
์ค ๋
ผ๋ฌธ์ผ๋ก, RAG ๊ธฐ์ ์ ์งํ ๊ฒฝ๋ก๋ณ ๋ถ์์ ํตํด ์ํธ ๋ณด์์ ์๊ฐ์ ์ป์ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
393์ ์ง์ ๊ทธ๋ํ๋ฅผ ํ์ฉํ RAG ํ๋ ์์ํฌ๋ก, 675์ RAG ๊ฐ๋
์ ๊ทธ๋ํ ๊ธฐ๋ฐ์ผ๋ก ์ฌ๊ตฌ์ฑํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Retrieval-Augmented Generation for Large Language Models ๋
ผ๋ฌธ์ RAG ๋ฐฉ์์ ๊ฐ์ข
๊ณผํ ์๋ฌด์ ์ ์ฉํ๋ ์ต์ ๋ํฅ์ ์๋ฒ ์ดํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Retrieval-Augmented Generation for LLMs ๋
ผ๋ฌธ์ ์ต์ RAG ๊ธฐ๋ฒ๊ณผ ๊ทธ ์ฑ๋ฅ ํ๊ฐ๋ฅผ ๊ฐ์ด๋๋ผ์ธ ์ฐจ์์์ ํ๋ถํ๊ฒ ๋
ผ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Retrieval-Augmented Generation for LLMs ๋
ผ๋ฌธ์ ๊ฒ์ ์ฆ๊ฐ ๊ธฐ๋ฒ ์ ๋ฐ์ ์ต์ ํธ๋ ๋์ ์ฑ๋ฅ ํ๊ฐ๋ฅผ ๋ณด์์ ์ผ๋ก ์ ๊ณตํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Retrieval-Augmented Generation(RAG) ๊ธฐ๋ฐ ํฉํธ์ฒดํน ์ต์ ๊ธฐ๋ฒ๊ณผ ์ค์ ํ๋ก๊ทธ๋จ ๊ธฐ๋ฐ ์ถ๋ก ๋น๊ต๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
675์ RAG ๋
ผ์๋ 876์์ RAG ๊ธฐ๋ฐ ์ฅ๋ฌธ๋งฅ LLM ๋ฐ์ดํฐ์
์์ฑ ๋ฐ ์ค์ ์์ด์ ํธ ํ์ต ์ ์ฉ์ผ๋ก ์ด์ด์ง๋๋ค.
ํ์ ์ฐ๊ตฌ
๋๊ท๋ชจ RAG ๊ตฌ์กฐ์์ ๊ณ ์ฑ๋ฅ ๊ฒ์-์์ฑ ํ์ดํ๋ผ์ธ ์ค๊ณ ๋ฐ ํ์ค์ ๊ฐ์ ๋ฐฉํฅ์ ์ ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
RAG์ LLM์ ๊ฒฐํฉํด ๊ธด ๋
ผ๋ฌธ ๋๋ฃํ๊ฐ ๊ณผ์ ์ ์ต์ ํํ๋ TreeReview ํ๋ ์์ํฌ๊ฐ ๋ฐ์ ์ ์์ฉ์ ์ข์ ์์์
๋๋ค.
ํ์ ์ฐ๊ตฌ
366์ LLM-RAG ๊ธฐ๋ฐ ๋ฏธ๋์ฐ๊ตฌ ์๋์์ฑ์ 675์ RAG ์๋ฒ ์ด ๋ฐ ์์ฉ ์ฌ๋ก๋ค์ ๋ฐํ์ผ๋ก ์ถ๊ฐ ์คํ ํ์ฅ์ด ๊ฐ๋ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
675๋ RAG(Retrieval-Augmented Generation) ๋ชจ๋ธ ์ ๋ฐ์ ์ต์ ๋ฐฉ๋ฒ๊ณผ ๊ณผ์ ๋ฅผ ์ ์ํ์ฌ, 318์ ๋ฌธ๋งฅ ์ต์ ํ ์ฐ๊ตฌ๋ฅผ ๋์ ๋งฅ๋ฝ์์ ํ์ฅํฉ๋๋ค.
์์ฉ ์ฌ๋ก
109๋ RAG ๊ธฐ๋ฐ ์์คํ
(STORM)์ ์ค์ ์ํคํผ๋์ ์ ์ฌ ๊ธฐ์ฌ ์์ฑ์ ์ ์ฉํฉ๋๋ค.
์์ฉ ์ฌ๋ก
RAG ๊ธฐ์ ์ ๋ํ ํฌ๊ด์ ๋ถ์์ ๊ณผํ ์ฐ๊ตฌ ๊ฐ ๋จ๊ณ๋ณ ์ค์ง์ LLM ์ ์ฉ ์ฌ๋ก ๋ฐ ์ ๋ขฐ์ฑ ํ๊ณ ๋ถ์(506)๊ณผ ๊ธด๋ฐํ ์ฐ๊ฒฐ๋ฉ๋๋ค.