Essence
์ต๊ทผ ๋ํ ์ธ์ด๋ชจ๋ธ(LLM)์ ์ฅ๋ฌธ๋งฅ ์ฒ๋ฆฌ ๋ฅ๋ ฅ ํฅ์์๋ ๋ถ๊ตฌํ๊ณ , ์ค์ ๋ก๋ ์ ์ธ๋ ๋ฌธ๋งฅ ๊ธธ์ด์์ ํจ๊ณผ์ ์ด์ง ๋ชปํ ํ๊ณ๊ฐ ์๋ค. ๋ณธ ๋
ผ๋ฌธ์ ๊ฒ์์ฆ๊ฐ์์ฑ(RAG)๊ณผ ์ฅ๋ฌธ๋งฅ ๋ชจ๋ธ์ ๊ฒฐํฉํ๋, ๋ค์ค๋ฌธ์ ์์ฝ ์์
์ ์ต์ ํ๋ ๊ฒ์ ๋ฌธ๋งฅ ๊ธธ์ด๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ์ถ์ ํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค.
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ RAG ๊ธฐ๋ฐ ๋ค์ค๋ฌธ์ ์์ฝ์์ ๊ฒ์ ๋ฌธ๋งฅ ๊ธธ์ด ์ต์ ํ์ ์ค๋ฌด์ ๋ฌธ์ ๋ฅผ ํ๋นํ ๋ฐฉ๋ฒ์ผ๋ก ํด๊ฒฐํ๋ค. ๋ค๋ง ๋จ์ผ ๋ฐ์ดํฐ์
ํ๊ฐ, ์ ํ์ ๊ณ์ฐ ์ค๋ฒํค๋ ๋ถ์, ์ค๊ณ ์ ํ์ ์ ๋น์ฑ ๋ถ์กฑ ๋ฑ์ผ๋ก ์ธํด ํ์ ์ ๊ธฐ์ฌ๋๋ ์ค๊ฐ ์์ค์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
335๋ ๊ฒ์์ฆ๊ฐ LLM์ few-shot ์ฑ๋ฅ๊ณผ ๋ฌธ๋งฅ ์ฒ๋ฆฌ ํ๊ณ ์ฐ๊ตฌ๋ก, 318์ ํ์ด๋ธ๋ฆฌ๋ RAG์ ์ฅ๋ฌธ๋งฅ ์กฐ์ ๋ฌธ์ ์ ์ด๋ก ์ ์ถ๋ฐ์ ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Retrieval-Augmented Generation for Large Language Models: A Survey๋ RAG์ ํ๊ณ ๋ฐ ๋ฌธ๋งฅ ๊ธธ์ด ๋ฌธ์ ์ ๋ํ ์ด๋ก ์ ยท์ค์ฆ์ ์ ๋ฆฌ๋ก 318์ ์ฐ๊ตฌ ์ค๊ณ์ ๊ธฐ๋ฐ์ ์ญํ ์ ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋กฑ์ปจํ
์คํธ LLM์ ํ๊ณ์ ํ๊ฐ ๋ฒค์น๋งํฌ๋ฅผ ํญ๋๊ฒ ๋ค๋ฃจ์ด, ๊ฒ์ ๋ฌธ๋งฅ ๊ธธ์ด ์ต์ ํ ์ฐ๊ตฌ์ ์ด๋ก ๋ฐฐ๊ฒฝ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ปจํ
์คํธ ๊ธธ์ด ์ต์ ํ ๋ฐ ๋ฉํฐ RAG ์ ๋ต ์ฐ๊ตฌ๋ก, ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ์๋ํ์์ ํ์ํ ๊ธฐ์ ์ ํต์ฐฐ์ ์ ๊ณตํ๋ค.
ํ์ ์ฐ๊ตฌ
675๋ RAG(Retrieval-Augmented Generation) ๋ชจ๋ธ ์ ๋ฐ์ ์ต์ ๋ฐฉ๋ฒ๊ณผ ๊ณผ์ ๋ฅผ ์ ์ํ์ฌ, 318์ ๋ฌธ๋งฅ ์ต์ ํ ์ฐ๊ตฌ๋ฅผ ๋์ ๋งฅ๋ฝ์์ ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
318์ RAG์ ์ปจํ
์คํธ ๊ธธ์ด ์ค์ ์ต์ ํ ๋ฑ์ ๋ค๋ค 036์ ์ ๊ทผ ๋ถ๋ฅ๋ฅผ ์ค์ ์คํ ํ๋ผ๋ฏธํฐ ๊ฒฐ์ ์ธก๋ฉด์ผ๋ก ํ์ฅํ๋ค.
์์ฉ ์ฌ๋ก
Litllm์ RAG์ LLM์ ๊ฒฐํฉํ์ฌ ๊ด๋ จ ๋
ผ๋ฌธ ์์ฝ์ ์๋ํํ๋ฉฐ, ์ค์ ๋ก ์ด๋ค ๋ฌธ๋งฅ ๊ธธ์ด ๋ฐ ์ฆ๊ฐ ๋ฐฉ๋ฒ์ด ํจ๊ณผ์ ์ธ์ง ํ๊ตฌํ๋ค.
์์ฉ ์ฌ๋ก
318์ ํ์ด๋ธ๋ฆฌ๋ RAG ๊ธฐ๋ฐ ๊ณผํ ๋ถ์ผ ๋ฌธํ ์๋ํ ๋๊ตฌ๋ก, ํ๊ฒฝ ๋ฐ ์์ฐ๊ณผํ ์์ฉ์ ์์ด ์ค์ ์ ๋๊ตฌ ํ๊ฐ ์์๋ฅผ ์ ๊ณตํ๋ค.