Essence
Modular๊ณผ Coupled KG-RAG ํ๋ ์์ํฌ์ ๊ตฌ์กฐ์ ์ฐจ์ด
๋ณธ ๋
ผ๋ฌธ์ ์ง์๊ทธ๋ํ(KG) ๊ธฐ๋ฐ ๊ฒ์์ฆ๊ฐ์์ฑ(RAG) ์์คํ
์์ ์ ์ฐ์ฑ๊ณผ ๊ฒ์ ํ์ง ์ฌ์ด์ ํธ๋ ์ด๋์คํ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด FRAG ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. ์ฟผ๋ฆฌ์ ๋ณต์ก๋๋ฅผ ์๋์ผ๋ก ํ๋จํ์ฌ ๋จ์/๋ณต์ก ์ถ๋ก ์์
์ ๋ง์ถคํ ๊ฒ์ ์ ๋ต์ ์ ์ฉํจ์ผ๋ก์จ LLM ๋ฏธ์ธ์กฐ์ ์์ด ๋ชจ๋์ ์ค๊ณ์ ์ ์ฐ์ฑ์ ์ ์งํ๋ฉด์๋ ๊ฒ์ ํ์ง์ ํฅ์์ํจ๋ค.
How
FRAG์ ์ธ ๊ฐ์ง ์ฃผ์ ๋ชจ๋ ๊ตฌ์กฐ
1. Reasoning-Aware ๋ชจ๋ (์ฟผ๋ฆฌ ๋ณต์ก๋ ๋ถ๋ฅ)
- ์ฟผ๋ฆฌ ์ปจํ
์คํธ์์ ์๋ฏธ๋ก ์ , ํต๊ณ์ ํน์ง์ ์ถ์ถํ์ฌ ๊ต์ฐจ ๋๋ฉ์ธ ๋ถ๋ฅ๊ธฐ ํ๋ จ
- ํธํ ์์ ์ ํํ ์์ธก ๋์ coarse-grained ํธํ ๋ฒ์(๋จ์/๋ณต์ก)๋ก ๋จ์ํํ์ฌ ์์ธก ์ค๋ฅ ์ํฅ ์ต์ํ
- LLM ํผ๋๋ฐฑ์ ํ์ฉํ ์ต์ ํ ์ ๋ต์ผ๋ก ํน์ KG์ ๋ํ ๋ถ๋ฅ๊ธฐ ์ฑ๋ฅ ๊ฐ์
2. Flexible-Retrieval ๋ชจ๋ (๋ง์ถคํ ๊ฒ์ ํ์ดํ๋ผ์ธ)
- ์ ์ฒ๋ฆฌ(Preprocessing) โ ๊ฒ์(Retrieval) โ ํ์ฒ๋ฆฌ(Postprocessing) 3๋จ๊ณ ํ์ดํ๋ผ์ธ ์ค๊ณ
- ๋จ์ ์ถ๋ก : BFS(Breadth-First Search) + ๋ญํน์ผ๋ก ์งง์ ๊ฒฝ๋ก์ ํจ์จ์ ยท์ ํํ ๊ฒ์
- ๋ณต์ก ์ถ๋ก : ์ต๋จ ๊ฒฝ๋ก ๊ฒ์(Shortest Path Retrieval) + ๋ญํน์ผ๋ก ๊ณ์ฐ ์ค๋ฒํค๋ ์ต์ํ ๋ฐ ๋
ธ์ด์ฆ ๊ฐ์
3. Generation ๋ชจ๋
- ๊ฒ์๋ ์์ k๊ฐ ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ์ด์ฉํ์ฌ ์ฟผ๋ฆฌ๋ฅผ ์ฆ๊ฐ(augment)
- LLM์ผ๋ก ์ต์ข
์ถ๋ ฅ ์์ฑ
Evaluation
์ดํ: FRAG๋ ๋ชจ๋์ KG-RAG์ ์ฑ๋ฅ ํ๊ณ๋ฅผ ์ฟผ๋ฆฌ ๊ธฐ๋ฐ ํธํ ์์ธก๊ณผ ๋ง์ถคํ ํ์ดํ๋ผ์ธ์ผ๋ก ์ฐ์ํ๊ฒ ํด๊ฒฐํ๋ ์ค์ฉ์ ์ ๊ทผ๋ฒ์ด๋ค. LLM ๋ฏธ์ธ์กฐ์ ์ ๋ฐฐ์ ํ๋ฉด์๋ ๊ฒ์ ํ์ง์ ํฅ์์ํค๋ ๊ธฐ์ฌ๋ ์๋ฏธ ์์ผ๋, ํธํ ๋ถ๋ฅ์ ์ธ๋ฐ๋์ ๋๋ฉ์ธ ์ ์์ฑ์ ๋ํ ๋์ฑ ์ฌํ๋ ๋ถ์์ด ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Retrieval-Augmented Generation for Large Language Models ๋
ผ๋ฌธ์ RAG ์์คํ
์ ํต์ฌ ์ด๋ก ๊ณผ ๊ธฐ์ ํ๋ฆ์ ์ฒด๊ณ์ ์ผ๋ก ์์ฝํ์ฌ FRAG ํ๋ ์์ํฌ์ ์ค๊ณ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Factkg ๋
ผ๋ฌธ์ RAG ๋ฐ KG ๊ธฐ๋ฐ ๊ฒ์ฆ ๋งฅ๋ฝ์์ ๊ทธ๋ํ ๊ธฐ๋ฐ ์ถ๋ก ๊ณผ ์ฌ์ค ๊ฒ์ฆ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ๋ง๋ จํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
348๋ฒ ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ ์ง์ํ์ ์์คํ
์ ์ค๊ณ ํ๋ ์์ํฌ๋ฅผ ๋ค๋ค, 517๋ฒ์ LLM ๊ธฐ๋ฐ ์ธ๋ฅํ ๊ต์กยท๊ฒ์ ์์ฑ ์คํ์ ๊ตฌ์กฐ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
FRAG ๋
ผ๋ฌธ์ retrieval-augmented generation ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ ์ฐจํธ-to-์ฝ๋ ์์ฑ ๋ฐฉ์์ ํ์์ ์ธ ๊ธฐ๋ณธ ๊ตฌ์กฐ๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
348์ ๋ณด๊ฐ๋ ํ์ํ ์์ฑ ํ๋ ์์ํฌ์ ๊ธฐ๋ฐํ ์ง์ ๋ฐ๊ฒฌ ์๋ํ ์ฌ๋ก๋ฅผ ์ ๋ฆฌํ์ฌ, 3273์์ ์ ์ํ spectral map ๊ธฐ๋ฐ RNA ์ฝ๋ฌผ ๊ฒฐํฉ ํด์์ ๋ฒ์ฉ์ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ๋น์ถฐ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Multimodal deepresearcher ๋
ผ๋ฌธ์ ํ
์คํธยท์ฐจํธ๊ฐ ์ตํฉ๋ ์ฆ๊ฐ ์์ฑ ๊ธฐ๋ฐ ํ์ ์์คํ
์ ํ๊ตฌํ์ฌ, FRAG์ ๋ชจ๋์ ๋ค์ค ๋ฐ์ดํฐํ์
์ง์ ๊ธฐ๋ฒ๊ณผ ์ฑ๋ฅ ๋น๊ต๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ค์ํ RAG ๊ธฐ๋ฐ ๋ฆฌ๋๋ณด๋ ์๋ํ ํ๋ ์์ํฌ๋ฅผ ๋น๊ต ๋ถ์ํ์ฌ ์ฌ์ธต์ ๋ฒค์น๋งํน ๋ฐ ๋ฐฉ๋ฒ๋ก ํ์ฅ์ด ๊ฐ๋ฅํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
348์ agentic RAG ํ๋ ์์ํฌ์ ์ค๊ณ ๋ฐ ํ๊ฐ์ ์ง์คํ์ฌ, 063์์ ์ ์น์ฐ๊ตฌ์ ์ค์ ์ ์ฉ๋ ๊ตฌ์กฐ๋ฅผ ๋ค๋ฅธ ํํ์ retrieval-augmented agent๋ก ์ฌ๊ตฌ์ฑํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
FRAG๋ Knowledge Graph ๊ธฐ๋ฐ RAG ์์คํ
์ ๋ค์ํ ๊ณผํ ๋๋ฉ์ธ ์ง์์ ์ต์ ํํ๋ ํ๋ ์์ํฌ๋ก, HypoChainer์์ ์ํฌํ๋ก์ฐ ์ฐจ์ด๋ฅผ ๋๋นํด์ ์ฝ์ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
FRAG: A Flexible Modular Framework for Retrieval-Augmented Generation๋ ์ค์ RAG ์์คํ
์์ ์ ์ฐ์ฑ๊ณผ ํ์ง์ ๋ง์ถ๋ ์๋ก์ด ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฏ๋ก, RAG ๋ถ์ผ์ ์์ฉยทํ์ฅ ์ฌ๋ก๋ก ์ฐ๊ฒฐ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์ง์ ๊ทธ๋ํ์ RAG๋ฅผ ๊ฒฐํฉํ ํ๋ ์์ํฌ๋ฅผ ์ค์ ์ง์ ํ์ ๋ฐ ์์ฑ์ ์ ์ฉํ ์ฌ๋ก๋ก, ๋ชจ๋์ ์ค๊ณ์ ๋ค์์ฑ์ ์ค์ ๋ก ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
348์ ์์ด์ ํฑ RAG ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, 034์ RAG-LLM ํตํฉ ๋
ผ์๋ฅผ agent ๊ด์ ์์ ์ฌํ์์ผ์ค๋ค.
ํ์ ์ฐ๊ตฌ
Personalized graph-based retrieval for large language models ๋
ผ๋ฌธ์ ๊ทธ๋ํ ๊ธฐ๋ฐ RAG ์ ๊ทผ๋ฒ์์ ๊ฐ์ธํ์ ํ์ง ํฅ์์ ์๋ํ์ฌ, FRAG์ ๋ชจ๋ํ ์์ด๋์ด๋ฅผ ๋ณด์์ ์ผ๋ก ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
348์ Agentic RAG์ ์ค์ ์์คํ
๊ตฌํ์ ์ด์ ์ ๋ง์ถ์ด, 067์ ์ด๋ก ์ ์๋ฒ ์ด๋ฅผ ์ํํธ์จ์ด ์ํคํ
์ฒ ๋ฐ ์์ง๋์ด๋ง ๊ด์ ์ผ๋ก ํ์ฅํ๋ค.
๋ฐ๋ก /๋นํ
Grounding fallacies misrepresenting scientific publications ๋
ผ๋ฌธ์ RAG ๋ฐ KG ๊ธฐ๋ฐ ์์คํ
์ด ๋ฐ์์ํค๋ ์ค์ธ์ ์ค์ ์ฌ๋ก์ ํ๊ณ, ํ์ง ์ ํ ๋ฌธ์ ๋ฅผ ๋นํ์ ์ผ๋ก ๋ถ์ํ๋ค.