Essence
REALM์ ์ง์์ ์ ๊ฒฝ๋ง ํ๋ผ๋ฏธํฐ์ ์๋ฌต์ ์ผ๋ก ์ ์ฅํ๋ ๋์ , ํ์ต ๊ฐ๋ฅํ ํ
์คํธ ๊ฒ์ ๋ชจ๋์ ํตํด ๋ช
์์ ์ผ๋ก ์ธ๋ถ ์ฝํผ์ค(์: Wikipedia)์์ ๊ด๋ จ ๋ฌธ์๋ฅผ ๋์ ์ผ๋ก ๊ฒ์ํ๊ณ ํ์ฉํ๋ ๊ฒ์์ฆ๊ฐ ์ธ์ด ๋ชจ๋ธ ์ฌ์ ํ์ต ํ๋ ์์ํฌ๋ค. ๋น์ง๋ ๋ง์คํฌ๋ ์ธ์ด ๋ชจ๋ธ(MLM) ๋ชฉํ ์ ํธ๋ฅผ ํตํด ๊ฒ์๊ธฐ๋ฅผ end-to-end๋ก ํ์ตํ ์ ์๋ค.
Evaluation
Novelty: 5/5 Technical Soundness: 4/5 Significance: 5/5 Clarity: 4/5 Overall: 4.5/5
์ดํ: REALM์ ๊ฒ์ ๋ฉ์ปค๋์ฆ์ ์ ๊ฒฝ๋ง ์ฌ์ ํ์ต ๋จ๊ณ์ ์ต์ด๋ก ํตํฉํ์ฌ ๊ท๋ชจ ์๋ ๋น์ง๋ ํ์ต์ ๋ฌ์ฑํ ํ๊ธฐ์ ์ฐ๊ตฌ๋ค. ๋ช
์์ ์ง์ ์ ๊ทผ์ ํตํด ํด์ ๊ฐ๋ฅ์ฑ๊ณผ ๋ชจ๋ํ๋ฅผ ํ๋ณดํ๋ฉด์๋ Open-QA์์ ๊ธฐ์กด ๋ชจ๋ ๋ฐฉ๋ฒ์ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ๋ณด์ฌ์คฌ๋ค. ๋ค๋ง ๋๊ท๋ชจ ๊ฒ์์ ๊ณ์ฐ ๋น์ฉ ๋ฐ ๋ฌธ์ ํํ ์
๋ฐ์ดํธ์ ์ง์ฐ์ฑ์ ์ค๋ฌด ์ ์ฉ ์ ๊ณ ๋ คํ ์ ์ด๋ฉฐ, ํฅํ ๋ ์ ๊ตํ retrieval ์ ๋ต๊ณผ์ ๊ฒฐํฉ์ผ๋ก ํ๊ณ๋ฅผ ๊ทน๋ณตํ ์ฌ์ง๊ฐ ์๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
REALM ๋
ผ๋ฌธ์ RAG์ ์ฌ์ ํ์ต ๋จ๊ณ ํจ์จํ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ์ฌ SPLADE์ ๊ฐ์ sparse RAG ๋ชจ๋ธ ๊ฐ๋ฐ์ ์ด๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
REALM์ ๊ฒ์ ์ฆ๊ฐ(ํด์น) ์ธ์ด๋ชจ๋ธ์ ๋ฐฉํฅ์ฑ์ ์ ์ํ๋ฉฐ, 335๋ฒ์ Atlas ๋ชจ๋ธ ์ค๊ณ์ ํ ๋๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Augmented Language Models ๋
ผ๋ฌธ์ REALM๊ณผ ๊ฐ์ด ์ธ๋ถ ๊ฒ์ ๊ธฐ๋ฅ์ ๊ฒฐํฉํ RAGํ LLM์ ๋ค์ํ ์ฌ๋ก์ ์ด๋ก ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
REALM ๋ฑ RAG ์ฌ์ ํ์ต ํ๋ ์์ํฌ ์ฐ๊ตฌ๊ฐ RAG ๊ธฐ๋ฐ LLM์ ์ญ์ฌ ๋ฐ ๊ทผ๋ณธ์ ์ธ ๋์ ์๋ฆฌ ํ๊ตฌ์ ํ ๋๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
659 REALM์ ์ด๊ธฐ RAG ๊ธฐ๋ฐ ์ธ์ด๋ชจ๋ธ ์ ์ ๋
ผ๋ฌธ์ผ๋ก 034์ RAG ๋ฐ์ ์ฌ ์์ ์ ๊ทผ๋ณธ์ ํ ๋๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
REALM๋ ๋ชจ๋๋ฌ ๊ฒ์-์ฆ๊ฐ ์ธ์ด๋ชจ๋ธ์ ์ฌ์ ํ์ต์ ์ ์ฉํ ์ด๊ธฐ ์ฐ๊ตฌ๋ก, Deepseek-v3์ MoE ๋ฐ ์ธ๋ถ๊ธฐ์ต ์ ๋ต๊ณผ ์ํธ๋ณด์์ ์ผ๋ก ๋ณผ ์ ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Retrieval-augmented language model์ ์ฌ์ ํ์ต๊ณผ ํ์ธํ๋ ์ ๋ต์ด Phi-4์ ์๊ท๋ชจ ๋ชจ๋ธ ๊ณ ์ฑ๋ฅ ์ค๊ณ์ ์ด๋ก ์ ํ ๋ ์ญํ ์ ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
REALM ๋
ผ๋ฌธ์ ๊ฒ์ ์ฆ๊ฐ ์ธ์ด๋ชจ๋ธ์ ๊ธฐ๋ณธ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ์ฌ 667์์ ๊ฒ์๊ณผ ์ถ๋ก ๊ฒฐํฉ ํ์ต์ ์ด๋ก ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
659๋ฒ์ Retrieval-Augmented Pre-Training ๋ฐฉ์์ ํด ๋๋ ์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ LLM์ ํจ์จ์ ์ ๋ณด๊ฒ์ ๊ธฐ๋ฒ์ ๊ธฐ์ด์ ์ด๋ก ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
REALM ๋
ผ๋ฌธ์ ๊ตฌ์กฐํ๋ ๊ฒ์๊ณผ LLM ์์ฑ์ ๊ฒฐํฉ ๊ธฐ์ด ์๋ฆฌ๋ฅผ ์ค๋ช
ํ์ฌ, ๊ทธ๋ํ ๊ธฐ๋ฐ ๊ฒ์ ์ฆ๊ฐ ๋ชจ๋ธ์ ์ด๋ก ์ ํ ๋๋ฅผ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ฌ์ ํ์ต ์ธ์ด ๋ชจ๋ธ์ NLP ํ์คํฌ ์ฑ๋ฅ์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋
ํด ๋ฐ ์ง์์๋ต ํ์คํฌ์์ ์ฌ์ ํ์ต ์ธ์ด๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํ๋ ๊ด๋ จ ๋ฒค์น๋งํฌ ๋
ผ๋ฌธ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
RAG ๊ณ์ด์ ์ฌ์ ํ์ต ๋ชจ๋ธ(REALM)์ ํตํ retrieval-augmented paradigm์ ์คํ์ ๊ฒ์ฆ ์ฌ๋ก๋ฅผ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Toolformer๋ ๊ฒ์๋ฟ ์๋๋ผ ๋ค์ํ ์ธ๋ถ ๋๊ตฌ์ ์ฐ๋ํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ๋ฉฐ, ๋๊ตฌ ์ฌ์ฉ ๋ฒ์๋ฅผ ํ์ฅ์ํต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
659(REALM)์ ์ธ๋ถ ๊ฒ์์ ํ์ฉํ๋ ๋ฐ๋ฉด, 266(Deepseek-v3)์ ํผํฉ์ ๋ฌธ๊ฐ ๋ํ ์ธ์ด๋ชจ๋ธ๋ก ๋ด์ฌ์ ์ง์ ํ์ฉ์ ์ค์ ์ ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Wikipedia ์์ค์ ๋ฌธ์ ์๋ ์์ฑ์์ ์ ์ฌํ ๋ฌธ์ ๋ฅผ ๋ค๋ฅด๊ฒ ์ ๊ทผํ๋ค.
ํ์ ์ฐ๊ตฌ
Atlas ์์คํ
์ REALM์ retrieval-augmented ์ฌ์ ํ์ต ์ ๊ทผ์ few-shot ํ์ต ๋ฐ ์ธ๋ถ๋ฉ๋ชจ๋ฆฌ ํ์ฉ๊น์ง ํ์ฅํ ๋ํ์ ํ์ ์ฐ๊ตฌ์
๋๋ค.
ํ์ ์ฐ๊ตฌ
Retrieval-Augmented Generation for Large Language Models ๋
ผ๋ฌธ์ RAG ๋ฐฉ์์ ๊ฐ์ข
๊ณผํ ์๋ฌด์ ์ ์ฉํ๋ ์ต์ ๋ํฅ์ ์๋ฒ ์ดํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
HLM-Cite ๋
ผ๋ฌธ์ ์ฝ์ด ์ธ์ฉ ๋ถ๋ฅ ์๋ํ์ ๊ฒ์์ฆ๊ฐ ์ธ์ด ๋ชจ๋ธ ์ํคํ
์ฒ๋ฅผ ์ค์ง์ ์ํฌํ๋ก์ฐ๋ก ํ์ฅ ์ ์ฉํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
659 ๋
ผ๋ฌธ์ 447์ ์ ๋ณด ๊ฒ์ ์์ด์ ํธ ์ฑ๋ฅ์ ์ค์ง์ RAG ํ๋ ์์ํฌ์ ์ ์ฉํ๋ ๋ฐฉ์์ผ๋ก ํ์ฅํฉ๋๋ค.
์์ฉ ์ฌ๋ก
์๋ํ๋ ๋จธ์ ๋ฌ๋(Automl)์์ REALM๊ณผ ์ ์ฌํ ๊ฒ์์ฆ๊ฐ ์ ๊ทผ๋ฒ์ ์ค์ ๋ฌธ์ ์ ์ ์ฉํ์ฌ ์ฑ๋ฅ์ ํฅ์์ํค๋ ์๋ฅผ ๋ณด์ฌ์ค๋๋ค.
์์ฉ ์ฌ๋ก
REALM๊ณผ ์ ์ฌํ๊ฒ ๋ฐ์ด์ค/์ฌ๋ฃ ์ง์๊ณผ ์์ฐ์ธ์ด ๊ฒ์ ๊ฒฐํฉ์ ์คํ์ ์ผ๋ก ์ ์ฉํ ์ค์ ์ฌ๋ก์
๋๋ค.