Essence
๊ณผํ ๋
ผ๋ฌธ์ ๋ฏธ๋ ์ฐ๊ตฌ ๋ฐฉํฅ(Future Work) ์น์
์ ์๋์ผ๋ก ์์ฑํ๊ธฐ ์ํด ๊ฒ์ ์ฆ๊ฐ ์์ฑ(RAG), LLM ํผ๋๋ฐฑ ๋ฉ์ปค๋์ฆ, LLM-as-a-judge ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ํตํฉํ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค. ์ด ์ฐ๊ตฌ๋ ACL๊ณผ NeurIPS ๋
ผ๋ฌธ ์ฝ 5,500ํธ์ผ๋ก๋ถํฐ ๋ฏธ๋ ์ฐ๊ตฌ ๋ฐฉํฅ์ ์๋ ์ถ์ถยท์์ฑํ๋ฉฐ, GPT-4o mini ๊ธฐ๋ฐ RAG ๋ฐฉ์์ด ๊ฐ์ฅ ์ฐ์ํ ์ฑ๋ฅ์ ๋ฌ์ฑํจ์ ๋ณด์ฌ์ค๋ค.
Evaluation
์ดํ: ์ด ๋
ผ๋ฌธ์ ๋ฏธ๋ ์ฐ๊ตฌ ๋ฐฉํฅ ์๋ ์์ฑ์ด๋ผ๋ ๋ฏธ๊ฐ์ฒ ์์ญ์ ๋ํด RAG, LLM ํผ๋๋ฐฑ, ๋ค์ธต ํ๊ฐ๋ฅผ ํตํฉํ ์ฒด๊ณ์ ์ธ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ฉฐ, 5,500์ฌ ํธ์ ๋
ผ๋ฌธ ๋ฐ์ดํฐ์
๊ณผ ํจ๊ป ๊ณต๊ฐํ์ฌ ํ์ ๊ณต๋์ฒด์ ์ค์ง์ ๊ธฐ์ฌ๋ฅผ ํ๋ค. ๋ค๋ง ๋จ์ผ LLM ๋ชจ๋ธ ์ค์ฌ์ ์คํ๊ณผ ํ๋ฌธ ๋ถ์ผ์ ์ ํ, ์์ฑ ๊ฒฐ๊ณผ์ ์ค์ ์ํฅ๋ ฅ ์ธก์ ๋ถ์กฑ์ด ์ ํ ์์์ด๋, ์ ๋ฐ์ ์ผ๋ก ์๋ฏธ ์๋ ํ์ ๊ธฐ์ฌ๋ฅผ ์ ๊ณตํ๋ ์ฐ์ํ ์ฐ๊ตฌ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
3391 'Retrieval-Augmented Generation for Large Language Models' ๋
ผ๋ฌธ์ RAG ๊ฐ๋
์ ์ ๋ฐ์ ์ดํด์ ์ต์ ์๊ณ ๋ฆฌ์ฆ ๋ํฅ์ ์ง์ด์ฃผ์ด, 366 Futuregen ๋ฐฉ์์ RAG ์ค๊ณ์ ์ด๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
RAG ๊ธฐ๋ฐ ํ
์คํธ ์์ฑ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ ํ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ฒ์ ์ฆ๊ฐ ์์ฑ(RAG) ๊ธฐ๋ฐ ํ์ ๋
ผ๋ฌธ ์์ฑ์ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
RAG์ LLM ํตํฉ ๋ฐ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ข
ํฉ์ ์ผ๋ก ๋ค๋ฃจ๋ฏ๋ก, 366 ๋
ผ๋ฌธ์ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ดํดํ๋ ๋ฐ ๋์๋จ.
๊ธฐ๋ฐ ์ฐ๊ตฌ
366์ ๊ฒ์ ์ฆ๊ฐ ์์ฑ(RAG) ๋ฐฉ์์ 018์์ ์ ์ํ ์์ํ ์ง์ ๋ง์ด๋ ๋ฐ RAG ๊ธฐ๋ฐ ์ถ๋ก ํ๋ ์์ํฌ์ ์ด๋ก ์ ์ผ๋ก ์ฐ๊ฒฐ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ๋
ผ๋ฌธ์์ Retrieval-Augmented Generation ๊ธฐ๋ฒ์ ๋ค์ํ ๋ฐฉ์์ผ๋ก ์ ์ฉํ๋ฏ๋ก, Future Work ์๋ ์์ฑ๊ณผ ๊ฐ์ downstream task์์ ์์ฉ ๋น๊ต์ ์ ํฉํจ.
๋ค๋ฅธ ์ ๊ทผ
473 'Large Language Models for Automated Open-domain Scientific Hypothesis Generation' ๋
ผ๋ฌธ์ ๋ฏธ๋ ์ฐ๊ตฌ ์ง๋ฌธ ์์ฑ์ด๋ผ๋ ๋ชฉ์ ์ ๋ํด LLM ๊ธฐ๋ฐ์ ํ์ดํฌ์์ค ์๋ ์์ฑ ์ ๊ทผ๋ฒ์ ์ ์ํด ๋ ๋
ผ๋ฌธ์ ๋น๊ตํ๋ฉด RAG vs ์๋ตํ ๋ฐฉ๋ฒ๋ก ์ ์ฐจ์ด๋ฅผ ์ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ๊ธฐ๋ฐ ํ์ ๋ฆฌ๋ทฐ ์์คํ
์ ํจ์ฉ์ฑ์ ํ๊ฐํ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ํ์ฉํ ๊ณผํ์ ๊ธ์ฐ๊ธฐ ์ง์์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
RAG ์์ด์ ํธ๋ฅผ ํ์ฉํ ๊ตฌ์กฐํ-๋น๊ตฌ์กฐํ ๋ฐ์ดํฐ ํตํฉ์ ๋์์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ํ์ฉํ ๊ณผํ ๋
ผ๋ฌธ ๋ด์ฉ ์๋ ์์ฑ์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ์ ๋ฌธ์ ์๋ ์์ฑ์ ์ํ ๋ค๋ฅธ LLM ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
3388 ๋
ผ๋ฌธ์ ์ํฉํธ๊ฐ ๋์ ์ฐ๊ตฌ ์์ด๋์ด ์์ธก ๋ฐ ์์ฑ, ํ๊ฐ์ LLM๊ณผ RAG ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ ์จ์ ์ ์ฌํ LLM-RAG ๊ณผํ ์์ฉ์ ๋์์ ๋ณด์ฌ์ค.
ํ์ ์ฐ๊ตฌ
366์ LLM-RAG ๊ธฐ๋ฐ ๋ฏธ๋์ฐ๊ตฌ ์๋์์ฑ์ 675์ RAG ์๋ฒ ์ด ๋ฐ ์์ฉ ์ฌ๋ก๋ค์ ๋ฐํ์ผ๋ก ์ถ๊ฐ ์คํ ํ์ฅ์ด ๊ฐ๋ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
๋
ผ๋ฌธ์ ๋ฏธ๋ ์ฐ๊ตฌ ๋ฐฉํฅ ์๋์์ฑ ๋ฑ ๋
ผ๋ฌธ ๋ด์ฉ์ ์์ฝ ๋ฐ ํ์ฅ์ ์์ฑ์ผ๋ก LLM ๊ธฐ๋ฐ ๋ฌธํ ์์ฝ ์๋ํ์ ์ํธ๋ณด์์ ์ด๋ค.
ํ์ ์ฐ๊ตฌ
๋ฏธ๋ ์ฐ๊ตฌ๋ฐฉํฅ, ๊ด๋ จ ์ฐ๊ตฌ ๋ฑ ๋
ผ๋ฌธ ์์ฝ ๋ฐ ์์ฑ ์์
์์ ์ ์ฒด ๋
ผ๋ฌธ ๊ธฐ๋ฐ ์์ฝ ๋ฐฉ์์ ํ์ฅ ์ ์ฉํ๋ค.
์์ฉ ์ฌ๋ก
RAG ๊ธฐ๋ฐ ๊ณผํ๋
ผ๋ฌธ Future Work ์์ฑ ๋ฑ ์ค์ RAG-LLM ํตํฉ์ ์ฌ๋ก์ฐ๊ตฌ๋ก, 034์ ์๋ฒ ์ด ๋ด์ฉ์ ๊ตฌ์ฒด์ ์์ฉ์ ์ฐ๊ฒฐํ ์ ์์.
์์ฉ ์ฌ๋ก
005์ ์ฅ๋ฌธ๋งฅ LLM ๊ตฌ์ถ ๋ฐ ํ๊ฐ ์๋ฒ ์ด๋ 366์์ ๋ฏธ๋ ์ฐ๊ตฌ ์๋์์ฑ์ ๋กฑ์ปจํ
์คํธ LLM ํ์ฉ ์ฌ๋ก๋ก ์ ์ฉ๋ฉ๋๋ค.
์์ฉ ์ฌ๋ก
018์ RAG ๋ฐ LLM ํ์ฉ ๊ธฐ์ ์ 366์์ ๊ณผํ ๋
ผ๋ฌธ์ ๋ฏธ๋ ์น์
์๋์์ฑ ๋ฑ ์์ฉ ์ฌ๋ก๋ก ์ฐ๊ฒฐ๋ ์ ์์ต๋๋ค.