์ ์: Shubham Agarwal, Gaurav Sahu, Abhay Puri, Issam H. Laradji, Krishnamurthy DJ Dvijotham, Jason Stanley, Laurent Charlin, Christopher Pal | ๋ ์ง: 2024 | DOI: N/A 📄 PDF
Essence
LitLLM ์ธํฐํ์ด์ค: ์ฌ์ฉ์ ์ ๊ณต ์ด๋ก์ ๊ธฐ๋ฐ์ผ๋ก Retrieval Augmented Generation(RAG) ์์น์ ์ ์ฉํ์ฌ ๋ฌธํ ๋ฆฌ๋ทฐ๋ฅผ ์์ฑํ๋ ์์คํ
LitLLM์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)๊ณผ ๊ฒ์ ์ฆ๊ฐ ์์ฑ(RAG) ๊ธฐ์ ์ ๊ฒฐํฉํ์ฌ ๊ณผํ ๋
ผ๋ฌธ์ ๊ด๋ จ ์ฐ๊ตฌ(Related Work) ์น์
์์ฑ์ ์๋ํํ๋ ๋ํํ ๋๊ตฌ์ด๋ค. ์์คํ
์ ์ฌ์ฉ์ ์ ๊ณต ์ด๋ก์ผ๋ก๋ถํฐ ํค์๋ ์ถ์ถ, ๋
ผ๋ฌธ ๊ฒ์ ๋ฐ ์ฌ์์ํ, ๋ฌธํ ๋ฆฌ๋ทฐ ์์ฑ์ ๋ชจ๋ํ๋ ํ์ดํ๋ผ์ธ์ ํตํด ํ๊ฐ(hallucination) ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ค.
How
๋ค์ํ ๊ฒ์ ์ ๋ต: ์ด๋ก ๊ธฐ๋ฐ ํค์๋ ์์ฝ, ์ฌ์ฉ์ ์ ๊ณต ํค์๋, ์๋ ๋
ผ๋ฌธ ๊ธฐ๋ฐ ์ถ์ฒ
3.1 ๋
ผ๋ฌธ ๊ฒ์ ๋ชจ๋ (Paper Retrieval Module)
- Semantic Scholar API์ OpenAlex API๋ฅผ ํ์ฉํ์ฌ 300M+ ํ์ ๋ฉํ๋ฐ์ดํฐ์ ์ ๊ทผ
- ์ฌ์ฉ์ ์ ๊ณต ์ด๋ก์ LLM์ผ๋ก ์ต๋ 5๊ฐ์ ํค์๋๋ก ์์ฝํ์ฌ ๊ฒ์ ์ฟผ๋ฆฌ ์์ฑ
- ์ ํ์ ์ผ๋ก ์ฌ์ฉ์๊ฐ ์ ๊ณตํ ์ถ๊ฐ ํค์๋๋ก ๊ฒ์ ๊ฒฐ๊ณผ ๊ฐ์
- ๊ด๋ จ ์๋ ๋
ผ๋ฌธ์ผ๋ก๋ถํฐ Recommendations API๋ฅผ ํตํด ์ ์ฌ ๋
ผ๋ฌธ ๊ฒ์
ํค์๋ ์์ฝ ํ๋กฌํํธ: ์ฐ๊ตฌ ์ด๋ก์ 5๊ฐ ์ดํ์ ๊ฒ์ ํค์๋๋ก ๋ณํ
3.2 ๋
ผ๋ฌธ ์ฌ์์ํ ๋ชจ๋ (Paper Re-Ranking Module)
- Permutation generation ๋ฐฉ์: LLM์ด ์ฌ์ฉ์ ์ด๋ก๊ณผ์ ์ฐ๊ด์ฑ์ ๋ฐ๋ผ ๋
ผ๋ฌธ๋ค์ ๋ด๋ฆผ์ฐจ์์ผ๋ก ์์ํํ๋๋ก ํ๋กฌํํธ
- Debate-ranking ๋ฐฉ์: LLM์ด ๊ฐ ๋
ผ๋ฌธ์ ๋ํด ํฌํจ ์ฐฌ์ฑ/๋ฐ๋ ๋
ผ๊ฑฐ๋ฅผ ์์ฑ ํ ํ๋ฅ ๊ธฐ๋ฐ ์์ ๊ฒฐ์
- ์ต์์ k๊ฐ ํ๋ณด๋ฅผ LLM์ด ์ต์ข
์์ํํ์ฌ ์์ฑ ํ์ง ํฅ์
์ฌ์์ํ ํ๋กฌํํธ: ์ด๋ก๊ณผ ํ๋ณด ๋
ผ๋ฌธ๋ค์ ์ถ์์ ์
๋ ฅํ์ฌ ๊ด๋ จ์ฑ ๊ธฐ๋ฐ ์์ ์์ฑ
3.3 ์์ฝ ์์ฑ ๋ชจ๋ (Summary Generation Module)
- Zero-shot ์์ฑ: ์ด๋ก๊ณผ ์ฌ์์ํ๋ ๋
ผ๋ฌธ๋ค์ ์ด๋ก์ ์ง์ LLM์ ์
๋ ฅํ์ฌ ๊ด๋ จ ์ฐ๊ตฌ ์น์
์์ฑ
- ๊ณํ ๊ธฐ๋ฐ ์์ฑ: ๋ฌธ์ฅ ๊ณํ(sentence plan)์ ์ฌ์ฉํ์ฌ ๊ฐ ๋ฌธ์ฅ์ ์ธ์ฉ ์ ๋ณด์ ๋ฌธ์ฅ ์๋ฅผ ๋ช
์์ ์ผ๋ก ์ ์ดํ๋ฉฐ ์์ฑ
Evaluation
์ดํ: LitLLM์ ๊ณผํ ๋ฌธํ ๋ฆฌ๋ทฐ ์์ฑ์ ์ํ ์ค์ฉ์ ์ด๊ณ ์ ์ค๊ณ๋ ๋๊ตฌ๋ก, RAG ์์น์ ํตํด LLM์ ํ๊ฐ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ๊ณ ๋ชจ๋ํ๋ ํ์ดํ๋ผ์ธ์ผ๋ก ์ฒด๊ณ์ ์ธ ์ ๊ทผ์ ์ ์ํ๋ค. ๋ค๋ง ๊ฐ๋ณ ๋ชจ๋์ ์ฑ๋ฅ ํ๊ฐ(ํนํ ์ฌ์์ํ ์ ํ๋)์ ์์ฑ ๊ฒฐ๊ณผ์ ํ์ง ๊ฒ์ฆ์ด ๋ถ์ฌํ์ฌ, ํ์ ์ ์๋ฐ์ฑ๊ณผ ์ค์ ์ ์ฉ์ฑ์ ์
์ฆํ๊ธฐ ์ํด์๋ ์ ๋์ ํ๊ฐ ๋ฐ ์ฌ์ฉ์ ์ฐ๊ตฌ๊ฐ ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Nobel-Turing Challenge ๋
ผ๋ฌธ์ ์๋ํ๋ AI ๊ณผํ์์ ๊ฐ๋
์ ์ ์ํ๋ฉฐ, Litllm์ด ์งํฅํ๋ ์๋ ์ฐ๊ตฌ ๋ฆฌ๋ทฐ ์์คํ
์ ๊ถ๊ทน์ ์งํฅ์ ์ ๋
ผ์ํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
732๋ ์๋ํ๋ ๋ฌธํ ๋ฆฌ๋ทฐ ๋๊ท๋ชจ ๋ฐ์ดํฐ์
์ ์ ๊ณตํ์ฌ, 493์ ๋ํํ review generation ํดํท ๊ฐ๋ฐ์ ๋ฐ์ดํฐ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
493์ LLM ๊ธฐ๋ฐ ๋ฌธํ๋ฆฌ๋ทฐ ํดํท(Litllm)๋ฅผ ์ ๊ณตํ์ฌ, 510์ ์๋ ๋ฌธํ๋ฆฌ๋ทฐ ์์ฑ ๋ฐฉ๋ฒ๋ก ์ ์ค์ฉ์ ๊ตฌํ ๊ธฐ๋ฐ์ ๋ง๋ จํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ฒ์ ์ฆ๊ฐ ์์ฑ(RAG) ๊ธฐ๋ฐ ํ์ ๋
ผ๋ฌธ ์์ฑ์ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
Neural Related Work Summarization์ ๋
ผ๋ฌธ ๊ด๋ จ์ฐ๊ตฌ ์์ฑ ์๋ํ์์ ์ํ์ค-๊ธฐ๋ฐ ์ ๊ฒฝ๋ชจ๋ธ ํ์ฉ๋ฒ์ ์ค์ ์ ์ผ๋ก ์ ์, LLM+RAG ์ค์ฌ์ 493๊ณผ ๋ฐฉ๋ฒ๋ก ์ ์ผ๋ก ๋ณด์์ ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
549 ๋
ผ๋ฌธ์ autonomous ML ์ฐ๊ตฌ๋ฅผ ์ํ LLM ๊ธฐ๋ฐ ์ํฌํ๋ก์ฐ๋ฅผ ์ ์ํ์ฌ, 493์ ์๋ํ๋ ์ฐ๊ตฌ ๊ด๋ จ ์น์
์์ฑ๊ณผ ์์ดํ ์ดํ๋ฆฌ์ผ์ด์
์ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ ๋
ผ๋ฌธ์ ๋ฆฌ๋ทฐ์ ๊ด๋ จ ์์
์ ์๋ํํ๋ ๋ค์ํ LLM ๊ธฐ๋ฐ ์์คํ
์ ๋น๊ตํด๋ด์ผ๋ก์จ ์ ๊ทผ ๋ฐฉ์ ์ฐจ์ด๋ฅผ ์ดํดํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ปจํ
์คํธ ๊ธธ์ด ์ต์ ํ ๋ฐ ๋ฉํฐ RAG ์ ๋ต ์ฐ๊ตฌ๋ก, ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ์๋ํ์์ ํ์ํ ๊ธฐ์ ์ ํต์ฐฐ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ธ์ฉ ๊ธฐ๋ฐ ๋ฌธํ ์์ฝ์์ ์ ์ฌํ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๋ ๋์์ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
Litllm์ SciReviewGen ๋ฐ์ดํฐ์
/๋ฌธ์ ์ ์ ์ฌํ ์กฐ๊ฑด์์ LLM ๊ธฐ๋ฐ ํ์ ๋ฌธํ ๋ฆฌ๋ทฐ ์๋ํ ์ฑ๋ฅ์ ๊ฐ์ ํ๋ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Litllm์ ๊ณผํ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ๋ฐ ๊ฒํ ์๋ํ ๋๊ตฌ๋ก OAG-Bench์ ๋ฐ์ดํฐ๋ฅผ ์ค์ ๋ฌธํ ๊ด๋ฆฌ ๋ฐ ํ์์ ํ์ฉํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
Litllm ๋
ผ๋ฌธ์ ๊ณผํ์ ๊ธ์ฐ๊ธฐยท์์ด๋์ด ์์
๋ฑ์์ LLM์ ์ธ๊ฐ vs. AI ๊ฐ๋ณ์ฑ ๊ด๋ จ ์ ๋ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ์ฌ ํ๋งํ
์คํธ ๋
ผ์์ ์ค์ฆ์ ์ถ๊ฐ๋
ผ๊ฑฐ๋ฅผ ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
493์ ๊ณผํ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ์๋ํ์ ํนํ๋ ํดํท์ผ๋ก, 087์ ๋ฌธํ synthesis pipeline์์ ๋ฆฌ๋ทฐ ์๋ํ๊น์ง์ ํ์ฅ์ ๋ณด์ฌ์ค๋๋ค.
์์ฉ ์ฌ๋ก
396๋ฒ ๋
ผ๋ฌธ์ ํ๊ฐ ์ํ ๋ฐ ์ ๋ขฐ์ฑ ํฅ์ ํ๋ ์์ํฌ๋ 493๋ฒ LitLLM์์ ๊ณผํ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ์์ฑ ์ ํ๊ฐ์ ์ค์ด๊ธฐ ์ํ ๊ฒ์-์ฆ๊ฐ ์์ฑ pipeline์ ํ์ฉ๋ฉ๋๋ค.
์์ฉ ์ฌ๋ก
Litllm์ RAG์ LLM์ ๊ฒฐํฉํ์ฌ ๊ด๋ จ ๋
ผ๋ฌธ ์์ฝ์ ์๋ํํ๋ฉฐ, ์ค์ ๋ก ์ด๋ค ๋ฌธ๋งฅ ๊ธธ์ด ๋ฐ ์ฆ๊ฐ ๋ฐฉ๋ฒ์ด ํจ๊ณผ์ ์ธ์ง ํ๊ตฌํ๋ค.
๋ฐ๋ก /๋นํ
493์์ RAG์ LLM ํ์ฉ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ๊ฐ์กฐํ๋๋ฐ, 800๋ฒ ๋
ผ๋ฌธ์ LLM ์ ๋ ฌ ๊ณผ์ ์์ ๋ฐ์ํ๋ ์จ๊ฒจ์ง ํธํฅ ๋ฌธ์ ๋ฅผ ๋นํ์ ์ผ๋ก ์ง์ ํ์ฌ ์ํธ์ฐธ์กฐ๊ฐ ํ์ํฉ๋๋ค.