์ ์: Akari Asai, Jacqueline He, Rulin Shao, Weijia Shi, Amanpreet Singh, Joseph Chee Chang, Kyle Lo, Luca Soldaini, Sergey Feldman, Mike D'Arcy, David Wadden, Matt Latzke, Mingliang Tian, Peng Ji, Shengyan Liu, Tong Hao, Borong Wu, Yi Xiong, Luke Zettlemoyer, Graham Neubig | ๋ ์ง: 2024 | DOI: 📄 PDF
Essence
OpenScholar์ ์ ์ฒด ๊ฐ์: ์ ๋ฌธํ๋ ๋ฐ์ดํฐ์คํ ์ด, ๊ฒ์๊ธฐ ๋ฐ ์ธ์ด๋ชจ๋ธ๋ก ๊ตฌ์ฑ๋๋ฉฐ, ๊ฒ์ ๊ธฐ๋ฐ ์์ฒด ํผ๋๋ฐฑ ์ถ๋ก ๋ฃจํ๋ฅผ ํตํด ๋ฐ๋ณต์ ์ผ๋ก ์๋ต์ ๊ฐ์ ํ๋ค.
๋ณธ ๋
ผ๋ฌธ์ 4,500๋ง ๊ฐ์ ์คํ ์ก์ธ์ค ๊ณผํ ๋
ผ๋ฌธ์์ ๊ด๋ จ ๊ตฌ์ ์ ๊ฒ์ํ๊ณ ์ธ์ฉ ๊ธฐ๋ฐ ์๋ต์ ํฉ์ฑํ๋ ๊ฒ์ ์ฆ๊ฐ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(RAG-LM) ๊ธฐ๋ฐ ์์คํ
OpenScholar๋ฅผ ์ ์ํ๋ฉฐ, ํจ๊ป ๊ณผํ ๋
ผ๋ฌธ ํฉ์ฑ ํ๊ฐ๋ฅผ ์ํ ๋๊ท๋ชจ ๋ฒค์น๋งํฌ ScholarQA-Bench๋ฅผ ์๊ฐํ๋ค.
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ๊ณผํ ๋ฌธํ ํฉ์ฑ์ ์ํ ํ์ค์ ์ด๊ณ ํฌ๊ด์ ์ธ RAG ์์คํ
์ ์ ์ํ๋ฉฐ, ์ต๋ ๊ท๋ชจ์ ๊ณต๊ฐ ๋ฐ์ดํฐ์คํ ์ด์ ๋ค์ค ๋ถ์ผ ์ ๋ฌธ๊ฐ ๋ฒค์น๋งํฌ๋ฅผ ํตํด ์ค์ํ ํ๊ฐ ๊ธฐ๋ฐ์ ๋ง๋ จํ๋ค. ํนํ ์ธ์ฉ ์ ํ๋ ๊ฐ์ ๊ณผ ์ ๋ฌธ๊ฐ ์์ค์ ์ฑ๋ฅ ๋ฌ์ฑ์ด ์ค๋ฌด์ ๊ฐ์น๊ฐ ํฌ๋ฉฐ, ๋ชจ๋ ์์์ ๊ณต๊ฐํ์ฌ ์ฌํ์ฑ๊ณผ ํ์ฅ์ฑ์ ํ๋ณดํ ์ ์ด ์ฐ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
332๋ฒ ๋
ผ๋ฌธ์ ํ๋ก๊ทธ๋จ ๊ธฐ๋ฐ ๊ณผํ ํฉํธ์ฒดํน ๋ฐ ์ถ๋ก ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ, 593๋ฒ์ ์ธ์ฉ ๊ธฐ๋ฐ ์๋ต๊ณผ ์ ๋ขฐ์ฑ ์ธก์ ์ ์ด๋ก ์ ๊ธฐ์ด๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Openscholar ์์คํ
์ OAG ๊ธฐ๋ฐ ํ์ ์ ๋ณด ์ง์ฝ ๋ฐ retrieval-augmented generation์ ํต์ฌ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
593 ๋
ผ๋ฌธ์ ๊ฒ์ยท์์ฑ ๊ฒฐํฉํ ๊ณผํ๋ฌธํ ์ ๋ณด ํ์ ์์คํ
์ ์ ์ํด, 450์ LLM ๊ฐ์ด๋ ํ์์ ๊ฒ์ ํ๋ ์์ ๊ตฌ์กฐ์ ์ด๋ก ยท๊ธฐ์ ํ ๋๊ฐ ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Openscholar ์ญ์ PaperQA ๋ฐ PaSa๊ฐ ํ์ฉํ๋ RAG ๊ธฐ๋ฐ ํ์ ๊ฒ์ ์์คํ
์ ๊ตฌํ๊ณผ ์ฑ๋ฅ ํ๊ฐ์ ํ ๋๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
593 ๋
ผ๋ฌธ์ RAG ๊ธฐ๋ฐ ๊ณผํ์ ๋ฌธํ ํฉ์ฑ ์์คํ
์ ์๊ฐํ์ฌ, 781์์ ๋
ผ์ํ ์ค๋ฌธ ์๋ํ ๋ฐฉ๋ฒ๋ก ์ ์ด๋ก ์ ๊ธฐ์ด๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
DAVINCI ๋ชจ๋ธ์ ์๋ฏธ๋ก ์ ์ ๋ณด์ ์ ๋ขฐ๋ ํตํฉ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ด ๋๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
593๋ฒ ๋
ผ๋ฌธ์ ๊ณผํ ๋ฌธํ ์ ๋ณด๋ฅผ RAG ๋ฐฉ์์ผ๋ก ํตํฉ ๊ฒ์ยท์์ฑํ๋ ๋ฐฉ๋ฒ์ ์ ์ํด, 913๋ฒ์ S2ORC ๊ธฐ๋ฐ ๋๊ท๋ชจ ๋ฉํ๋ฐ์ดํฐ ๊ตฌ์ถ๋ฐฉ์๊ณผ ๋ค๋ฅธ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
602๋ฒ PaperQA๋ ๊ฒ์ ์ฆ๊ฐ LLM ๊ธฐ๋ฐ์ ๊ณผํ์ ์ง์์๋ต ์์คํ
์ ์ ์ํ์ฌ, 593๋ฒ OpenScholar์ ์ ์ฌํ ๋ชฉํ์ด์ง๋ง ์ํคํ
์ฒ์ ์คํ์ด ๋ค๋ฆ
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ ๋
ผ๋ฌธ ๊ธฐ๋ฐ ๋ฅ ์ง์์๋ต ๋ฐ์ดํฐ์
์ผ๋ก, openscholar์ ์ ์ฌํ QA ํ
์คํฌ์์ ๋ชจ๋ธ ๊ฒ์ฆ์ ํ์ฉํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ค์ํ ๊ณผํ ๋ถ์ผ์์์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ ์์ฉ์ ๋ค๋ฃจ๋ ๊ด๋ จ ์๋ฒ ์ด์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
3379 ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ ๊ณผํ์ ๋ฌธํ ํ๊ฐ ๋ฐ ์ฐ๊ฒฐ์ฑ ํ๊ฐ ๋ฐฉ๋ฒ๋ก ์ ์ ์, 593 ๋
ผ๋ฌธ ์์คํ
์ ํ๊ฐ ํ๋ ์์ํฌ์ ๋น๊ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ ๋ถ์ผ ํนํ LLM ํ๊ฐ ๋ฒค์น๋งํฌ๋ก ์ ์ฌํ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ๊ตฌ์ถํ ์ฐ๊ตฌ์ด๋ค
๋ค๋ฅธ ์ ๊ทผ
Openscholar ๋
ผ๋ฌธ๋ ๋ณธ๋ฌธ ํ์๊ณผ RAG๋ฅผ ๊ฒฐํฉํ์ฌ ํ์ ๋ฌธ์ ์์ฑ ์ง์์ ๋๋ค๋ฅธ ์ ๊ทผ์ ๋ณด์ฌ์ค๋ค.
๋ค๋ฅธ ์ ๊ทผ
few-shot prompting์ ํ์ฉํ LLM ์ฑ๋ฅ ํฅ์์ ๋ค๋ฃจ๋ ์ ์ฌ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
882๋ฒ ๋
ผ๋ฌธ์ ๋ํ ์ธ์ด๋ชจ๋ธ๊ณผ ์ธ์ฉ ์ถ์ฒ ์์คํ
์ ๊ดํ ์๋ฒ ์ด๋ก, Openscholar์ ์ธ์ฉ ๊ธฐ๋ฐ ์๋ต ํฉ์ฑ ์์คํ
์ ํธ๋ ๋์ ํ๊ณ์ ์ดํด์ ๋์์ด ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Retrieval-augmented generative agent ๊ธฐ๋ฐ ๊ณผํ ๋ฌธํ ์์ฝ ์์ฑ๊ณผ HiPerRAG์ ๋๊ท๋ชจ ๋ฌธ์ ๊ตฌ์กฐ ์ฒ๋ฆฌ ๊ธฐ๋ฒ์ด ์ํธ ํ์ฅ๋ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
593์ ๊ฒ์-์์ฑ ๊ธฐ๋ฐ ๊ณผํ ๋ฌธํ ์๋์ข
ํฉ์ ๋ชฉํ๋ก ํ๋ฉฐ, 087์ ํ์ดํ๋ผ์ธ์ ๊ตฌํ์ ๋ค์ํ ๋๋ฉ์ธ์์ ํ์ฅํ ์ฌ๋ก๋ค.
์์ฉ ์ฌ๋ก
812๋ ๊ณผํ ๋ฌธ์ ์์ฝ ๋ชจ๋ธ์ ํตํด 593์ RAG ๊ธฐ๋ฐ ํ์ ์๋ต ์์ฑ์ ์ค์ ํ์ฉ/์ ์ฉ ์ฌ๋ก๋ฅผ ๋ณด์ฌ์ค๋ค.
์์ฉ ์ฌ๋ก
AutoSOTA๋ ์คํ์์ค ๊ณผํ ๋
ผ๋ฌธ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํด LLM ๊ธฐ๋ฐ ์๋ ์ฐ๊ตฌํธ๋ ๋ ๋ถ์์ ๊ตฌํํ๋ฉฐ, ScholarQA-Bench ํ์ฉ ์ฌ๋ก๋ฅผ ์ ๊ณตํฉ๋๋ค.