์ ์: Yubo Wang, Xueguang Ma, Ping Nie, Huaye Zeng, Zhiheng Lyu, Yuxuan Zhang, Benjamin Schneider, Yi Lu, Xiang Yue, Wenhu Chen | ๋ ์ง: 2025 | DOI: arXiv:2504.00824 📄 PDF
Essence
์ ํต์ ์ธ RAG ์์คํ
(์ข)๊ณผ ScholarCopilot(์ฐ)์ ๋น๊ต. ScholarCopilot์ ํ
์คํธ ์์ฑ ์ค ๋์ ์ผ๋ก ๊ฒ์ ํ ํฐ([RET])์ ์์ฑํ์ฌ ๋ฌธ๋งฅ-์ธ์ํ ์ฐธ๊ณ ๋ฌธํ ๊ฒ์์ ์ํํจ
ํ์ ๋
ผ๋ฌธ ์์ฑ์ ์ํด ์์ฑ ๊ณผ์ ๊ณผ ์ธ์ฉ ๊ฒ์์ ํตํฉํ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. ๋์ ๊ฒ์ ํ ํฐ ์์ฑ์ ํตํด ํ์ํ ์์ ์ ์ ํํ ํ์ ์ฐธ๊ณ ๋ฌธํ์ ๊ฒ์ํ๊ณ ์ธ์ฉ ์ ํ๋๋ฅผ ๋ํญ ํฅ์์ํจ๋ค.
Evaluation
์ดํ: ScholarCopilot์ ๋ฐ๋ณต์ ๊ฒ์-์์ฑ ํตํฉ์ ํตํด ํ์ ๋
ผ๋ฌธ ์์ฑ์ ํนํ๋ ์ค์ฉ์ ์ด๊ณ ํ์ ์ ์ธ ์๋ฃจ์
์ ์ ์ํ๋ค. ๋๊ท๋ชจ ํ์ ๋ฐ์ดํฐ์
๊ตฌ์ถ๊ณผ ์ฌ์ฉ์ ํ๊ฐ๋ฅผ ํตํด ์ค์ง์ ๊ฐ์น๋ฅผ ์
์ฆํ์ผ๋, ๋๋ฉ์ธ ํ์ ์ฑ๊ณผ ์์ธํ ๊ธฐ์ ์ค๋ช
๋ถ๋ถ์์ ๊ฐ์ ์ ์ฌ์ง๊ฐ ์๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
219 ๋
ผ๋ฌธ์ ๋ฌธ๋งฅ ๊ธฐ๋ฐ ์ธ์ฉ ์์ฑ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ๋ฉฐ, 702์ ์ธ์ฉ ์ถ์ฒ ์์คํ
์ค๊ณ์ ์ด๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
ํ์ ๊ธ์ฐ๊ธฐ process ์ ์ฒด๋ฅผ ๋ฒค์น๋งํฌ๋ก ๊ตฌ์ถํ 703๋ฒ ๋
ผ๋ฌธ์ citation generation ๋ฑ 702๋ฒ์ ํตํฉ ํ์ writing ์์คํ
๊ฐ๋ฐ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ ์ฑ
๋ฌธ์ ์์ฑ ๋ฐ ํ๊ฐ๋ฅผ ์ํ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ ๊ธฐ๋ฌธ ์๋ ์์ฑ์์ ์ ๋ณด ๊ฒ์ ๋ฐ ํธํฅ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
602 ๋
ผ๋ฌธ์ ๋
ผ๋ฌธ ์ง์์๋ต์ ์ํ RAG ๊ธฐ๋ฐ ์์ฑํ ์์คํ
์ ์ ์ํด, 702์ ํ์ ์ ์ ๋ณด ๊ฒ์ ๋ฐ ์ธ์ฉ ๊ธฐ๋ฅ์ ๋ค๋ฅธ ์ ๊ทผ์ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
592 ์ญ์ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ๋ฐ ์์ฑ์ ์ํ LLM ํนํ ์์คํ
๊ฐ๋ฐ๋ก, 702์ ์ธ์ฉ ๊ฒ์๊ณผ ํตํฉ๋ ๋
ผ๋ฌธ ์์ฑ ํ๋ ์์ํฌ์ ์ ์ฌํ ๋ฌธ์ ๋ฅผ ๋ค๋ฃฌ๋ค.
๋ค๋ฅธ ์ ๊ทผ
150๋ฒ ๋
ผ๋ฌธ์ citation recommendation task๋ฅผ ์ํ ํ๊ฐ ๋ฐ ๋ฒค์น๋งํฌ ๊ตฌ์ถ๋ฒ์ ์ด์ ์ ๋ง์ถ์ด, 702์ ๋ฌธ์ ์ ๊ทผ๋ฒ์ด ๋ค๋ฆ
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Openscholar ๋
ผ๋ฌธ๋ ๋ณธ๋ฌธ ํ์๊ณผ RAG๋ฅผ ๊ฒฐํฉํ์ฌ ํ์ ๋ฌธ์ ์์ฑ ์ง์์ ๋๋ค๋ฅธ ์ ๊ทผ์ ๋ณด์ฌ์ค๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ์ ๋
ผ๋ฌธ ์ถ์ฒ, ์ธ์ฉ ์์ฑ ๋ฑ LLM ๊ธฐ๋ฐ ์ํฌํ๋ก์ฐ์ ๋ค๋ฅธ ๊ตฌํ ์ฌ๋ก๋ก, ์ธ์ฉ ์์ธก๊ณผ ์ถ์ฒ์ ์ค์ ๋น๊ต๊ฐ ๊ฐ๋ฅํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
ScholarCopilot ๋
ผ๋ฌธ์ LLM์ ํ์ฉํ ํ์ ๋ฌธํ ๋ถ์ ๋ฐ ์์ฝ ๋ถ์ผ์ ์ต์ ์์ฉ ์ฐ๊ตฌ๋ก PaperQA2 ์ฑ๋ฅ ๋น๊ต์ ์ ์ฉํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ธ์ฉ ๋คํธ์ํฌ ๊ธฐ๋ฐ ์ถ์ฒ ์์คํ
์ ๋์์ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ธ์ฉ ํ๋ ํจํด์ ๋ชจ๋ธ๋งํ์ฌ ์ถ์ฒ ์ฑ๋ฅ์ ํฅ์์ํค๋ ์ ์ฌํ ์์คํ
์ ์ ์ํ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
Directed criteria ๊ธฐ๋ฐ ์ธ์ฉ ์ถ์ฒ ๋ฐ ranking ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ 273๋ฒ ๋
ผ๋ฌธ์ ScholarCopilot์ citation context recommendation์ ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Taxonomy tree generation from citation graph ๋
ผ๋ฌธ์ ์ธ์ฉ ๊ทธ๋ํ ๊ธฐ๋ฐ ๋ถ๋ฅ๋ฅผ ๋ ๋ฐ์ ์์ผ LLM ์ธ์ฉ ์ถ์ฒ์ ๊ตฌ์กฐ์ ์ธก๋ฉด์ ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
019๋ ๋
ผ๋ฌธ ์์ด๋์ด ์์ฑ๊ณผ LLM ๊ธฐ๋ฐ ์์ฑ์ ๋ค๋ฃจ๋ฏ๋ก, 702์์ ์ ์ํ ์ ์ฒด ๋
ผ๋ฌธ ์์ฑ ์ํฌํ๋ก์ฐ์ ์์ ๊ฐ๋
๊ณผ ์ฐ๊ฒฐ๋๋ค.
ํ์ ์ฐ๊ตฌ
Mir: Methodology inspiration retrieval for scientific research ๋
ผ๋ฌธ์ LLM์ด ํ์ ์์ฑ ๋ฐ ์ธ์ฉ ์ถ์ฒ์ ์ฃผ๋ ์ฐฝ์์ ์๊ฐ๊ณผ ์ ๋ขฐ์ฑ ๋ฌธ๋งฅ์ ๋ํ ํ์ฅ์ ๋
ผ์๋ฅผ ์ ๊ณตํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
AI ๊ธฐ๋ฐ ํ์ ์๋ฌธ ๋ฐ gene signature ๋ถ์ ๋๊ตฌ๋ก, ์์ฒด ์คํ-์ ์ฝ ์๋ต ๋ถ์์ ์๋ํ ๊ด์ ์์ ํ์ฅ์ฑ์ ๊ฐ์ง๋ค.