Openscholar: Synthesizing scientific literature with retrieval-augmented lms

์ €์ž: Akari Asai, Jacqueline He, Rulin Shao, Weijia Shi, Amanpreet Singh, Joseph Chee Chang, Kyle Lo, Luca Soldaini, Sergey Feldman, Mike D'Arcy, David Wadden, Matt Latzke, Mingliang Tian, Peng Ji, Shengyan Liu, Tong Hao, Borong Wu, Yi Xiong, Luke Zettlemoyer, Graham Neubig | ๋‚ ์งœ: 2024 | DOI: 📄 PDF


Essence

Figure 1

OpenScholar์˜ ์ „์ฒด ๊ฐœ์š”: ์ „๋ฌธํ™”๋œ ๋ฐ์ดํ„ฐ์Šคํ† ์–ด, ๊ฒ€์ƒ‰๊ธฐ ๋ฐ ์–ธ์–ด๋ชจ๋ธ๋กœ ๊ตฌ์„ฑ๋˜๋ฉฐ, ๊ฒ€์ƒ‰ ๊ธฐ๋ฐ˜ ์ž์ฒด ํ”ผ๋“œ๋ฐฑ ์ถ”๋ก  ๋ฃจํ”„๋ฅผ ํ†ตํ•ด ๋ฐ˜๋ณต์ ์œผ๋กœ ์‘๋‹ต์„ ๊ฐœ์„ ํ•œ๋‹ค.

๋ณธ ๋…ผ๋ฌธ์€ 4,500๋งŒ ๊ฐœ์˜ ์˜คํ”ˆ ์•ก์„ธ์Šค ๊ณผํ•™ ๋…ผ๋ฌธ์—์„œ ๊ด€๋ จ ๊ตฌ์ ˆ์„ ๊ฒ€์ƒ‰ํ•˜๊ณ  ์ธ์šฉ ๊ธฐ๋ฐ˜ ์‘๋‹ต์„ ํ•ฉ์„ฑํ•˜๋Š” ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(RAG-LM) ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ OpenScholar๋ฅผ ์ œ์•ˆํ•˜๋ฉฐ, ํ•จ๊ป˜ ๊ณผํ•™ ๋…ผ๋ฌธ ํ•ฉ์„ฑ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ๋Œ€๊ทœ๋ชจ ๋ฒค์น˜๋งˆํฌ ScholarQA-Bench๋ฅผ ์†Œ๊ฐœํ•œ๋‹ค.

Motivation

Achievement

Figure 2

OpenScholar์˜ ์ƒ์„ธํ•œ ์ถ”๋ก (์ƒ) ๋ฐ ํ•™์Šต(ํ•˜) ํŒŒ์ดํ”„๋ผ์ธ. ์ถ”๋ก  ์‹œ์—๋Š” ๊ฒ€์ƒ‰๊ธฐ๋ฅผ ํ†ตํ•ด ๊ด€๋ จ ๋…ผ๋ฌธ์„ ์‹๋ณ„ํ•˜๊ณ  ์žฌ์ˆœ์œ„ ์ง€์ •๊ธฐ๋กœ ์ƒ์œ„ N๊ฐœ๋ฅผ ์ •์ œํ•œ ํ›„, LM์ด ์ดˆ๊ธฐ ์‘๋‹ต๊ณผ ์ž์ฒด ํ”ผ๋“œ๋ฐฑ์„ ์ƒ์„ฑํ•˜์—ฌ ๋ฐ˜๋ณต์ ์œผ๋กœ ๊ฐœ์„ ํ•œ๋‹ค.

  1. ์„ฑ๋Šฅ ์šฐ์ˆ˜์„ฑ: OpenScholar-8B๊ฐ€ GPT-4o๋ณด๋‹ค ์ •ํ™•๋„์—์„œ 5%, PaperQA2๋ณด๋‹ค 7% ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ, GPT-4o์˜ ์ธ์šฉ ํ™˜๊ฐ๋ฅ (78-90%)์„ ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€ ์ˆ˜์ค€์œผ๋กœ ๊ฐœ์„ (์ธ์šฉ ์ •ํ™•๋„ ๋Œ€ํญ ํ–ฅ์ƒ)
  2. ์ธ๊ฐ„ ํ‰๊ฐ€ ์„ ํ˜ธ๋„: OpenScholar-8B๋Š” ์ „๋ฌธ๊ฐ€ ์ž‘์„ฑ ์‘๋‹ต ๋Œ€๋น„ 51% ์Šน๋ฅ , OpenScholar-GPT4o๋Š” 70% ์Šน๋ฅ ์„ ๋‹ฌ์„ฑํ•˜์—ฌ GPT-4o์˜ 32%๋ฅผ ํฌ๊ฒŒ ์ƒํšŒ
  3. ๋ฒ”์šฉ์„ฑ: OpenScholar ํŒŒ์ดํ”„๋ผ์ธ์ด GPT-4o ๊ฐœ์„ (์ •ํ™•๋„ 12% ํ–ฅ์ƒ), ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ ํ•™์Šต(OpenScholar-8B), ๊ฒ€์ƒ‰๊ธฐ ํ•™์Šต ๋“ฑ ๋‹ค์–‘ํ•œ ์šฉ๋„๋กœ ํ™œ์šฉ ๊ฐ€๋Šฅ
  4. ์ž์› ๊ณต๊ฐœ: ์ฝ”๋“œ, ํ•™์Šต๋œ ๋ชจ๋ธ ์ฒดํฌํฌ์ธํŠธ, 45M ๋…ผ๋ฌธ ๋ฐ์ดํ„ฐ์Šคํ† ์–ด(237M ์ž„๋ฒ ๋”ฉ), ScholarQA-Bench ๋ฐ์ดํ„ฐ์…‹, ๊ณต๊ฐœ ๋ฐ๋ชจ ์ „๋ถ€ ๊ณต๊ฐœ

How

Figure 2

OpenScholar์˜ ์ƒ์„ธ ๊ตฌ์กฐ: (1)๊ฒ€์ƒ‰ ๋‹จ๊ณ„: ์งˆ์˜๋กœ๋ถ€ํ„ฐ ๋ฐ์ดํ„ฐ์Šคํ† ์–ด์˜ ๊ด€๋ จ ๊ตฌ์ ˆ ๊ฒ€์ƒ‰, (2)์žฌ์ˆœ์œ„: ์‹ ๊ฒฝ๋ง ์žฌ์ˆœ์œ„ ์ง€์ •๊ธฐ๋กœ ์ƒ์œ„ N๊ฐœ ์ •์ œ, (3)์ƒ์„ฑ: LM์ด ์ดˆ๊ธฐ ์‘๋‹ต ์ƒ์„ฑ, (4)ํ”ผ๋“œ๋ฐฑ: LM์ด ์ž์‹ ์˜ ์ถœ๋ ฅ์— ๋Œ€ํ•ด ์ž์—ฐ์–ธ์–ด ํ”ผ๋“œ๋ฐฑ ์ƒ์„ฑ, (5)๋ฐ˜๋ณต ๊ฐœ์„ : ํ”ผ๋“œ๋ฐฑ์„ ๋ฐ˜์˜ํ•˜์—ฌ ์‘๋‹ต ์—…๋ฐ์ดํŠธ๋ฅผ ์—ฌ๋Ÿฌ ๋ฒˆ ์ˆ˜ํ–‰

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ๊ณผํ•™ ๋ฌธํ—Œ ํ•ฉ์„ฑ์„ ์œ„ํ•œ ํ˜„์‹ค์ ์ด๊ณ  ํฌ๊ด„์ ์ธ RAG ์‹œ์Šคํ…œ์„ ์ œ์‹œํ•˜๋ฉฐ, ์ตœ๋Œ€ ๊ทœ๋ชจ์˜ ๊ณต๊ฐœ ๋ฐ์ดํ„ฐ์Šคํ† ์–ด์™€ ๋‹ค์ค‘ ๋ถ„์•ผ ์ „๋ฌธ๊ฐ€ ๋ฒค์น˜๋งˆํฌ๋ฅผ ํ†ตํ•ด ์ค‘์š”ํ•œ ํ‰๊ฐ€ ๊ธฐ๋ฐ˜์„ ๋งˆ๋ จํ–ˆ๋‹ค. ํŠนํžˆ ์ธ์šฉ ์ •ํ™•๋„ ๊ฐœ์„ ๊ณผ ์ „๋ฌธ๊ฐ€ ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ์ด ์‹ค๋ฌด์  ๊ฐ€์น˜๊ฐ€ ํฌ๋ฉฐ, ๋ชจ๋“  ์ž์›์„ ๊ณต๊ฐœํ•˜์—ฌ ์žฌํ˜„์„ฑ๊ณผ ํ™•์žฅ์„ฑ์„ ํ™•๋ณดํ•œ ์ ์ด ์šฐ์ˆ˜ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
332๋ฒˆ ๋…ผ๋ฌธ์€ ํ”„๋กœ๊ทธ๋žจ ๊ธฐ๋ฐ˜ ๊ณผํ•™ ํŒฉํŠธ์ฒดํ‚น ๋ฐ ์ถ”๋ก  ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜์—ฌ, 593๋ฒˆ์˜ ์ธ์šฉ ๊ธฐ๋ฐ˜ ์‘๋‹ต๊ณผ ์‹ ๋ขฐ์„ฑ ์ธก์ •์˜ ์ด๋ก ์  ๊ธฐ์ดˆ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Openscholar ์‹œ์Šคํ…œ์€ OAG ๊ธฐ๋ฐ˜ ํ•™์ˆ  ์ •๋ณด ์ง‘์•ฝ ๋ฐ retrieval-augmented generation์˜ ํ•ต์‹ฌ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
593 ๋…ผ๋ฌธ์€ ๊ฒ€์ƒ‰ยท์ƒ์„ฑ ๊ฒฐํ•ฉํ˜• ๊ณผํ•™๋ฌธํ—Œ ์ •๋ณด ํƒ์ƒ‰ ์‹œ์Šคํ…œ์„ ์ œ์‹œํ•ด, 450์˜ LLM ๊ฐ€์ด๋“œ ํƒ์ƒ‰์  ๊ฒ€์ƒ‰ ํ”„๋ ˆ์ž„์— ๊ตฌ์กฐ์  ์ด๋ก ยท๊ธฐ์ˆ  ํ† ๋Œ€๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Openscholar ์—ญ์‹œ PaperQA ๋ฐ PaSa๊ฐ€ ํ™œ์šฉํ•˜๋Š” RAG ๊ธฐ๋ฐ˜ ํ•™์ˆ  ๊ฒ€์ƒ‰ ์‹œ์Šคํ…œ์˜ ๊ตฌํ˜„๊ณผ ์„ฑ๋Šฅ ํ‰๊ฐ€์˜ ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
593 ๋…ผ๋ฌธ์€ RAG ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๋ฌธํ—Œ ํ•ฉ์„ฑ ์‹œ์Šคํ…œ์„ ์†Œ๊ฐœํ•˜์—ฌ, 781์—์„œ ๋…ผ์˜ํ•œ ์„ค๋ฌธ ์ž๋™ํ™” ๋ฐฉ๋ฒ•๋ก ์˜ ์ด๋ก ์  ๊ธฐ์ดˆ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
DAVINCI ๋ชจ๋ธ์˜ ์˜๋ฏธ๋ก ์  ์ •๋ณด์™€ ์‹ ๋ขฐ๋„ ํ†ตํ•ฉ ๋ฐฉ๋ฒ•๋ก ์˜ ๊ธฐ๋ฐ˜์ด ๋˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
593๋ฒˆ ๋…ผ๋ฌธ์€ ๊ณผํ•™ ๋ฌธํ—Œ ์ •๋ณด๋ฅผ RAG ๋ฐฉ์‹์œผ๋กœ ํ†ตํ•ฉ ๊ฒ€์ƒ‰ยท์ƒ์„ฑํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•ด, 913๋ฒˆ์˜ S2ORC ๊ธฐ๋ฐ˜ ๋Œ€๊ทœ๋ชจ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ๊ตฌ์ถ•๋ฐฉ์‹๊ณผ ๋‹ค๋ฅธ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
602๋ฒˆ PaperQA๋Š” ๊ฒ€์ƒ‰ ์ฆ๊ฐ• LLM ๊ธฐ๋ฐ˜์˜ ๊ณผํ•™์  ์งˆ์˜์‘๋‹ต ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•˜์—ฌ, 593๋ฒˆ OpenScholar์™€ ์œ ์‚ฌํ•œ ๋ชฉํ‘œ์ด์ง€๋งŒ ์•„ํ‚คํ…์ฒ˜์™€ ์‹คํ—˜์ด ๋‹ค๋ฆ…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋…ผ๋ฌธ ๊ธฐ๋ฐ˜ ๋”ฅ ์งˆ์˜์‘๋‹ต ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ, openscholar์™€ ์œ ์‚ฌํ•œ QA ํ…Œ์Šคํฌ์—์„œ ๋ชจ๋ธ ๊ฒ€์ฆ์— ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹ค์–‘ํ•œ ๊ณผํ•™ ๋ถ„์•ผ์—์„œ์˜ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ ์‘์šฉ์„ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์„œ๋ฒ ์ด์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
3379 ๋…ผ๋ฌธ์€ AI ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๋ฌธํ—Œ ํ‰๊ฐ€ ๋ฐ ์—ฐ๊ฒฐ์„ฑ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์•ˆ, 593 ๋…ผ๋ฌธ ์‹œ์Šคํ…œ์˜ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ์™€ ๋น„๊ต๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋ถ„์•ผ ํŠนํ™” LLM ํ‰๊ฐ€ ๋ฒค์น˜๋งˆํฌ๋กœ ์œ ์‚ฌํ•œ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ตฌ์ถ•ํ•œ ์—ฐ๊ตฌ์ด๋‹ค
๋‹ค๋ฅธ ์ ‘๊ทผ
Openscholar ๋…ผ๋ฌธ๋„ ๋ณธ๋ฌธ ํƒ์ƒ‰๊ณผ RAG๋ฅผ ๊ฒฐํ•ฉํ•˜์—ฌ ํ•™์ˆ  ๋ฌธ์„œ ์ž‘์„ฑ ์ง€์›์˜ ๋˜๋‹ค๋ฅธ ์ ‘๊ทผ์„ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
few-shot prompting์„ ํ™œ์šฉํ•œ LLM ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
882๋ฒˆ ๋…ผ๋ฌธ์€ ๋Œ€ํ˜• ์–ธ์–ด๋ชจ๋ธ๊ณผ ์ธ์šฉ ์ถ”์ฒœ ์‹œ์Šคํ…œ์— ๊ด€ํ•œ ์„œ๋ฒ ์ด๋กœ, Openscholar์˜ ์ธ์šฉ ๊ธฐ๋ฐ˜ ์‘๋‹ต ํ•ฉ์„ฑ ์‹œ์Šคํ…œ์˜ ํŠธ๋ Œ๋“œ์™€ ํ•œ๊ณ„์  ์ดํ•ด์— ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Retrieval-augmented generative agent ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋ฌธํ—Œ ์š”์•ฝ ์ƒ์„ฑ๊ณผ HiPerRAG์˜ ๋Œ€๊ทœ๋ชจ ๋ฌธ์„œ ๊ตฌ์กฐ ์ฒ˜๋ฆฌ ๊ธฐ๋ฒ•์ด ์ƒํ˜ธ ํ™•์žฅ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
593์€ ๊ฒ€์ƒ‰-์ƒ์„ฑ ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋ฌธํ—Œ ์ž๋™์ข…ํ•ฉ์„ ๋ชฉํ‘œ๋กœ ํ•˜๋ฉฐ, 087์˜ ํŒŒ์ดํ”„๋ผ์ธ์  ๊ตฌํ˜„์„ ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ์—์„œ ํ™•์žฅํ•œ ์‚ฌ๋ก€๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
812๋Š” ๊ณผํ•™ ๋ฌธ์„œ ์š”์•ฝ ๋ชจ๋ธ์„ ํ†ตํ•ด 593์˜ RAG ๊ธฐ๋ฐ˜ ํ•™์ˆ  ์‘๋‹ต ์ƒ์„ฑ์˜ ์‹ค์ œ ํ™œ์šฉ/์ ์šฉ ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค€๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AutoSOTA๋Š” ์˜คํ”ˆ์†Œ์Šค ๊ณผํ•™ ๋…ผ๋ฌธ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•ด LLM ๊ธฐ๋ฐ˜ ์ž๋™ ์—ฐ๊ตฌํŠธ๋ Œ๋“œ ๋ถ„์„์„ ๊ตฌํ˜„ํ•˜๋ฉฐ, ScholarQA-Bench ํ™œ์šฉ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •