PaSa: An LLM Agent for Comprehensive Academic Paper Search

์ €์ž: Yichen He, Guanhua Huang, Peiyuan Feng, Yuan Lin, Yuchen Zhang, Hang Li, Weinan E | ๋‚ ์งœ: 2025 | DOI: N/A 📄 PDF


Essence

Figure 1

PaSa ์‹œ์Šคํ…œ ์•„ํ‚คํ…์ฒ˜: Crawler์™€ Selector ๋‘ ๊ฐœ์˜ LLM ์—์ด์ „ํŠธ๋กœ ๊ตฌ์„ฑ

PaSa๋Š” ๋ณต์žกํ•œ ํ•™์ˆ  ๋…ผ๋ฌธ ๊ฒ€์ƒ‰์„ ์ž๋™์œผ๋กœ ์ˆ˜ํ–‰ํ•˜๋Š” LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ๋กœ, ๊ฒ€์ƒ‰ ๋„๊ตฌ ํ™œ์šฉ, ๋…ผ๋ฌธ ์ฝ๊ธฐ, ์ธ์šฉ ๋„คํŠธ์›Œํฌ ํƒ์ƒ‰์„ ํ†ตํ•ด ์ข…ํ•ฉ์ ์ด๊ณ  ์ •ํ™•ํ•œ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ณตํ•œ๋‹ค. ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ(AutoScholarQuery)๋กœ ํ•™์Šตํ–ˆ์Œ์—๋„ ์‹ค์ œ ํ™˜๊ฒฝ(RealScholarQuery)์—์„œ Google Scholar ๋ฐ GPT-4o ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•๋“ค์„ ํฌ๊ฒŒ ๋Šฅ๊ฐ€ํ•œ๋‹ค.

Motivation

Achievement

Figure 2

PaSa ์›Œํฌํ”Œ๋กœ์šฐ ์˜ˆ์‹œ: Crawler์˜ ๋‹ค์–‘ํ•œ [Search] ์‹คํ–‰๊ณผ ์ธ์šฉ ๋„คํŠธ์›Œํฌ ํƒ์ƒ‰

  1. ์„ฑ๋Šฅ ์šฐ์ˆ˜์„ฑ: PaSa-7B๋Š” AutoScholarQuery ํ…Œ์ŠคํŠธ ์…‹์—์„œ Google+GPT-4o ๋Œ€๋น„ Recall@20์—์„œ 34.05%, Recall@50์—์„œ 39.36% ํ–ฅ์ƒ. RealScholarQuery์—์„œ๋Š” Recall@20 37.78%, Recall@50 39.90% ํ–ฅ์ƒ. PaSa-GPT-4o ๋Œ€๋น„ 30.36% ์žฌํ˜„์œจ ํ–ฅ์ƒ.
  2. ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ์˜ ํšจ๊ณผ์„ฑ: ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ(AutoScholarQuery, 33.5k ์ฟผ๋ฆฌ-๋…ผ๋ฌธ ์Œ)๋กœ๋งŒ ํ•™์Šตํ–ˆ์Œ์—๋„ ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ, ๋„๋ฉ”์ธ ์ „์ด(domain transfer) ๊ฐ€๋Šฅ์„ฑ ์ž…์ฆ.
  3. ๊ณ ํ’ˆ์งˆ ๋ฒค์น˜๋งˆํฌ ๊ตฌ์ถ•: ์‹ค์ œ ์—ฐ๊ตฌ์ž 50๋ช…์˜ ์ฟผ๋ฆฌ๋กœ ๊ตฌ์„ฑ๋œ RealScholarQuery ๋ฒค์น˜๋งˆํฌ ๊ฐœ๋ฐœ์œผ๋กœ ํ˜„์‹ค์  ํ‰๊ฐ€ ํ™˜๊ฒฝ ์ œ๊ณต.

How

Originality

Limitation & Further Study

Evaluation

์ดํ‰: PaSa๋Š” LLM ์—์ด์ „ํŠธ๋ฅผ ํ™œ์šฉํ•œ ํ•™์ˆ  ๋…ผ๋ฌธ ๊ฒ€์ƒ‰ ๋ฌธ์ œ์˜ ์ฐฝ์˜์ ์ธ ํ•ด๋ฒ•์ด๋ฉฐ, ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ๋กœ์˜ ํ•™์Šต์ด ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๋Š” ์ ์ด ์ฃผ๋ชฉํ•  ๋งŒํ•˜๋‹ค. ๋‹ค๋งŒ ๋ฐ์ดํ„ฐ์˜ ๋„๋ฉ”์ธ ํŽธํ–ฅ์„ฑ๊ณผ ํ‰๊ฐ€ ๊ทœ๋ชจ์˜ ์ œํ•œ์ด ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ์— ๋Œ€ํ•œ ์˜๋ฌธ์„ ๋‚จ๊ธด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Openscholar ์—ญ์‹œ PaperQA ๋ฐ PaSa๊ฐ€ ํ™œ์šฉํ•˜๋Š” RAG ๊ธฐ๋ฐ˜ ํ•™์ˆ  ๊ฒ€์ƒ‰ ์‹œ์Šคํ…œ์˜ ๊ตฌํ˜„๊ณผ ์„ฑ๋Šฅ ํ‰๊ฐ€์˜ ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
PaperQA๋Š” retrieval-augmented generative QA ๋ฐฉ์‹์„ ํ™œ์šฉํ•œ ํ•™์ˆ  ๋ฌธํ—Œ ์งˆ์˜์‘๋‹ต์— ์ดˆ์ ์„ ๋งž์ถฐ, PaSa์˜ ์ „๋ฐฉ์œ„ ๋…ผ๋ฌธ ๊ฒ€์ƒ‰ ์ ‘๊ทผ๊ณผ ์ƒํ˜ธ ์ฐธ๊ณ ํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
SciFIBench๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์˜ ๊ณผํ•™ ๋…ผ๋ฌธ ๊ทธ๋ฆผ ํ•ด์„ ๋ฒค์น˜๋งˆํฌ๋กœ, PaSa์˜ ๋…ผ๋ฌธ ๊ฒ€์ƒ‰ Q&A ์„ฑ๋Šฅ๊ณผ ํฌ๋กœ์Šค๋ชจ๋‹ฌ ๊ฒฐํ•ฉ ํ‰๊ฐ€๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
PaSa๋Š” ์‹ค์ œ ๋…ผ๋ฌธ ๊ฒ€์ƒ‰ ๋ฐ ์ธ์šฉ ๋„คํŠธ์›Œํฌ ํƒ์ƒ‰์„ ์ž๋™ํ™”ํ•˜๋ฉฐ, PaperQA์™€ ๋Œ€์กฐ์ ์œผ๋กœ ๊ฒ€์ƒ‰ ์—์ด์ „ํŠธ ํšจ์œจ์„ฑ์— ์ง‘์ค‘ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ResearchAgent ๋…ผ๋ฌธ ๋˜ํ•œ ๋ฐ˜๋ณต์ ์ธ ์•„์ด๋””์–ด ์ƒ์„ฑ ๋ฐ ๋…ผ๋ฌธ ํƒ์ƒ‰์„ ์œ„ํ•œ LLM ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์„ ์ œ์‹œํ•˜๋ฉฐ PaSa์˜ ์ ‘๊ทผ์— ๋Œ€์•ˆ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM ์—์ด์ „ํŠธ๊ฐ€ ๋…ผ๋ฌธ ๊ฒ€์ƒ‰ ๋ฐ ์ฃผ์ œ ์กฐ์งํ™”์—์„œ ์ž๋™ํ™”๋œ ๋…ผ๋ฌธ ๊ฒ€์ƒ‰๊ณผ ํƒ์ƒ‰์— ์–ด๋–ป๊ฒŒ ๊ธฐ์—ฌํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ๊ตฌ์ฒด์  ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
SpatialAgent๋Š” ๋ณต์žกํ•œ ์ „๋ฌธ ๋ถ„์•ผ(๊ณต๊ฐ„ ์ƒ๋ฌผํ•™)์—์„œ ๋…ผ๋ฌธ ๊ฒ€์ƒ‰ ๋ฐ ์ดํ•ด ์—์ด์ „ํŠธ๋ฅผ ํ™•์žฅ ์ ์šฉํ•œ ์‚ฌ๋ก€๋กœ, PaSa์˜ ์‘์šฉ ๋ฒ”์œ„๋ฅผ ๋„“ํ˜€์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ณผํ•™ ๋…ผ๋ฌธ ๊ฒ€์ƒ‰ ๋ฐ ๋ฆฌ๋ทฐ ๋“ฑ ์‹ค์ œ ์ •๋ณดํƒ์ƒ‰ ์ƒํ™ฉ์—์„œ WebDancer ํŒŒ์ดํ”„๋ผ์ธ์ด ์–ด๋–ป๊ฒŒ ์ ์šฉ ํ™•์žฅ๋  ์ˆ˜ ์žˆ๋Š”์ง€ ๋ณด์—ฌ์ค€๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •