Knowledge Navigator: LLM-guided Browsing Framework for Exploratory Search in Scientific Literature

์ €์ž: Uri Katz, Mosh Levy, Yoav Goldberg (Bar-Ilan University, Allen Institute for AI) | ๋‚ ์งœ: 2024 | DOI: arXiv:2408.15836 📄 PDF


Essence

Figure 1

"Tool Use in Animals" ์ฟผ๋ฆฌ์— ๋Œ€ํ•ด ์ƒ์„ฑ๋œ ๊ณ„์ธต์  ์ง€์‹ ๋งต์œผ๋กœ, ์ฃผ์š” ์ฃผ์ œ์™€ ํ•˜์œ„ ์ฃผ์ œ๋“ค์„ ์ฒด๊ณ„์ ์œผ๋กœ ์กฐ์งํ™”ํ•จ

๋Œ€๊ทœ๋ชจ ๊ณผํ•™ ๋ฌธํ—Œ์—์„œ ํƒ์ƒ‰์  ๊ฒ€์ƒ‰์„ ์ง€์›ํ•˜๊ธฐ ์œ„ํ•ด LLM๊ณผ ํด๋Ÿฌ์Šคํ„ฐ๋ง ๊ธฐ๋ฒ•์„ ๊ฒฐํ•ฉํ•˜์—ฌ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ๋ฅผ 2๋‹จ๊ณ„ ๊ณ„์ธต ๊ตฌ์กฐ์˜ ์ฃผ์ œ๋กœ ์ž๋™ ์กฐ์งํ™”ํ•˜๋Š” ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•œ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์—ฐ๊ตฌ์ž๋“ค์ด ์ˆ˜๋ฐฑ ๊ฐœ์˜ ๋ฌธ์„œ๋ฅผ ์ง๊ด€์ ์œผ๋กœ ํƒ์ƒ‰ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•œ๋‹ค.

Motivation

Achievement

Figure 2

Knowledge Navigator ์›Œํฌํ”Œ๋กœ์šฐ: ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ ์ž„๋ฒ ๋”ฉ ๋ฐ ํด๋Ÿฌ์Šคํ„ฐ๋ง โ†’ ํด๋Ÿฌ์Šคํ„ฐ ํŒ๋…๊ธฐ๋ฅผ ํ†ตํ•œ ์„ค๋ช…/๋ช…๋ช… โ†’ ์ฃผ์ œ ์กฐ์งํ™” โ†’ ๋ถ€๋ถ„์ฃผ์ œ ํ™•์žฅ

  1. ํšจ๊ณผ์ ์ธ ๊ณ„์ธต ๊ตฌ์กฐ ์ƒ์„ฑ: ๊ด‘๋ฒ”์œ„ํ•œ ์ฟผ๋ฆฌ(์˜ˆ: "Tool Use in Animals")์— ๋Œ€ํ•ด ์‹ ๋ขฐ์„ฑ ๋†’์€ 2๋‹จ๊ณ„ ์ฃผ์ œ ๊ณ„์ธต์„ ์ž๋™ ์ƒ์„ฑํ•˜๋ฉฐ, ๊ฐ ๋ถ€๋ถ„์ฃผ์ œ๋Š” ๊ตฌ์ฒด์ ์ธ ๋ฌธ์„œ๋“ค๋กœ ๊ทผ๊ฑฐํ™”๋จ
  2. ํ‰๊ฐ€ ๋ฒค์น˜๋งˆํฌ ๊ตฌ์ถ• ๋ฐ ๊ฒ€์ฆ:
    • CLUSTREC-COVID: TREC-COVID ๋ฒค์น˜๋งˆํฌ๋ฅผ ๋ถ€๋ถ„์ฃผ์ œ ํด๋Ÿฌ์Šคํ„ฐ๋ง, ํด๋Ÿฌ์Šคํ„ฐ ๊ธฐ๋ฐ˜ ์ธก๋ฉด ์ƒ์„ฑ, ์ฟผ๋ฆฌ ์ƒ์„ฑ ์ž‘์—…์— ๋งž๊ฒŒ ๊ฐœ์„ 
    • SCITOC: Annual Reviews ์ €๋„์˜ ๋ชฉ์ฐจ์—์„œ ์ถ”์ถœํ•œ ๊ณผํ•™ ๋ถ„์•ผ๋ณ„ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•
    • ์ž๋™ ํ‰๊ฐ€ ๋ฐ ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€ ํ‰๊ฐ€ ๋ชจ๋‘์—์„œ ๊ฐ ์ปดํฌ๋„ŒํŠธ ์„ฑ๋Šฅ ์ž…์ฆ
  3. ๋‹ค์–‘ํ•œ ๋ชจ๋ธ ํ˜ธํ™˜์„ฑ: GPT-4o(๋…์ ) ๋ฐ Mixtral-8x7B(์˜คํ”ˆ์†Œ์Šค) ํฌํ•จ ์—ฌ๋Ÿฌ LLM์—์„œ ์‹คํ–‰ ๊ฐ€๋Šฅํ•จ์„ ์‹œ์—ฐ

How

Figure 2

์‹œ์Šคํ…œ 5๋‹จ๊ณ„ ์•„ํ‚คํ…์ฒ˜:

  1. ์ฃผ์ œ ์ฝ”ํผ์Šค ๊ตฌ์„ฑ: ๊ฒ€์ƒ‰ ์—”์ง„(Google Scholar ๋“ฑ)์—์„œ ๊ด‘๋ฒ”์œ„ํ•œ ์ฟผ๋ฆฌ(T)์— ๋Œ€ํ•ด ์ƒ์œ„ K๊ฐœ ๋ฌธ์„œ(์ตœ๋Œ€ 1000๊ฐœ) ์ˆ˜์ง‘
  2. ์ž„๋ฒ ๋”ฉ ๋ฐ ํด๋Ÿฌ์Šคํ„ฐ๋ง:
    • ๋ฌธ๋งฅ ์ž„๋ฒ ๋”ฉ(contextual embeddings)์„ ํ™œ์šฉํ•œ ์ €๋น„์šฉ ์—ฐ์‚ฐ
    • ์ฝ”ํผ์Šค๋ฅผ ์‘์ง‘๋ ฅ ์žˆ๋Š” ์†Œ๊ทœ๋ชจ ๋ถ€๋ถ„์ฃผ์ œ ๊ทธ๋ฃน์œผ๋กœ ๋ถ„ํ• 
  3. ํด๋Ÿฌ์Šคํ„ฐ ํŒ๋…๊ธฐ(Cluster Reader):
    • ๊ฐ ํด๋Ÿฌ์Šคํ„ฐ๋ฅผ ๊ฐœ๋ณ„์ ์œผ๋กœ LLM์— ์ž…๋ ฅ
    • ๊ณตํ†ต ์ฃผ์ œ ๋ถ„์„, ์„ค๋ช… ์ƒ์„ฑ, ๋ช…๋ช…, ๊ด€๋ จ์„ฑ ์ ์ˆ˜ ๋ถ€์—ฌ
  4. ์ฃผ์ œ ์กฐ์งํ™”:
    • ๊ด€๋ จ์„ฑ ํ•„ํ„ฐ๋ง์„ ํ†ต๊ณผํ•œ ๋ชจ๋“  ํด๋Ÿฌ์Šคํ„ฐ ๋ช…์นญ๊ณผ ์„ค๋ช…์„ 2์ฐจ LLM์— ์ž…๋ ฅ
    • ํด๋Ÿฌ์Šคํ„ฐ๋“ค์„ ์ฃผ์ œ๋ณ„ ๊ทธ๋ฃน์œผ๋กœ ์กฐ์งํ™”ํ•˜์—ฌ ๊ณ„์ธต ๊ตฌ์กฐ ํ˜•์„ฑ
  5. ๋ถ€๋ถ„์ฃผ์ œ ํ™•์žฅ๊ธฐ(Subtopic Expander):
    • ์‚ฌ์šฉ์ž๊ฐ€ ์„ ํƒํ•œ ๋ถ€๋ถ„์ฃผ์ œ์— ๋Œ€ํ•ด ์„ธ๋ถ„ํ™”๋œ ์ถ”๊ฐ€ ๋ฌธ์„œ ๊ฒ€์ƒ‰์„ ์œ„ํ•œ ์ฟผ๋ฆฌ ์ž๋™ ์ƒ์„ฑ

์„ค๊ณ„ ์›์น™:

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 4/5 Significance: 5/5 Clarity: 5/5 Overall: 4/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ๊ณผํ•™ ๋ฌธํ—Œ์˜ ํƒ์ƒ‰์  ๊ฒ€์ƒ‰์„ ์œ„ํ•ด LLM์„ ํ™œ์šฉํ•œ ์‹ค์šฉ์ ์ด๊ณ  ํšจ๊ณผ์ ์ธ ์‹œ์Šคํ…œ์„ ์ œ์‹œํ•˜๋ฉฐ, ์ƒˆ๋กœ์šด ๋ฒค์น˜๋งˆํฌ์™€ ๊ณต๊ฐœ ์ž๋ฃŒ๋ฅผ ์ œ๊ณตํ•˜์—ฌ ํ–ฅํ›„ ์—ฐ๊ตฌ์˜ ํ† ๋Œ€๋ฅผ ๋งˆ๋ จํ•œ๋‹ค. ๋‹ค๋งŒ ๊ธฐ์ˆ ์  ํ˜์‹ ์„ฑ์€ ์ค‘๊ฐ„ ์ˆ˜์ค€์ด๊ณ  ์‚ฌ์šฉ์ž ์—ฐ๊ตฌ๋ฅผ ํ†ตํ•œ ์‹ค์ œ ํšจ๊ณผ์„ฑ ๊ฒ€์ฆ์ด ๋ถ€์กฑํ•œ ์ ์ด ์•„์‰ฝ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM๊ณผ RAG ๊ธฐ๋ฐ˜ ํƒ์ƒ‰์  ์ฃผ์ œ ์กฐ์งํ™” ๊ธฐ๋ฒ•์˜ ์ด๋ก ยท์‘์šฉ ๋™ํ–ฅ์„ ์ œ์‹œํ•˜์—ฌ, Knowledge Navigator์˜ ๊ตฌ์กฐ์  ์„ค๊ณ„ ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณ„์ธต์  ์นดํƒˆ๋กœ๊ทธ ์ƒ์„ฑ ๋ฒค์น˜๋งˆํฌ๋ฅผ ์ž๋™ํ™” ํƒ์ƒ‰ ๋ฐ ๊ณ„์ธต์  ์ฃผ์ œ ์กฐ์งํ™”์— ์ง์ ‘์ ์œผ๋กœ ํ™œ์šฉํ•œ ๋…ผ๋ฌธ์œผ๋กœ, 450์€ 402์—์„œ ๋‹ค๋ฃฌ ๋ฐฉ๋ฒ•๋ก ์˜ ์‹ค์ œ ์‘์šฉ ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
593 ๋…ผ๋ฌธ์€ ๊ฒ€์ƒ‰ยท์ƒ์„ฑ ๊ฒฐํ•ฉํ˜• ๊ณผํ•™๋ฌธํ—Œ ์ •๋ณด ํƒ์ƒ‰ ์‹œ์Šคํ…œ์„ ์ œ์‹œํ•ด, 450์˜ LLM ๊ฐ€์ด๋“œ ํƒ์ƒ‰์  ๊ฒ€์ƒ‰ ํ”„๋ ˆ์ž„์— ๊ตฌ์กฐ์  ์ด๋ก ยท๊ธฐ์ˆ  ํ† ๋Œ€๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ตฌ์ถ•๊ณผ ๊ฐœ๋… ์ถ”์ถœ์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
602๋Š” ๋…ผ๋ฌธ ๊ฒ€์ƒ‰์— RAG ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ๋ฅผ ๋„์ž…ํ•ด ๊ฒ€์ƒ‰๊ฒฐ๊ณผ๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ์š”์•ฝยท์ •๋ ฌํ•˜๋Š” ์ ‘๊ทผ์œผ๋กœ, 450 ๋…ผ๋ฌธ์˜ LLM+ํด๋Ÿฌ์Šคํ„ฐ ๋ฐฉ๋ฒ•๊ณผ ์œ ์‚ฌ ๋ชฉ์ ์˜ ๋‹ค๋ฅธ ๋ฐฉ์‹์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋…ผ๋ฌธ์˜ ๋ฆฌ๋ทฐ์™€ ๊ด€๋ จ ์ž‘์—…์„ ์ž๋™ํ™”ํ•˜๋Š” ๋‹ค์–‘ํ•œ LLM ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์„ ๋น„๊ตํ•ด๋ด„์œผ๋กœ์จ ์ ‘๊ทผ ๋ฐฉ์‹ ์ฐจ์ด๋ฅผ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Knowledge Navigator ๋…ผ๋ฌธ์€ ๋…ผ๋ฌธ ๊ฐ„ ๊ด€๊ณ„ ํ•ด์„๊ณผ ํ†ตํ•ฉ์  browsing ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•˜์—ฌ, Citation context recommendation์˜ ๋‹ค์–‘ํ•œ ๊ตฌํ˜„ ํŒจํ„ด์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™์  ๋ฌธํ—Œ์— ๋Œ€ํ•ด ์งˆ๋ฌธ ์‘๋‹ต๊ณผ ์ง€์‹ ํ‰๊ฐ€๋ฅผ ๋‹ค๋ฃจ๋Š” ์ข…ํ•ฉ์  ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ, 450์˜ ์ฃผ์ œ๋ณ„ ํƒ์ƒ‰๊ณผ๋Š” ๋‹ฌ๋ฆฌ QA ์ค‘์‹ฌ์˜ ํƒ์ƒ‰์  ํ‰๊ฐ€๋ฅผ ์‹œ๋„ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ์—ฐ๊ตฌ์—์„œ LLM ๋ฐ agent๋ฅผ ํ™œ์šฉํ•œ ํƒ์ƒ‰์  ํˆด-์‚ฌ์šฉ ํ™˜๊ฒฝ ๋ฒค์น˜๋งˆํ‚น์ด ๊ฐ€๋Šฅํ•˜๋ฉฐ, ๋‘ ์‹œ์Šคํ…œ์˜ ํƒ์ƒ‰ ์ง€์› ์ „๋žต์ด ๋Œ€๋น„๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
400๊ฐœ ์ด์ƒ์˜ ๋…ผ๋ฌธ์„ LLM ๊ธฐ๋ฐ˜ ๊ณ„์ธต์  ๊ตฐ์ง‘ํ™”๋กœ ํƒ์ƒ‰ํ•˜๋Š” ๋…ผ๋ฌธ์œผ๋กœ, 402์—์„œ ์ œ์‹œ๋œ ๊ณ„์ธต์  ์นดํƒˆ๋กœ๊ทธ ์ƒ์„ฑ ๊ณผ์ œ๋ฅผ ์‹ค์งˆ์ ์œผ๋กœ ํ™•์žฅ ์ ์šฉํ•˜๋Š” ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ธ€๋กœ๋ฒŒ ๊ด€์ ์˜ ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ตฌ์ถ•๊ณผ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ ํ†ตํ•ฉ ์‚ฌ๋ก€๋ฅผ ํ†ตํ•ด, Knowledge Navigator์˜ ํƒ์ƒ‰ ํšจ์œจ์„ฑ ๊ฐœ์„  ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM ์—์ด์ „ํŠธ๊ฐ€ ๋…ผ๋ฌธ ๊ฒ€์ƒ‰ ๋ฐ ์ฃผ์ œ ์กฐ์งํ™”์—์„œ ์ž๋™ํ™”๋œ ๋…ผ๋ฌธ ๊ฒ€์ƒ‰๊ณผ ํƒ์ƒ‰์— ์–ด๋–ป๊ฒŒ ๊ธฐ์—ฌํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ๊ตฌ์ฒด์  ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ํƒ์ƒ‰ ํ”„๋ ˆ์ž„์›Œํฌ 'Knowledge Navigator'์—์„œ ๋ณต์žก ์ •๋ณด ํƒ์ƒ‰ ๋ฐ ๊ฒ€์ฆ ๋Šฅ๋ ฅ ์‹ ์žฅ ๋ฐฉ๋ฒ•๋ก ๊นŒ์ง€ ์—ฐ๊ฒฐํ•ด๋ณผ ์ˆ˜ ์žˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •