Litllm: A toolkit for scientific literature review

์ €์ž: Shubham Agarwal, Gaurav Sahu, Abhay Puri, Issam H. Laradji, Krishnamurthy DJ Dvijotham, Jason Stanley, Laurent Charlin, Christopher Pal | ๋‚ ์งœ: 2024 | DOI: N/A 📄 PDF


Essence

Figure 1

LitLLM ์ธํ„ฐํŽ˜์ด์Šค: ์‚ฌ์šฉ์ž ์ œ๊ณต ์ดˆ๋ก์„ ๊ธฐ๋ฐ˜์œผ๋กœ Retrieval Augmented Generation(RAG) ์›์น™์„ ์ ์šฉํ•˜์—ฌ ๋ฌธํ—Œ ๋ฆฌ๋ทฐ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ์‹œ์Šคํ…œ

LitLLM์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)๊ณผ ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ(RAG) ๊ธฐ์ˆ ์„ ๊ฒฐํ•ฉํ•˜์—ฌ ๊ณผํ•™ ๋…ผ๋ฌธ์˜ ๊ด€๋ จ ์—ฐ๊ตฌ(Related Work) ์„น์…˜ ์ž‘์„ฑ์„ ์ž๋™ํ™”ํ•˜๋Š” ๋Œ€ํ™”ํ˜• ๋„๊ตฌ์ด๋‹ค. ์‹œ์Šคํ…œ์€ ์‚ฌ์šฉ์ž ์ œ๊ณต ์ดˆ๋ก์œผ๋กœ๋ถ€ํ„ฐ ํ‚ค์›Œ๋“œ ์ถ”์ถœ, ๋…ผ๋ฌธ ๊ฒ€์ƒ‰ ๋ฐ ์žฌ์ˆœ์œ„ํ™”, ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ์ƒ์„ฑ์˜ ๋ชจ๋“ˆํ™”๋œ ํŒŒ์ดํ”„๋ผ์ธ์„ ํ†ตํ•ด ํ™˜๊ฐ(hallucination) ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•œ๋‹ค.

Motivation

Achievement

Figure 2

๋ชจ๋“ˆํ™”๋œ ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌ์กฐ: ์ดˆ๋ก โ†’ ํ‚ค์›Œ๋“œ ์ƒ์„ฑ โ†’ ๋…ผ๋ฌธ ๊ฒ€์ƒ‰ โ†’ ์žฌ์ˆœ์œ„ํ™” โ†’ ์ตœ์ข… ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ์ƒ์„ฑ

  1. ์‹ค์šฉ์  ๋„๊ตฌ ๊ฐœ๋ฐœ: ์‚ฌ์šฉ์ž ์นœํ™”์  ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ๊ฐ–์ถ˜ ์™„์ „ํ•œ ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ์‹œ์Šคํ…œ์„ ๊ตฌํ˜„ํ–ˆ์œผ๋ฉฐ, ๋ฐ๋ชจ ๋ฐ ๊ณต๊ฐœ ํˆดํ‚ท์„ ์ œ๊ณตํ•œ๋‹ค(https://litllm.github.io).
  2. ํ™˜๊ฐ ๋ฌธ์ œ ํ•ด๊ฒฐ: RAG ๊ธฐ๋ฐ˜ ์ ‘๊ทผ์œผ๋กœ ๊ฒ€์ƒ‰๋œ ์‹ค์ œ ๋…ผ๋ฌธ๋“ค์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์ƒ์„ฑํ•˜๋„๋ก ์กฐ๊ฑดํ™”ํ•˜์—ฌ ํ™˜๊ฐ ํ˜„์ƒ์„ ํฌ๊ฒŒ ๊ฐ์†Œ์‹œํ‚จ๋‹ค.
  3. ์œ ์—ฐํ•œ ๊ฒ€์ƒ‰ ์ „๋žต: ์ดˆ๋ก ๊ธฐ๋ฐ˜ ํ‚ค์›Œ๋“œ ์ถ”์ถœ, ์‚ฌ์šฉ์ž ์ œ๊ณต ํ‚ค์›Œ๋“œ, ์‹œ๋“œ ๋…ผ๋ฌธ ์ถ”์ฒœ ๋“ฑ ๋‹ค์–‘ํ•œ ๊ฒ€์ƒ‰ ์ „๋žต์„ ์ œ๊ณตํ•˜์—ฌ ํ•™์ œ์  ์—ฐ๊ตฌ(interdisciplinary research)์—๋„ ๋Œ€์‘ํ•  ์ˆ˜ ์žˆ๋‹ค.
  4. ์ œ์–ด ๊ฐ€๋Šฅํ•œ ์ƒ์„ฑ: ๋ฌธ์žฅ ๊ณ„ํš(sentence-based planning) ๊ธฐ๋Šฅ์„ ํ†ตํ•ด ์ƒ์„ฑ๋œ ๋ฌธํ—Œ ๋ฆฌ๋ทฐ์˜ ๊ธธ์ด์™€ ํ˜•์‹์„ ์‚ฌ์šฉ์ž๊ฐ€ ์ œ์–ดํ•  ์ˆ˜ ์žˆ๋‹ค.

How

Figure 3

๋‹ค์–‘ํ•œ ๊ฒ€์ƒ‰ ์ „๋žต: ์ดˆ๋ก ๊ธฐ๋ฐ˜ ํ‚ค์›Œ๋“œ ์š”์•ฝ, ์‚ฌ์šฉ์ž ์ œ๊ณต ํ‚ค์›Œ๋“œ, ์‹œ๋“œ ๋…ผ๋ฌธ ๊ธฐ๋ฐ˜ ์ถ”์ฒœ

3.1 ๋…ผ๋ฌธ ๊ฒ€์ƒ‰ ๋ชจ๋“ˆ (Paper Retrieval Module)

Figure 4

ํ‚ค์›Œ๋“œ ์š”์•ฝ ํ”„๋กฌํ”„ํŠธ: ์—ฐ๊ตฌ ์ดˆ๋ก์„ 5๊ฐœ ์ดํ•˜์˜ ๊ฒ€์ƒ‰ ํ‚ค์›Œ๋“œ๋กœ ๋ณ€ํ™˜

3.2 ๋…ผ๋ฌธ ์žฌ์ˆœ์œ„ํ™” ๋ชจ๋“ˆ (Paper Re-Ranking Module)

Figure 5

์žฌ์ˆœ์œ„ํ™” ํ”„๋กฌํ”„ํŠธ: ์ดˆ๋ก๊ณผ ํ›„๋ณด ๋…ผ๋ฌธ๋“ค์˜ ์ถ”์ƒ์„ ์ž…๋ ฅํ•˜์—ฌ ๊ด€๋ จ์„ฑ ๊ธฐ๋ฐ˜ ์ˆœ์œ„ ์ƒ์„ฑ

3.3 ์š”์•ฝ ์ƒ์„ฑ ๋ชจ๋“ˆ (Summary Generation Module)

Originality

Limitation & Further Study

Evaluation

์ดํ‰: LitLLM์€ ๊ณผํ•™ ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ์ž‘์„ฑ์„ ์œ„ํ•œ ์‹ค์šฉ์ ์ด๊ณ  ์ž˜ ์„ค๊ณ„๋œ ๋„๊ตฌ๋กœ, RAG ์›์น™์„ ํ†ตํ•ด LLM์˜ ํ™˜๊ฐ ๋ฌธ์ œ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ•ด๊ฒฐํ•˜๊ณ  ๋ชจ๋“ˆํ™”๋œ ํŒŒ์ดํ”„๋ผ์ธ์œผ๋กœ ์ฒด๊ณ„์ ์ธ ์ ‘๊ทผ์„ ์ œ์‹œํ•œ๋‹ค. ๋‹ค๋งŒ ๊ฐœ๋ณ„ ๋ชจ๋“ˆ์˜ ์„ฑ๋Šฅ ํ‰๊ฐ€(ํŠนํžˆ ์žฌ์ˆœ์œ„ํ™” ์ •ํ™•๋„)์™€ ์ƒ์„ฑ ๊ฒฐ๊ณผ์˜ ํ’ˆ์งˆ ๊ฒ€์ฆ์ด ๋ถ€์žฌํ•˜์—ฌ, ํ•™์ˆ ์  ์—„๋ฐ€์„ฑ๊ณผ ์‹ค์ œ ์œ ์šฉ์„ฑ์„ ์ž…์ฆํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ •๋Ÿ‰์  ํ‰๊ฐ€ ๋ฐ ์‚ฌ์šฉ์ž ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Nobel-Turing Challenge ๋…ผ๋ฌธ์€ ์ž๋™ํ™”๋œ AI ๊ณผํ•™์ž์˜ ๊ฐœ๋…์„ ์ œ์‹œํ•˜๋ฉฐ, Litllm์ด ์ง€ํ–ฅํ•˜๋Š” ์ž๋™ ์—ฐ๊ตฌ ๋ฆฌ๋ทฐ ์‹œ์Šคํ…œ์˜ ๊ถ๊ทน์  ์ง€ํ–ฅ์ ์„ ๋…ผ์˜ํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
732๋Š” ์ž๋™ํ™”๋œ ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ๊ณตํ•˜์—ฌ, 493์˜ ๋Œ€ํ™”ํ˜• review generation ํˆดํ‚ท ๊ฐœ๋ฐœ์— ๋ฐ์ดํ„ฐ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
493์€ LLM ๊ธฐ๋ฐ˜ ๋ฌธํ—Œ๋ฆฌ๋ทฐ ํˆดํ‚ท(Litllm)๋ฅผ ์ œ๊ณตํ•˜์—ฌ, 510์˜ ์ž๋™ ๋ฌธํ—Œ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ์˜ ์‹ค์šฉ์  ๊ตฌํ˜„ ๊ธฐ๋ฐ˜์„ ๋งˆ๋ จํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ(RAG) ๊ธฐ๋ฐ˜ ํ•™์ˆ  ๋…ผ๋ฌธ ์ƒ์„ฑ์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Neural Related Work Summarization์€ ๋…ผ๋ฌธ ๊ด€๋ จ์—ฐ๊ตฌ ์ž‘์„ฑ ์ž๋™ํ™”์—์„œ ์‹œํ€€์Šค-๊ธฐ๋ฐ˜ ์‹ ๊ฒฝ๋ชจ๋ธ ํ™œ์šฉ๋ฒ•์„ ์ค‘์ ์ ์œผ๋กœ ์ œ์‹œ, LLM+RAG ์ค‘์‹ฌ์˜ 493๊ณผ ๋ฐฉ๋ฒ•๋ก ์ ์œผ๋กœ ๋ณด์™„์ ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
549 ๋…ผ๋ฌธ์€ autonomous ML ์—ฐ๊ตฌ๋ฅผ ์œ„ํ•œ LLM ๊ธฐ๋ฐ˜ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ์ œ์•ˆํ•˜์—ฌ, 493์˜ ์ž๋™ํ™”๋œ ์—ฐ๊ตฌ ๊ด€๋ จ ์„น์…˜ ์ƒ์„ฑ๊ณผ ์ƒ์ดํ•œ ์–ดํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋…ผ๋ฌธ์˜ ๋ฆฌ๋ทฐ์™€ ๊ด€๋ จ ์ž‘์—…์„ ์ž๋™ํ™”ํ•˜๋Š” ๋‹ค์–‘ํ•œ LLM ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์„ ๋น„๊ตํ•ด๋ด„์œผ๋กœ์จ ์ ‘๊ทผ ๋ฐฉ์‹ ์ฐจ์ด๋ฅผ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ปจํ…์ŠคํŠธ ๊ธธ์ด ์ตœ์ ํ™” ๋ฐ ๋ฉ€ํ‹ฐ RAG ์ „๋žต ์—ฐ๊ตฌ๋กœ, ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ์ž๋™ํ™”์—์„œ ํ•„์š”ํ•œ ๊ธฐ์ˆ ์  ํ†ต์ฐฐ์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ธ์šฉ ๊ธฐ๋ฐ˜ ๋ฌธํ—Œ ์š”์•ฝ์—์„œ ์œ ์‚ฌํ•œ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ๋Š” ๋Œ€์•ˆ์  ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Litllm์€ SciReviewGen ๋ฐ์ดํ„ฐ์…‹/๋ฌธ์ œ์™€ ์œ ์‚ฌํ•œ ์กฐ๊ฑด์—์„œ LLM ๊ธฐ๋ฐ˜ ํ•™์ˆ  ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ์ž๋™ํ™” ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Litllm์€ ๊ณผํ•™ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ๋ฐ ๊ฒ€ํ†  ์ž๋™ํ™” ๋„๊ตฌ๋กœ OAG-Bench์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์‹ค์ œ ๋ฌธํ—Œ ๊ด€๋ฆฌ ๋ฐ ํƒ์ƒ‰์— ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Litllm ๋…ผ๋ฌธ์€ ๊ณผํ•™์  ๊ธ€์“ฐ๊ธฐยท์•„์ด๋””์–ด ์ž‘์—… ๋“ฑ์—์„œ LLM์˜ ์ธ๊ฐ„ vs. AI ๊ฐ๋ณ„์„ฑ ๊ด€๋ จ ์ •๋Ÿ‰ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•˜์—ฌ ํŠœ๋งํ…Œ์ŠคํŠธ ๋…ผ์˜์— ์‹ค์ฆ์  ์ถ”๊ฐ€๋…ผ๊ฑฐ๋ฅผ ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
493์€ ๊ณผํ•™ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ์ž๋™ํ™”์— ํŠนํ™”๋œ ํˆดํ‚ท์œผ๋กœ, 087์˜ ๋ฌธํ—Œ synthesis pipeline์—์„œ ๋ฆฌ๋ทฐ ์ž๋™ํ™”๊นŒ์ง€์˜ ํ™•์žฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
396๋ฒˆ ๋…ผ๋ฌธ์˜ ํ™˜๊ฐ ์™„ํ™” ๋ฐ ์‹ ๋ขฐ์„ฑ ํ–ฅ์ƒ ํ”„๋ ˆ์ž„์›Œํฌ๋Š” 493๋ฒˆ LitLLM์—์„œ ๊ณผํ•™ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ์‹œ ํ™˜๊ฐ์„ ์ค„์ด๊ธฐ ์œ„ํ•œ ๊ฒ€์ƒ‰-์ฆ๊ฐ• ์ƒ์„ฑ pipeline์— ํ™œ์šฉ๋ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Litllm์€ RAG์™€ LLM์„ ๊ฒฐํ•ฉํ•˜์—ฌ ๊ด€๋ จ ๋…ผ๋ฌธ ์š”์•ฝ์„ ์ž๋™ํ™”ํ•˜๋ฉฐ, ์‹ค์ œ๋กœ ์–ด๋–ค ๋ฌธ๋งฅ ๊ธธ์ด ๋ฐ ์ฆ๊ฐ• ๋ฐฉ๋ฒ•์ด ํšจ๊ณผ์ ์ธ์ง€ ํƒ๊ตฌํ•œ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
493์—์„œ RAG์™€ LLM ํ™œ์šฉ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ๊ฐ•์กฐํ•˜๋Š”๋ฐ, 800๋ฒˆ ๋…ผ๋ฌธ์€ LLM ์ •๋ ฌ ๊ณผ์ •์—์„œ ๋ฐœ์ƒํ•˜๋Š” ์ˆจ๊ฒจ์ง„ ํŽธํ–ฅ ๋ฌธ์ œ๋ฅผ ๋น„ํŒ์ ์œผ๋กœ ์ง€์ ํ•˜์—ฌ ์ƒํ˜ธ์ฐธ์กฐ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •