SciReviewGen: a large-scale dataset for automatic literature review generation

์ €์ž: Tetsu Kasanishi, Masaru Isonuma, Junichiro Mori, Ichiro Sakata | ๋‚ ์งœ: 2023 | DOI: ๋…ผ๋ฌธ ๋งํฌ 📄 PDF


Essence

Figure 1

Figure 1: ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ์ž‘์—…์˜ ๊ฐœ์š”. ์ž…๋ ฅ๋œ ๋…ผ๋ฌธ์˜ ์ดˆ๋ก๊ณผ ๋ฆฌ๋ทฐ/์ฑ•ํ„ฐ ์ œ๋ชฉ(์ฟผ๋ฆฌ)์„ ํ†ตํ•ด ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ํ…์ŠคํŠธ๋ฅผ ์ƒ์„ฑํ•œ๋‹ค.

๋ณธ ๋…ผ๋ฌธ์€ ์ž๋™ ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ์ƒ์„ฑ์„ ์œ„ํ•œ ์ตœ์ดˆ์˜ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์ธ SciReviewGen์„ ์ œ์‹œํ•œ๋‹ค. 10,000๊ฐœ ์ด์ƒ์˜ ๋ฌธํ—Œ ๋ฆฌ๋ทฐ์™€ 690,000๊ฐœ์˜ ์ธ์šฉ ๋…ผ๋ฌธ์œผ๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ์œผ๋ฉฐ, ์ฟผ๋ฆฌ ๊ธฐ๋ฐ˜ ๋‹ค์ค‘ ๋ฌธ์„œ ์š”์•ฝ(query-focused multi-document summarization) ์ž‘์—…์œผ๋กœ ์ •์˜ํ•œ๋‹ค.

Motivation

Achievement

  1. ์ตœ์ดˆ์˜ ๋Œ€๊ทœ๋ชจ ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•: 9,187๊ฐœ์˜ ํ•™์Šต ์ƒ˜ํ”Œ, 484๊ฐœ์˜ ๊ฒ€์ฆ ์ƒ˜ํ”Œ, 459๊ฐœ์˜ ํ…Œ์ŠคํŠธ ์ƒ˜ํ”Œ๋กœ ๊ตฌ์„ฑ๋œ SciReviewGen ๋ฆด๋ฆฌ์Šค. ์ฑ•ํ„ฐ ๋‹จ์œ„๋กœ ๋ถ„ํ•  ์‹œ 84,705๊ฐœ์˜ ํ•™์Šต ์ƒ˜ํ”Œ์œผ๋กœ ํ™•๋Œ€.
  2. ๊ธฐ์กด ๋ฐ์ดํ„ฐ์…‹๊ณผ ์ฐจ๋ณ„ํ™”: Multi-XScience(116๊ฐœ ํ† ํฐ)์™€ ๋น„๊ตํ•˜์—ฌ ์•ฝ 5.2๋ฐฐ ๊ธด ์ถœ๋ ฅ(604๊ฐœ ํ† ํฐ), Multi-News(2,103๊ฐœ)์™€ ๋น„๊ตํ•˜์—ฌ 6๋ฐฐ ๊ธด ์ž…๋ ฅ(12,503๊ฐœ ํ† ํฐ)์„ ์ฒ˜๋ฆฌํ•˜๋Š” ๋” ๋„์ „์ ์ธ ๊ณผ์ œ ์ œ์‹œ.
  3. ์ž๋™ ๋ฐ ์ธ๊ฐ„ ํ‰๊ฐ€: ์•ฝ 30%์˜ ์ƒ์„ฑ๋œ ์ฑ•ํ„ฐ๊ฐ€ ์ธ๊ฐ„์ด ์ž‘์„ฑํ•œ ๋ฆฌ๋ทฐ์™€ ๋™๋“ฑํ•˜๊ฑฐ๋‚˜ ์šฐ์ˆ˜ํ•œ ์ˆ˜์ค€์„ ๋‹ฌ์„ฑํ•˜๋ฉฐ, ๋™์‹œ์— ํ™˜๊ฐ ๋ฌธ์ œ์™€ ์ •๋ณด ๋ถ€์กฑ ๋“ฑ์˜ ํ•œ๊ณ„ ๋ช…ํ™•ํ™”.

How

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ์ž๋™ ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ์ƒ์„ฑ์„ ์œ„ํ•œ ์ฒซ ๋ฒˆ์งธ ๋Œ€๊ทœ๋ชจ ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ์‹œํ•จ์œผ๋กœ์จ ํ•™์ˆ  NLP ๋ถ„์•ผ์— ์ค‘์š”ํ•œ ๊ธฐ์—ฌ๋ฅผ ํ•œ๋‹ค. ๋‹ค๋งŒ ์ƒ์„ฑ๋œ ๋ฆฌ๋ทฐ์˜ ํ’ˆ์งˆ ๊ฐœ์„ ๊ณผ ํ˜„์‹ค์  ์ ์šฉ์„ ์œ„ํ•ด์„œ๋Š” ํ™˜๊ฐ ๋ฌธ์ œ ํ•ด๊ฒฐ ๋ฐ ๋” ์ •๊ตํ•œ ๋ชจ๋ธ ๊ฐœ๋ฐœ์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
494๋Š” ๊ณผํ•™์  ์ฐฝ์˜์„ฑ๊ณผ ์•„์ด๋””์—์ด์…˜ ์ธก์ • ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜์—ฌ, SciReviewGen(732) ๋ฐ์ดํ„ฐ์…‹์ด ํ‰๊ฐ€๋˜๋Š” ๋ฐฉ๋ฒ•๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
732๋Š” ์ž๋™ํ™”๋œ ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ๊ณตํ•˜์—ฌ, 493์˜ ๋Œ€ํ™”ํ˜• review generation ํˆดํ‚ท ๊ฐœ๋ฐœ์— ๋ฐ์ดํ„ฐ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
SciReviewGen์€ ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ์ž๋™ ์ƒ์„ฑ์„ ์œ„ํ•œ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ๊ณตํ•˜์—ฌ, LLM ๊ธฐ๋ฐ˜ ๋ฌธํ—Œ๋ฆฌ๋ทฐ์˜ ๋ชจ๋ธ ํ›ˆ๋ จ๊ณผ ๊ฒ€์ฆ์— ๊ธฐ๋ฐ˜ ์ž๋ฃŒ๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
SciReviewGen์€ ๋‹ค์ค‘ ๋ฌธ์„œ ์š”์•ฝ ๋ฐ ์งˆ์˜์‘๋‹ต๊ณผ ๊ด€๋ จ๋œ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ๊ณตํ•˜์—ฌ, Scidqa์˜ ์‹ฌ์ธต ๊ณผํ•™ ํ…์ŠคํŠธ ์ดํ•ด ๋ฐ์ดํ„ฐ ์ƒ์„ฑ ๋ฐ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๊ธฐ๋ฐ˜์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ž๋™ํ™”๋œ ๋Œ€๊ทœ๋ชจ ๊ด€๋ จ ์—…๋ฌด(related work) ์„น์…˜ ์ƒ์„ฑ ๋ฐ ๋…ผ๋ฌธ ์กฐ์งํ™” ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•์— ๊ธฐ์—ฌํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
TLDR ๋…ผ๋ฌธ์€ ๊ณผํ•™ ๋…ผ๋ฌธ์˜ ์ž๋™ ์š”์•ฝ์— ๋Œ€ํ•œ ๋‹ค์–‘ํ•œ ์ ‘๊ทผ๋ฒ•์„ ์ œ์•ˆํ•ด SciReviewGen์˜ ์ž๋™ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐ์ดํ„ฐ์…‹๊ณผ ๋Œ€์กฐํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Generating a structured summary of numerous academic papers ๋…ผ๋ฌธ์€ ๋‹ค๋ฌธ์„œ ์š”์•ฝ ๊ธฐ๋ฒ•์„ ๋‹ค๋ฃจ์–ด SciReviewGen์˜ ์ฟผ๋ฆฌ ๊ธฐ๋ฐ˜ ๋‹ค์ค‘ ๋ฌธ์„œ ์š”์•ฝ๊ณผ ์ง์ ‘์ ์ธ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Literature review์—์„œ ๊ณ„์ธต์  ์นดํƒˆ๋กœ๊ทธ ์ƒ์„ฑ ๋ฒค์น˜๋งˆํฌ์™€ ์ž๋™ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ• ๋ฐฉํ–ฅ์ด ์„œ๋กœ ๋‹ค๋ฅธ ์ ‘๊ทผ์„ ์ œ๊ณตํ•˜์—ฌ ๋ณด์™„๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ฐจ๋ณ„์  ๋‹ค์ค‘ ๋ฌธ์„œ ์š”์•ฝ์˜ ๋‹ค๋ฅธ ๊ตฌํ˜„ ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewAgents(676)๋Š” AI ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ์ƒ์„ฑยทํ‰๊ฐ€ ์‹œ์Šคํ…œ์œผ๋กœ, SciReviewGen(732)์˜ ์ž๋™ํ™”๋œ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฒค์น˜๋งˆํฌ์™€ ์‹ค์งˆ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Surveyforge ๋…ผ๋ฌธ์€ ํ•™์ˆ  ์„œ๋ฒ ์ด ์ž๋™ํ™”์˜ outline, ๋ฉ”๋ชจ๋ฆฌ ๊ธฐ๋ฐ˜ ์ƒ์„ฑ ์ „๋žต์„ ์ œ์‹œํ•˜์—ฌ, SciReviewGen์˜ ๋Œ€๊ทœ๋ชจ ๋ฆฌ๋ทฐ ์ƒ์„ฑ๊ณผ ๋‹ค๋ฅธ ์ „๋žต์„ ๋น„๊ตํ•ด๋ณผ ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹ค์ค‘๋ฌธ์„œ ์š”์•ฝ ํŒŒ์ดํ”„๋ผ์ธ์˜ ์œ ์‚ฌํ•œ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ์ ‘๊ทผํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Litllm์€ SciReviewGen ๋ฐ์ดํ„ฐ์…‹/๋ฌธ์ œ์™€ ์œ ์‚ฌํ•œ ์กฐ๊ฑด์—์„œ LLM ๊ธฐ๋ฐ˜ ํ•™์ˆ  ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ์ž๋™ํ™” ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
SciReviewGen์€ ๋…ผ๋ฌธ์—์„œ ๋ฌธํ—Œ๋ฆฌ๋ทฐ ์ƒ์„ฑ์„ ์œ„ํ•ด LLM ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ๋ฅผ ๊ตฌ์ถ•ํ•˜๋Š” ๋“ฑ, P2P์™€ ํ•จ๊ป˜ ์ž๋™ํ™”๋œ ๊ณผํ•™ ์ปค๋ฎค๋‹ˆ์ผ€์ด์…˜ ๋ฐฉ์‹์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋Œ€๊ทœ๋ชจ ์ž๋™ํ™”๋œ ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ๋ฐ์ดํ„ฐ์…‹(SciReviewGen)๋Š” e-๋ชจ๋“ˆ ๋˜๋Š” ๊ต์œก ๋งค์ฒด ์—ฐ๊ตฌ๋™ํ–ฅ Bibliometric ๋ถ„์„ ์‹œ ๊ฒ€์ฆ ์ง€ํ‘œ๋กœ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Supporting assessment of novelty of design problems using co-citation and citation networks ๋…ผ๋ฌธ์€ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ์ž๋™ํ™” ๊ฒฐ๊ณผ์˜ ์ฐธ์‹ ์„ฑ ๋ฐ ํ‰๊ฐ€ ์š”์†Œ ๋ถ„์„์— SciReviewGen ๋ฐ์ดํ„ฐ์…‹์„ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Llms for literature review ๋…ผ๋ฌธ์€ SciReviewGen์˜ ๋Œ€๊ทœ๋ชจ ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐ์ดํ„ฐ์…‹์„ ์‹ค์ œ LLM ๊ธฐ๋ฐ˜ ์ž๋™ํ™” ์‹œ์Šคํ…œ ํ‰๊ฐ€๋กœ ์‘์šฉํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •