Summarizing multiple documents with conversational structure for meta-review generation

์ €์ž: Miao Li, Eduard Hovy, Jey Han Lau | ๋‚ ์งœ: 2023 | DOI: arXiv:2305.01498 📄 PDF


Essence

Figure 1

๊ณ„์ธต์  ๋Œ€ํ™” ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง„ PEERSUM ๋ฐ์ดํ„ฐ์…‹ ์˜ˆ์‹œ: ๊ณต์‹ ๋ฆฌ๋ทฐ, ์ €์ž ์‘๋‹ต, ๊ณต๊ฐœ ๋ฆฌ๋ทฐ ๋“ฑ์ด ์Šค๋ ˆ๋“œ ํ˜•ํƒœ๋กœ ์กฐ์ง๋จ

ํ•™์ˆ  ๋…ผ๋ฌธ ์‹ฌ์‚ฌ ๊ณผ์ •์—์„œ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ(meta-review)๋ฅผ ์ž๋™ ์ƒ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ๋ฆฌ๋ทฐ์–ด๋“ค์˜ ์ƒ์ถฉ๋œ ์˜๊ฒฌ๊ณผ ๋‹ค์ค‘ ์ˆœํ™˜ ๋Œ€ํ™”๋ฅผ ํฌํ•จํ•œ ๊ณ„์ธต์  ๊ตฌ์กฐ๋ฅผ ๊ฐ–์ถ˜ ์ƒˆ๋กœ์šด ๋‹ค์ค‘๋ฌธ์„œ ์š”์•ฝ ๋ฐ์ดํ„ฐ์…‹(PEERSUM)๊ณผ ์ด๋ฅผ ํ™œ์šฉํ•˜๋Š” ๊ด€๊ณ„-์ธ์‹ ๋ชจ๋ธ(RAMMER)์„ ์ œ์•ˆํ•œ๋‹ค.

Motivation

Achievement

Figure 1

PEERSUM์˜ ๊ณ„์ธต์  ๊ตฌ์กฐ: ๊ณต์‹ ๋ฆฌ๋ทฐ ์Šค๋ ˆ๋“œ, ์ €์ž ์‘๋‹ต, ๊ณต๊ฐœ ๋ฆฌ๋ทฐ, ๋…ผ๋ฌธ ์ดˆ๋ก ๋“ฑ์ด ํŠธ๋ฆฌ ๊ตฌ์กฐ๋กœ ๊ตฌ์„ฑ๋จ (ํ‰๊ท  ๋†’์ด 3.63, ๋„ˆ๋น„ 5.31)

  1. PEERSUM ๋ฐ์ดํ„ฐ์…‹: 14,993๊ฐœ ์ƒ˜ํ”Œ(ICLR 2018-2022, NeurIPS 2021-2022)๋กœ ๊ตฌ์„ฑ. ๊ธฐ์กด MDS ๋ฐ์ดํ„ฐ์…‹๊ณผ ๋‹ฌ๋ฆฌ:
    • ๋ช…์‹œ์  ๊ณ„์ธต์  ๋Œ€ํ™” ๊ตฌ์กฐ ํฌํ•จ
    • ๋†’์€ ์ถ”์ƒ์„ฑ(abstractiveness): ์œ ๋‹ˆ๊ทธ๋žจ 42%, ๋ฐ”์ด๊ทธ๋žจ 77%, ํŠธ๋ผ์ด๊ทธ๋žจ 81%๊ฐ€ ์†Œ์Šค ๋ฌธ์„œ์— ์—†์Œ
    • ์‹ ๋ขฐ๋„ ๋†’์Œ(faithfulness): ๋ฉ”ํƒ€๋ฆฌ๋ทฐ๊ฐ€ ์†Œ์Šค ๋ฌธ์„œ๋ฅผ ์ถฉ์‹คํžˆ ๋ฐ˜์˜
    • ์ƒ์ถฉ ์ƒ˜ํ”Œ 13.6%: ๋ฆฌ๋ทฐ ํ‰์  ์ฐจ์ด โ‰ฅ4์ธ ๊ฒฝ์šฐ ๋ช…์‹œ์  ํ‘œ์‹œ
  2. RAMMER ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ: ์ž๋™ ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ(ROUGE, ๋…ผ๋ฌธ ์ˆ˜์šฉ ์—ฌ๋ถ€ ์˜ˆ์ธก ๊ธฐ๋ฐ˜ ๋ฉ”ํŠธ๋ฆญ)์—์„œ ๊ธฐ์ค€ ๋ชจ๋ธ๋“ค์„ ๋Šฅ๊ฐ€

How

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณต์žกํ•œ ๊ตฌ์กฐ์™€ ์ƒ์ถฉํ•˜๋Š” ์ •๋ณด๋ฅผ ๋‹ค๋ฃจ๋Š” ํ˜„์‹ค์ ์ด๊ณ  ๋„์ „์ ์ธ ๋‹ค์ค‘๋ฌธ์„œ ์š”์•ฝ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ์‹œํ•œ ์ ์—์„œ ํ•™์ˆ ์  ๊ธฐ์—ฌ๋„๊ฐ€ ๋†’์œผ๋‚˜, ์ œ์•ˆ๋œ ๋ชจ๋ธ์ด ํ•ต์‹ฌ ๋ฌธ์ œ(์ƒ์ถฉ ํ•ด๊ฒฐ)๋ฅผ ํ•ด๊ฒฐํ•˜์ง€ ๋ชปํ•จ์„ ๋ณด์—ฌ์ฃผ์–ด ํ–ฅํ›„ ์—ฐ๊ตฌ์˜ ๋ฐฉํ–ฅ์„ ๋ช…ํ™•ํžˆ ์ œ์‹œํ•œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
883 ๋…ผ๋ฌธ์€ ๋ฆฌ๋ทฐ์–ด ๊ฐ„์˜ ์˜๊ฒฌ ์ถฉ๋Œ์„ ์‹๋ณ„ํ•˜๋Š” ํŠนํ™”๋œ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•˜๋ฏ€๋กœ, 778์˜ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ๋ฐ์ดํ„ฐ์…‹ ์„ค๊ณ„ ์‹œ ์ฐธ๊ณ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
385์˜ GLIMPSE ๋‹ค์ค‘ ๋ฌธ์„œ ์š”์•ฝ์€ 778์˜ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ž๋™ ์ƒ์„ฑ์—์„œ ๊ณ„์ธต์  ๊ตฌ์กฐ์™€ ์ƒ์ถฉ ์˜๊ฒฌ ์š”์•ฝ ๋ฐฉ์‹์˜ ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ด๋ฃน๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
778๋ฒˆ ๋…ผ๋ฌธ์€ ๋Œ€ํ™” ๊ตฌ์กฐ ๊ธฐ๋ฐ˜ ๋‹ค์ค‘ ๋ฌธ์„œ ์š”์•ฝ์— ๋Œ€ํ•œ ์ฒด๊ณ„์  ์ ‘๊ทผ์„ ์ œ์‹œํ•˜์—ฌ, 478๋ฒˆ์˜ LLM ๊ธฐ๋ฐ˜ ์ €์ˆ  ๋ฐ ํ”ผ์–ด ๋ฆฌ๋ทฐ ํƒ์ง€ ํ”„๋ ˆ์ž„์›Œํฌ ๋ถ„์„์— ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
803 'The open review-based (orb) dataset' ๋…ผ๋ฌธ์€ ์˜คํ”ˆ ๋ฆฌ๋ทฐ ๊ธฐ๋ฐ˜ ์ž๋™ ํ‰๊ฐ€์™€ ๋ฆฌ๋ทฐ์–ด ํ–‰๋™ ๋ฐ์ดํ„ฐ์— ์ดˆ์ ์„ ๋งž์ถ”๋ฏ€๋กœ, 778 PEERSUM์˜ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ž๋™์ƒ์„ฑ๊ณผ ์ƒ๋ณด์ ์œผ๋กœ ์ฝ์œผ๋ฉด ๋ฆฌ๋ทฐ ์ž๋™ํ™” ์—ฐ๊ตฌ ํ๋ฆ„์„ ํญ๋„“๊ฒŒ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Streamlining the review process ๋…ผ๋ฌธ์€ AI ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ ์‹œ์Šคํ…œ์˜ ์‹ค์ œ ๋ฐ์ดํ„ฐ ํ™œ์šฉ๋ฒ•๊ณผ ๋ฉ”ํƒ€-๋ฆฌ๋ทฐ ์ƒ์„ฑ์„ ๋‹ค๋ฅธ ์ ‘๊ทผ ๋ฐฉ์‹์œผ๋กœ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์—ฌ๋Ÿฌ ๋ฌธ์„œ ๋ฐ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ๋Œ€ํ™” ๊ตฌ์กฐ๋ฅผ ํ™œ์šฉํ•œ ๋‹ค์ค‘์š”์•ฝ์„ ์ œ์•ˆํ•˜๋ฉฐ, ์ž„์ƒ ์ ‘์ˆ˜ ์‹œ๋‚˜๋ฆฌ์˜ค์˜ ๋Œ€ํ™” ๋ฐ์ดํ„ฐ ์ƒ์„ฑ๊ณผ ์—ฐ๊ฒฐ์ง€์–ด ๋ณผ ๋งŒํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
778์€ ๊ณผํ•™๋ฌธ์„œ ๋‹ค์ค‘ ๋ฌธ์„œ ์š”์•ฝ์— ๋Œ€ํ•œ ์ ‘๊ทผ์œผ๋กœ, ์ง€์‹ ๊ทธ๋ž˜ํ”„์™€ LLM ๊ฒฐํ•ฉ์˜ ์‹ค์ œ์  ์‘์šฉ์ด๋ผ๋Š” ์ ์—์„œ 705์™€ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
778์˜ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ž๋™ํ™”์™€ ๋‹ฌ๋ฆฌ 665๋Š” ์ธ์  ์‹ฌ์‚ฌ์™€ LLM ํ˜‘์—… ๊ธฐ๋ฐ˜ ๋™๋ฃŒํ‰๊ฐ€ ์ž๋™ํ™” ํ”„๋กœ์„ธ์Šค๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewAgents ๋…ผ๋ฌธ์€ ์ธ๊ฐ„-AI ๊ฐ„ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ํŽธ์ฐจ๋ฅผ ๋‹ค๋ฃจ๋ฉฐ ๋‹ค์–‘ํ•œ ๋‹ค์ค‘๋ฌธ์„œ ์š”์•ฝ ๋ฐ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋‘ ๋…ผ๋ฌธ ๋ชจ๋‘ ๋™๋ฃŒํ‰๊ฐ€ ์‹œ์Šคํ…œ ๋‚ด ๋‹ค๋ฌธ์„œ ์š”์•ฝ๊ณผ ์˜๊ฒฌ ์กฐ์œจ์— ์ง‘์ค‘ํ•˜๋ฉฐ, 385๋Š” ์˜์žฅ ๋ณด์กฐ๋ฅผ ์œ„ํ•œ ๋‹ค์–‘ํ•œ ํ•ฉ์˜ ์ถ”์ถœ ๋ฐฉ๋ฒ•๋ก ์„ ๋”ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
CAF ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ์‚ฌํšŒ์‹ฌ๋ฆฌํ•™์  ๊ด€์ ์—์„œ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ž๋™์ƒ์„ฑ์˜ ์ธ์ง€์  ํŽธํ–ฅ ์™„ํ™” ๋ฐฉ์•ˆ์„ ์ œ์‹œํ•˜๋ฉฐ, PEERSUM ๋ฐ์ดํ„ฐ ํ›„์† ์—ฐ๊ตฌ์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
029 ๋…ผ๋ฌธ์€ ๊ณผํ•™ LLM์˜ ๋ฐ์ดํ„ฐ ๋ฐ ๋ฒค์น˜๋งˆํฌ ๊ด€๋ จ ์ข…ํ•ฉ ๋กœ๋“œ๋งต์„ ์ œ์‹œํ•˜์—ฌ, 778์˜ ๋ฐ์ดํ„ฐ์…‹ PEERSUM์˜ ์˜๋ฏธ๋ฅผ ๋” ๋„“์€ ๋งฅ๋ฝ์—์„œ ํ•ด์„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •