Meta-review generation with checklist-guided iterative introspection

์ €์ž: Qi Zeng, M. Sidhu, Ansel Blume, Hou Pong Chan, Lu Wang, Heng Ji | ๋‚ ์งœ: 2023 | DOI: N/A 📄 PDF


Essence

๋ณธ ๋…ผ๋ฌธ์€ ํ•™์ˆ  ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋“ค์„ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ๋กœ ์ข…ํ•ฉํ•˜๋Š” ๊ณผํ•™์  ์˜๊ฒฌ ์š”์•ฝ(Scientific Opinion Summarization) ์ž‘์—…์„ ์ •์˜ํ•˜๊ณ , ์ฒดํฌ๋ฆฌ์ŠคํŠธ ๊ธฐ๋ฐ˜ ๋ฐ˜๋ณต ์ž๊ธฐ์„ฑ์ฐฐ(CGI2) ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์•ˆํ•˜์—ฌ ๋Œ€๊ทœ๋ชจ ์‹ค์ œ ๋ฐ์ดํ„ฐ์…‹(ORSUM)๊ณผ ํ•จ๊ป˜ ์ด๋ฅผ ํ•ด๊ฒฐํ•œ๋‹ค.

Motivation

Achievement

Figure 2

๋ฉ”ํƒ€๋ฆฌ๋ทฐ ๊ตฌ์„ฑ ๋ถ„์„: ์žฅ๋‹จ์  ๋…ผ์˜ 47.7%, ํ•ฉ์˜/๋…ผ์Ÿ 35.0%๋งŒ์ด ๊ธฐ์ค€ ์ถฉ์กฑ

  1. ORSUM ๋ฐ์ดํ„ฐ์…‹: 47๊ฐœ ํ•™ํšŒ์—์„œ 15,062๊ฐœ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ์™€ 57,536๊ฐœ ๋ฆฌ๋ทฐ๋ฅผ ์ˆ˜์ง‘ํ•œ ๊ฐ€์žฅ ๋Œ€๊ทœ๋ชจ ์‹ค์ œ ๋…ผ๋ฌธ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ๋ฐ์ดํ„ฐ์…‹(๊ธฐ์กด ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ์…‹๊ณผ ๋‹ฌ๋ฆฌ ๋†’์€ ์ถ”์ƒ์„ฑ 99.89%, ๋‚ฎ์€ ์ค‘๋ณต๋„ NID=0.1572)
  2. ์งˆ์  ๋ถ„์„: ์ธ๊ฐ„ ์ž‘์„ฑ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ์˜ 47.7%๋งŒ์ด ์žฅ๋‹จ์  ๋…ผ์˜ ๊ธฐ์ค€์„ ๋งŒ์กฑํ•˜๊ณ , 35.0%๋งŒ์ด ํ•ฉ์˜/๋…ผ์Ÿ์„ ๋ช…์‹œ์ ์œผ๋กœ ๋‹ค๋ฃธ์„ ๋ฐœ๊ฒฌ
  3. ๋ฐฉ๋ฒ•๋ก  ํšจ๊ณผ์„ฑ: CGI2๊ฐ€ ์ž‘์—… ๋ถ„ํ•ด์™€ ๋ฐ˜๋ณต ์ž๊ธฐ์„ฑ์ฐฐ์„ ํ†ตํ•ด LLM์˜ ๋ณต์žก ์ง€์‹œ ๋”ฐ๋ฅด๊ธฐ ๋Šฅ๋ ฅ๊ณผ ํ™˜๊ฐ ๊ฐ์†Œ ๋ฌธ์ œ ํ•ด๊ฒฐ

How

Figure 3

CGI2 ํ”„๋ ˆ์ž„์›Œํฌ: ์ดˆ๊ธฐ ๋ฐ˜๋ณต์—์„œ ๊ฐ•์ /์•ฝ์  ์ถ”์ถœ ๋ฐ ์˜์‚ฌ ๊ฒฐ์ • ์„ ํƒ, ์ดํ›„ ๋ฐ˜๋ณต์—์„œ ํ•ฉ์˜/๋…ผ์Ÿ ํ‰๊ฐ€ ๋ฐ ์ข…ํ•ฉ

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ๊ธฐ์กด ์˜๊ฒฌ ์š”์•ฝ ์—ฐ๊ตฌ์˜ ํ•œ๊ณ„๋ฅผ ๋ช…ํ™•ํžˆ ์ธ์‹ํ•˜๊ณ  ํ•™์ˆ  ๋„๋ฉ”์ธ์˜ ํŠน์ˆ˜์„ฑ์„ ๋ฐ˜์˜ํ•œ ์ƒˆ๋กœ์šด ์ž‘์—…๊ณผ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ์‹œํ•œ ์˜๋ฏธ ์žˆ๋Š” ๊ธฐ์—ฌ๋‹ค. ํŠนํžˆ ์ž‘์—… ๋ถ„ํ•ด์™€ ๋ฐ˜๋ณต ์ž๊ธฐ์„ฑ์ฐฐ์„ ๊ฒฐํ•ฉํ•œ CGI2 ๋ฐฉ๋ฒ•๋ก ์€ ๋ณต์žกํ•œ ํ…์ŠคํŠธ ์ƒ์„ฑ ์ž‘์—…์— ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅํ•œ ๊ฐ€์น˜ ์žˆ๋Š” ์ ‘๊ทผ๋ฒ•์„ ์ œ์•ˆํ•œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ฒดํฌ๋ฆฌ์ŠคํŠธ ๊ธฐ๋ฐ˜ ๋ฐ˜๋ณต ํ”ผ๋“œ๋ฐฑ ๊ตฌ์กฐ๋กœ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ƒ์„ฑ ํ’ˆ์งˆ ํ–ฅ์ƒ ๋ชจ๋ธ์„ ์ œ์‹œํ•˜์—ฌ, ๋…ผ๋ฌธ ์ž๋™ ์ƒ์„ฑ์˜ ํ’ˆ์งˆ ๊ทน๋Œ€ํ™” ์ด๋ก ์„ ๋ณด์™„ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹ค์ค‘ ๋ฌธ์„œ ์š”์•ฝ ์‹œ์Šคํ…œ์˜ ์„ฑ๋Šฅ๊ณผ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•์„ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋“ค์„ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ๋กœ ์ข…ํ•ฉํ•˜๋Š” ๋ฐ˜๋ณต ์ž๊ธฐ์„ฑ์ฐฐ ๊ธฐ๋ฐ˜ ์š”์•ฝ ๋ฐฉ๋ฒ•์œผ๋กœ, 402 ๋…ผ๋ฌธ์˜ ๊ณ„์ธต์  ๋ชฉ์ฐจ ์ƒ์„ฑ ๊ณผ์ œ์™€ ๋‹ฌ๋ฆฌ ๋ฆฌ๋ทฐ ์š”์•ฝ์— ์ง‘์ค‘ํ•œ ๋Œ€์•ˆ์  ์ ‘๊ทผ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
1089(Prompting llms to compose meta-review drafts)๋Š” ๋ฆฌ๋ทฐ ์ฝ”๋ฉ˜ํŠธ๋กœ๋ถ€ํ„ฐ LLM ๊ธฐ๋ฐ˜ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ดˆ์•ˆ ์ƒ์„ฑ ์‹คํ—˜์„ ๋‹ค๋ฃจ์–ด, 534์˜ ์ฒดํฌ๋ฆฌ์ŠคํŠธ ๋ฐ˜๋ณต๋ฒ•๊ณผ ์ง์ ‘ ๋น„๊ต ๊ฐ€๋Šฅํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ์„ค๊ณ„ ํ”Œ๋ž˜๋‹ ๋ฐ ์‚ฌ์ „ ์กฐ์‚ฌ์— ์ดˆ์ ์„ ๋‘๋ฉด์„œ, 534์˜ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์š”์•ฝ๊ณผ๋Š” ๋‹ค๋ฅธ AI ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐยท์˜๊ฒฌ ๊ฒฐํ•ฉ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ•™์ˆ  ๋™๋ฃŒ ํ‰๊ฐ€ ์š”์•ฝ์„ ์œ„ํ•œ ๋‹ค๋ฅธ ์ž๋™ํ™” ๋ฐฉ๋ฒ•๋ก ์„ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ์ž๋™ํ™” ๋ฐ ํ‰๊ฐ€์— ๊ด€ํ•œ ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ๋กœ ์ƒํ˜ธ ๋ณด์™„์  ๊ด€์ ์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ์‹œ์Šคํ…œ์ด ์ธ๊ฐ„์˜ ์ž‘์—…์„ ๋ณด์กฐยท๊ฐ•ํ™”ํ•˜๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ž๋™ํ™” ์‚ฌ๋ก€๋ฅผ ๋ถ„์„ํ•˜์—ฌ, ์ธ๊ฐ„-AI ํŒ€ ๊ธฐ๋ฐ˜ ๊ณผํ•™์—ฐ๊ตฌ ์‘์šฉ์— ์ฐธ๊ณ ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
RAG ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋ฌธํ—Œ ์š”์•ฝ์—์„œ ์œ ์‚ฌํ•œ ์ ‘๊ทผ๋ฒ•์„ ์‚ฌ์šฉํ•˜๋Š” ๋Œ€์•ˆ์  ์‹œ์Šคํ…œ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋…ผ๋ฌธ ์ž๋™ ์š”์•ฝ์˜ ์ •ํ™•๋„์™€ ํŽธํ–ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
534๋Š” ์ƒ์„ฑ AI ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์ง„๋ณด์™€ ๊ณผ์ œ๋ฅผ ๋‹ค๋ฃจ๋Š” ์ด์„ค๋กœ, 3149๊ฐ€ ์ œ๊ณตํ•˜๋Š” ์ผ๋ฐ˜ํ™”/์•ˆ์ •ํ™” ๋…ผ์˜๋ฅผ ๋ฉ”ํƒ€์ ์œผ๋กœ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
779๋ฒˆ ๋…ผ๋ฌธ์€ ํ˜์‹ ์  ์„ค๊ณ„ ํ‰๊ฐ€์—์„œ ์œ ์‚ฌํ•œ ์ฒดํฌ๋ฆฌ์ŠคํŠธ ๋ฐ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ ์šฉํ•˜์—ฌ, 534๋ฒˆ์˜ ๋ฐฉ๋ฒ•๋ก ์  ์˜ํ–ฅ๋ ฅ์„ ๋‹ค๋ฅธ ๋„๋ฉ”์ธ์œผ๋กœ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
534๋Š” ์ฒดํฌ๋ฆฌ์ŠคํŠธ ๊ธฐ๋ฐ˜์˜ ๋ฐ˜๋ณต์  ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ƒ์„ฑ์„ ๋‹ค๋ฃจ์–ด, 022์˜ ๊ฐ์ • ํ†ตํ•ฉ ํ”„๋ ˆ์ž„์›Œํฌ์™€ ์ƒ๋ณด์ ์œผ๋กœ ํ™œ์šฉ ๊ฐ€๋Šฅํ•˜๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
608 ๋…ผ๋ฌธ์€ ํ”ผ์–ด๋ฆฌ๋ทฐ์˜ ๋ฉ€ํ‹ฐํ„ดยท์žฅ๋ฌธ ๋Œ€ํ™” ์ฒ˜๋ฆฌ ์ธก๋ฉด์—์„œ, 534์˜ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ž๋™ ์ƒ์„ฑ ํ”„๋ ˆ์ž„์„ ์žฅ๊ธฐ ๋Œ€ํ™”ํ˜• ์ž‘์—…์œผ๋กœ ํ™•์žฅํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Meta-review generation with checklist-guided iterative introspection ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ ์ž๋™ํ™”์˜ ์‹ฌ์ธต์  ์ž๊ธฐ๋ฐ˜์˜ ๋ฐ ์ฒดํฌ๋ฆฌ์ŠคํŠธ ๊ธฐ๋ฐ˜ ํ™•์žฅ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•˜์—ฌ 665์— ๋ณด์™„์  ์•„์ด๋””์–ด๋ฅผ ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์‹ค์ œ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ดˆ์•ˆ์„ ์ž‘์„ฑํ•˜๋Š” ํ”„๋กœ์„ธ์Šค์— ๋Œ€ํ•ด LLM ํ”„๋กฌํ”„ํŠธ ์„ค๊ณ„ ๋ฐ ์ตœ์†Œ ์ฒดํฌ๋ฆฌ์ŠคํŠธ ๋ฐฉ์‹์˜ ํ™•์žฅ์  ์‹คํ—˜ ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AI๋ฅผ ํ™œ์šฉํ•œ ๋ฆฌ๋ทฐ ํ”„๋กœ์„ธ์Šค ๊ฐœ์„  ๋ฐ ์ž๋™ ์ฃผ์„ ์ƒ์„ฑ์„ ์‹œ๋„ํ•จ์œผ๋กœ์จ, 534์˜ ์ฒดํฌ๋ฆฌ์ŠคํŠธ ๊ธฐ๋ฐ˜ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ์ด ์‹ค๋ฌด์— ์–ด๋–ป๊ฒŒ ์ ์šฉ๋  ์ˆ˜ ์žˆ๋Š”์ง€ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •