Prompting llms to compose meta-review drafts from peer-review narratives of scholarly manuscripts

์ €์ž: Lan Luo, Dongyijie Primo Pan, Junhua Zhu, Muzhi Zhou, Pan Hui | ๋‚ ์งœ: 2024 | URL: https://arxiv.org/abs/2402.15589 📄 PDF


Essence

Figure 4

Fig. 4: Overall Rating aggregated over three LLMs and four Prompt Levels.

๋ณธ ๋…ผ๋ฌธ์€ LLM(GPT-3.5, PaLM2, LLaMA2)์ด ํ•™์ˆ  ๋…ผ๋ฌธ์˜ ํ”ผ์–ด ๋ฆฌ๋ทฐ ์˜๊ฒฌ๋“ค์„ ์ข…ํ•ฉํ•˜์—ฌ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ดˆ์•ˆ ์ž‘์„ฑ์„ ์ง€์›ํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ์—ฐ๊ตฌํ•œ ์‚ฌ๋ก€ ์—ฐ๊ตฌ์ด๋‹ค.

Motivation

Achievement

Figure 4

Fig. 4: Overall Rating aggregated over three LLMs and four Prompt Levels.

How

Figure 1

Fig. 1: Core Contributions Ratings - rated separately across different Prompt Levels and different LLMs. Here, SA:

Originality

Limitation & Further Study

Evaluation

Novelty: 3/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ํ‘œ์ค€ํ™”๋œ ํ”„๋กฌํ”„ํŒ… ๋ถ„๋ฅ˜์ฒด๊ณ„๋ฅผ ์ ์šฉํ•˜์—ฌ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ž‘์„ฑ ์ง€์› ์ž‘์—…์— ๋Œ€ํ•œ LLM์˜ ์„ฑ๋Šฅ์„ ์ตœ์ดˆ๋กœ ์ฒด๊ณ„์ ์œผ๋กœ ๋น„๊ต ๋ถ„์„ํ–ˆ์œผ๋ฉฐ, ๋Œ€๊ทœ๋ชจ ์ •์„ฑ์  ํ‰๊ฐ€๋ฅผ ํ†ตํ•ด LLM ์ž๋™ ํ‰๊ฐ€์˜ ์‹ ๋ขฐ์„ฑ ๋ฌธ์ œ๋ฅผ ๋ฐํ˜€๋ƒˆ๋‹ค๋Š” ์ ์—์„œ ํ•™์ˆ  ์ถœํŒ ํ”„๋กœ์„ธ์Šค ์ž๋™ํ™” ์—ฐ๊ตฌ์— ์œ ์˜๋ฏธํ•œ ๊ธฐ์—ฌ๋ฅผ ํ•œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ํ”ผ์–ด ๋ฆฌ๋ทฐ ์˜๊ฒฌ ์ข…ํ•ฉ ๋ฐ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ƒ์„ฑ์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์„ ํ–‰ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ฒดํฌ๋ฆฌ์ŠคํŠธ์™€ introspection ๊ธฐ๋ฐ˜ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ƒ์„ฑ ๊ธฐ๋ฒ•์„ ๋„์ž…ํ•ด, LLM ํ™œ์šฉ ์ž๋™ ๋ฆฌ๋ทฐ ์š”์•ฝ์˜ ๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ•๋ก ์„ ๋น„๊ต ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ—ˆ์œ„ ์ •๋ณด ํƒ์ง€ ๋ฐ ํŒฉํŠธ์ฒดํ‚น์„ ๋‹ค๋ฅธ ์‹œ์Šคํ…œ์œผ๋กœ ๊ตฌํ˜„ํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
022๋Š” ๊ฐ์ •ํ†ตํ•ฉ ๊ธฐ๋ฐ˜ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•˜๋Š” ๋…ผ๋ฌธ์œผ๋กœ, 1089๊ฐ€ LLM์˜ ํ”„๋กฌํ”„ํŠธ ์„ค๊ณ„์— ์ดˆ์ ์„ ๋งž์ถ˜ ๋ฐฉ์‹๊ณผ ์„œ๋กœ ๋น„๊ต๋  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํŠนํ™” LLM(AI Reviewer)์˜ ํ”ผ์–ด๋ฆฌ๋ทฐ ๋ฐ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ์„ ๋น„๊ตํ•˜์—ฌ ๊ฐ ์ ‘๊ทผ๋ฒ•์˜ ํ•œ๊ณ„์™€ ์žฅ์ ์„ ํ•จ๊ป˜ ์‚ดํŽด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ ํ•™์ˆ  ๋ฆฌ๋ทฐ ์ž๋™ํ™”๋ฅผ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ์ ‘๊ทผํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ํ•™์ˆ  ๋ฌธ์„œ ์š”์•ฝ ๋ฐ ์ข…ํ•ฉ์„ ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์œผ๋กœ ๊ตฌํ˜„ํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM์„ ์ด์šฉํ•œ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ž‘์„ฑ ์ง€์›์„ ํŠน์ • ํ•™์ˆ  ๋งฅ๋ฝ์— ํ™•์žฅ ์ ์šฉํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
609๋Š” LLM ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ๋…ผ๋ฆฌ์ , ๋…ผ๋ฐ• ์ค‘์‹ฌ์œผ๋กœ ์ž๋™ํ™”ํ•˜๋Š” ์ ‘๊ทผ์„ ํƒํ•ด ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ƒ์„ฑ์˜ ๋…ผ๊ฑฐ ๊ฐ•ํ™”๋ฅผ ์ œ์‹œํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์žฅ๋ฌธ ์ปจํ…์ŠคํŠธ ์ž‘์„ฑ์—์„œ ํšจ๊ณผ์  ํ”„๋กฌํ”„ํŠธ ์„ค๊ณ„ ์š”์ธ์„ ๊ณ ์ฐฐํ•˜์—ฌ, ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ƒ์„ฑ์˜ ํ’ˆ์งˆ๊ณผ ์ผ๊ด€์„ฑ ๊ฐœ์„ ์„ ์œ„ํ•œ ๊ตฌ์ฒด์  ์ „๋žต์„ ์ œ์•ˆํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Peer review์˜ AI/์ธ๊ฐ„ ํ˜‘์—… ์‚ฌ๋ก€๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ดˆ์•ˆ ์ž‘์„ฑ ๋‹จ๊ณ„์—์„œ LLM์˜ ์—ญํ•  ํ™•์žฅ ์ ์„ ์‹ค์ฆ์ ์œผ๋กœ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
1089๋ฒˆ ๋…ผ๋ฌธ์€ LLM ํ™œ์šฉ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ดˆ์•ˆ ์ƒ์„ฑ ๋ฐฉ๋ฒ•์„ ๋‹ค๋ฃจ์–ด 654๋ฒˆ ๋ฐ์ดํ„ฐ์…‹์ด ํ•™์Šต์šฉ์œผ๋กœ ์–ด๋–ป๊ฒŒ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋Š”์ง€ ์‹ค์ œ ์ ์šฉ ์‚ฌ๋ก€๋กœ ์—ฐ๊ฒฐ๋œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •