Peer Review as A Multi-Turn and Long-Context Dialogue with Role-Based Interactions

์ €์ž: Cheng Tan, Dongxin Lyu, Siyuan Li, Zhangyang Gao, Jingxuan Wei, Siqi Ma, Zicheng Liu, Stan Z. Li | ๋‚ ์งœ: 2024-06-09 | DOI: 10.48550/arXiv.2406.05688 📄 PDF


Essence

Figure 1

๊ทธ๋ฆผ 1: ๊ธฐ์กด LLM ํ”ผ์–ด๋ฆฌ๋ทฐ ์ ‘๊ทผ๋ฒ•๊ณผ ๊ฐœ์„ ๋œ ํ”„๋ ˆ์ž„์›Œํฌ ๋น„๊ต

๋Œ€๊ทœ๋ชจ์–ธ์–ด๋ชจ๋ธ(LLM)์˜ ํ•™์ˆ  ๋…ผ๋ฌธ ํ”ผ์–ด๋ฆฌ๋ทฐ ๊ณผ์ •์„ ๋‹จ์ˆœํ•œ ์ •์  ๊ฒ€ํ†  ์ƒ์„ฑ์—์„œ ์ €์ž-๊ฒ€ํ† ์ž-์˜์‚ฌ๊ฒฐ์ •์ž ๊ฐ„์˜ ๋™์  ๋‹ค์ค‘ํ„ด ๋Œ€ํ™”๋กœ ์žฌ์ •์˜ํ•˜๊ณ , 92,017๊ฐœ์˜ ๊ฒ€ํ† ๋ฌธ์„ ํฌํ•จํ•œ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹(ReviewMT)์„ ๊ตฌ์ถ•ํ–ˆ๋‹ค.

Motivation

Achievement

Figure 2

๊ทธ๋ฆผ 2: ReviewMT ๋ฐ์ดํ„ฐ์…‹ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ํŒŒ์ดํ”„๋ผ์ธ ๊ฐœ์š”

  1. ์ข…ํ•ฉ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•: 26,841๊ฐœ ๋…ผ๋ฌธ, 92,017๊ฐœ ๊ฒ€ํ† ๋ฌธ์œผ๋กœ ๊ตฌ์„ฑ๋œ ReviewMT ๋ฐ์ดํ„ฐ์…‹ ๊ณต๊ฐœ. ICLR(2017-2024)๊ณผ Nature Communications(2023)์˜ ์ด์งˆ์  ๊ฒ€ํ†  ํ”„๋กœ์„ธ์Šค๋ฅผ ReviewMT-ICLR, ReviewMT-NC ๋‘ ๋ถ€๋ถ„์ง‘ํ•ฉ์œผ๋กœ ๋ถ„ํ• ํ•˜์—ฌ ์ œ๊ณต
  2. ์—ญํ• ๊ธฐ๋ฐ˜ ๋‹ค์ค‘ํ„ด ํ”„๋ ˆ์ž„์›Œํฌ: 4๋‹จ๊ณ„ ์ƒํ˜ธ์ž‘์šฉ ๊ตฌ์กฐ ๊ณต์‹ํ™”
    • 1ํ„ด: ๊ฒ€ํ† ์ž ์ดˆ๊ธฐ ๊ฒ€ํ† (P โ†’ Ri)
    • 2ํ„ด: ์ €์ž ์žฌ๋ฐ˜๋ฐ•(Ri โ†’ Ai)
    • 3ํ„ด: ๊ฒ€ํ† ์ž ์ตœ์ข… ๊ฒ€ํ† (Ai โ†’ R'i)
    • 4ํ„ด: ์˜์‚ฌ๊ฒฐ์ •์ž ์ตœ์ข… ํŒ์ •({Ri, Ai, R'i} โ†’ D)
  3. ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ์Šค ์ œ์‹œ: ๊ฐ ์—ญํ• ์˜ ์„ฑ๋Šฅ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ๋‹ค์ฐจ์› ์ง€ํ‘œ ์ œ์•ˆ(์‘๋‹ต์˜ ์œ ํšจ์„ฑ, ํ…์ŠคํŠธ ํ’ˆ์งˆ, ์ ์ˆ˜ ํ‰๊ฐ€, ์˜์‚ฌ๊ฒฐ์ • ํ‰๊ฐ€)

How

Figure 3

๊ทธ๋ฆผ 3: ReviewMT-ICLR ๋ฐ์ดํ„ฐ์…‹์˜ ICLR ๋…ผ๋ฌธ๊ณผ ๊ฒ€ํ† ๋ฌธ ํ†ต๊ณ„

Figure 4

๊ทธ๋ฆผ 4: ReviewMT ๋ฐ์ดํ„ฐ์…‹์˜ ํ‚ค์›Œ๋“œ ์›Œ๋“œํด๋ผ์šฐ๋“œ

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ์ด ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ์–ธ์–ด๋ชจ๋ธ์˜ ํ•™์ˆ  ํ”ผ์–ด๋ฆฌ๋ทฐ ์ ์šฉ์„ ํ˜„์‹ค์  ๋‹ค์ค‘ํ„ด ๋Œ€ํ™” ๊ตฌ์กฐ๋กœ ํ˜์‹ ์ ์œผ๋กœ ์žฌ์„ค์ •ํ•˜๊ณ , ์ด๋ฅผ ๋’ท๋ฐ›์นจํ•˜๋Š” ๋Œ€๊ทœ๋ชจ ๊ณ ํ’ˆ์งˆ ๋ฐ์ดํ„ฐ์…‹์„ ๊ณต๊ฐœํ•จ์œผ๋กœ์จ ํ•™์ˆ  AI ์‘์šฉ์˜ ์ค‘์š”ํ•œ ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•œ๋‹ค. ๋‹ค๋งŒ LLM ์„ฑ๋Šฅ ํ‰๊ฐ€ ๊ฒฐ๊ณผ์˜ ๋ถ€์žฌ์™€ ์ž๋™ ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ์Šค์˜ ๋ฏธ์„ฑ์ˆ™์ด ์‹œ๊ธ‰ํ•œ ๊ณผ์ œ์ด๋ฉฐ, ์‹ค์ œ ํ•™์ˆ  ์ƒํƒœ๊ณ„์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์— ๋Œ€ํ•œ ์‹ฌ์ธต ๋…ผ์˜๊ฐ€ ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
809(Three AI-powered steps to faster, smarter peer review)์€ AI ๊ธฐ๋ฐ˜ ํ”ผ์–ด๋ฆฌ๋ทฐ์˜ ์ž๋™ํ™”, ์‹ ๋ขฐ์„ฑ, ํ’ˆ์งˆ ๋…ผ์˜๋ฅผ ์‹ค๋ฌด์  ๊ด€์ ์—์„œ ์ œ์‹œํ•จ์œผ๋กœ์จ 608 ๋…ผ๋ฌธ์˜ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•๊ณผ ๋ฆฌ๋ทฐ ๋ชจ๋ธ๋ง์˜ ๊ธฐ์ดˆ ๋…ผ์˜๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Peer Review as A Multi-Turn... ๋…ผ๋ฌธ์€ ๋ฆฌ๋ทฐ/ํ”ผ๋“œ๋ฐฑ์˜ ๋Œ€ํ™”์  ํ”„๋กœ์„ธ์Šค๋ฅผ ๋ถ„์„ํ•˜๋ฉฐ, SEAGraph์˜ ๋ฆฌ๋ทฐ์ž-์ €์ž ์ดํ•ด ๊ตฌ์กฐ์™€ ๋น„๊ต ๊ฐ€๋Šฅํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹ค์ค‘ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์„ ์ด์šฉํ•œ ์‚ฌํšŒ์  ์ƒํ˜ธ์ž‘์šฉ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ์œ ์‚ฌํ•œ ์ ‘๊ทผ๋ฒ•์„ ์‚ฌ์šฉํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹ค์ค‘ ์—์ด์ „ํŠธ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ์˜ LLM ํ‰๊ฐ€๋ฅผ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ์ ‘๊ทผ๋ฒ•์˜ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๋ฆฌ๋ทฐ์–ด์˜ ์„œ๋ฒ ์ด ๋ฆฌ๋ทฐ ํ‰๊ฐ€ ๋ฒค์น˜๋งˆํฌ์™€, ๋™์  ๋ฆฌ๋ทฐ ๋Œ€ํ™” ๋ฐ์ดํ„ฐ์…‹์„ ๋น„๊ต ๋ถ„์„ํ•จ์œผ๋กœ์จ LLM ๊ธฐ๋ฐ˜ ํ”ผ์–ด๋ฆฌ๋ทฐ ํ‰๊ฐ€๋ฐฉ์‹์˜ ์ฐจ๋ณ„์ ์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ธ๊ฐ„-LLM ์ƒ์„ฑ ๋ฆฌ๋ทฐ ๊ฐ„ ์ฐจ์ด ๋ถ„์„์œผ๋กœ, ๋‹ค์ค‘ํ„ด, ๋กฑ์ปจํ…์ŠคํŠธ ๊ธฐ๋ฐ˜ ์‹ค์ œ ๋Œ€ํ™”์‹ ๋ฆฌ๋ทฐ์˜ ํ’ˆ์งˆ ๋ฐ ๊ฐœ์„ ์  ํŒŒ์•…์— ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ORb ๋ฐ์ดํ„ฐ์…‹์€ ReviewMT์™€ ์œ ์‚ฌํ•˜๊ฒŒ ์ž๋™ํ™”๋œ ๋ฆฌ๋ทฐ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ์‹ค์ œ ์‹คํ—˜ ๋ฐ ํ‰๊ฐ€ ์ผ€์ด์Šค๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
608 ๋…ผ๋ฌธ์€ ํ”ผ์–ด๋ฆฌ๋ทฐ์˜ ๋ฉ€ํ‹ฐํ„ดยท์žฅ๋ฌธ ๋Œ€ํ™” ์ฒ˜๋ฆฌ ์ธก๋ฉด์—์„œ, 534์˜ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ž๋™ ์ƒ์„ฑ ํ”„๋ ˆ์ž„์„ ์žฅ๊ธฐ ๋Œ€ํ™”ํ˜• ์ž‘์—…์œผ๋กœ ํ™•์žฅํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Peer Review as A Multi-Turn Dialogue ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ๋ฅผ ๋‹ค์ค‘ํ„ด ๋Œ€ํ™” ๊ด€์ ์œผ๋กœ ๋ถ„์„ํ•˜์—ฌ ์‹ค์ œ ์ ์šฉ์„ฑ ๋…ผ์˜๋ฅผ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
609(Peerarg)๋Š” LLM์„ ํ™œ์šฉํ•œ ๋…ผ์Ÿ์ , ๋…ผ์ฆ์  ํ”ผ์–ด๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•ด, 608์˜ ๋ฉ€ํ‹ฐํ„ดยท๋กค ๊ธฐ๋ฐ˜ ๋Œ€ํ™”์  ๋ฆฌ๋ทฐ ๋ชจ๋ธ์„ ๋…ผ์ฆ์„ฑ ์ค‘์‹ฌ์œผ๋กœ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Peer Review as A Multi-Turn Dialogue๋Š” LLM ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ์žฅ๋ฌธ ํ‰๊ฐ€๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, ํ‰๊ฐ€ ์ž๋™ํ™”์™€ ํ”ผ๋“œ๋ฐฑ์˜ ์‹ค์งˆ์  ์‘์šฉ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
608์€ ํ”ผ์–ด๋ฆฌ๋ทฐ ๊ณผ์ •์„ ๋‹ค์ค‘ ๋ผ์šด๋“œยท์žฅ๋ฌธ ๋งฅ๋ฝ ๋Œ€ํ™”๋กœ ํŒŒ์•…ํ•˜์—ฌ 776์ด ์ œ์•ˆํ•œ annotation ๊ธฐ๋ฐ˜ ํ˜‘์—…์„ ์‹ฌํ™”ยทํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋ฆฌ๋ทฐ-์ €์ž ๊ฐ„์˜ ๋‹ค์ค‘ํ„ด ์žฅ๊ธฐ๋Œ€ํ™”์™€ ์ธ์  ๋™๊ธฐ์š”์†Œ๋ฅผ ๋ฐ˜์˜ํ•œ ํ‰๊ฐ€ ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•˜์—ฌ, ๋…ผ๋ฌธ์—์„œ ๊ฐ•์กฐํ•œ ์–‘๋ฐฉํ–ฅ ํ”ผ๋“œ๋ฐฑ๊ณผ ์‹ฌ์‚ฌ์ž ์ฑ…์ž„์„ฑ ๊ฐ•ํ™” ๋ฐฉ์•ˆ์„ ๊ตฌ์ฒดํ™”ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ๋™๋ฃŒํ‰๊ฐ€์—์„œ ์‹ค์ œ ๋Œ€ํ™”ํ˜•, ์žฅ๊ธฐ๋ฌธ๋งฅ ์ž‘์„ฑ ๊ณผ์ •์˜ ์„ธ๋ฐ€ํ•œ ์›Œํฌํ”Œ๋กœ์šฐ์™€ ๊ทธ ํšจ๊ณผ๋ฅผ ๊ตฌ์ฒด์ ์œผ๋กœ ๋ณด์—ฌ์ค€๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AI ๋ฆฌ๋ทฐ์–ด ์‹œ์Šคํ…œ ๋ฐ peer review ๋™์  ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ์‹ค์ œ MT ๋ฐ์ดํ„ฐ์™€ ํ•ฉ์ณ์งˆ ๊ฐ€๋Šฅ์„ฑ์ด ํฝ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Paper2Web์—์„œ ์ƒ์„ฑํ•œ ๋Œ€ํ™”ํ˜• ๋ฉ€ํ‹ฐ๋ฏธ๋””์–ด ๋…ผ๋ฌธ ํ˜•ํƒœ์™€, ๋™์  ํ”ผ์–ด๋ฆฌ๋ทฐ ๋Œ€ํ™” ๊ธฐ๋ก์˜ ์ƒํ˜ธ์ž‘์šฉ์  ๋ถ„์„์ด ์–ด์šฐ๋Ÿฌ์ ธ ์‹ค์ œ peer review dynamics ์—ฐ๊ตฌ์— ์ ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •