ReviewEval: An evaluation framework for AI-generated reviews

์ €์ž: Madhav Krishan Garg, Tejash Prasad, Tanmay Singhal, Chhavi Kirtani, Murari Mandal, Dhruv Kumar (IIIT Delhi, KIIT Bhubaneswar, BITS Pilani) | ๋‚ ์งœ: 2025 | DOI: N/A 📄 PDF


Essence

Figure 1

ReviewEval๊ณผ ReviewAgent: ๋…ผ๋ฌธ๊ณผ ํ•™ํšŒ/์ €๋„ ๊ฐ€์ด๋“œ๋ผ์ธ์ด ์ฃผ์–ด์กŒ์„ ๋•Œ, ReviewAgent๊ฐ€ AI ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ๋ฅผ ์ƒ์„ฑํ•˜๊ณ  ReviewEval์„ ํ†ตํ•ด ๋‹ค์–‘ํ•œ ์ฐจ์›์—์„œ ํ‰๊ฐ€

ํ•™์ˆ  ๋…ผ๋ฌธ ๋™๋ฃŒ ํ‰๊ฐ€(peer review) ๋ถ€์กฑ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด LLM ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ ์‹œ์Šคํ…œ์˜ ์‹ ๋ขฐ์„ฑ์„ ํ‰๊ฐ€ํ•˜๋Š” ์ข…ํ•ฉ ํ”„๋ ˆ์ž„์›Œํฌ ReviewEval๊ณผ ์ž์ฒด ๊ฐœ์„  ๋ฃจํ”„๋ฅผ ๊ฐ–์ถ˜ AI ๋ฆฌ๋ทฐ์–ด ReviewAgent๋ฅผ ์ œ์•ˆํ•œ๋‹ค.

Motivation

Achievement

Figure 2

AI ์ƒ์„ฑ ๋ฆฌ๋ทฐ์˜ ์ฃผ์š” ๋ฌธ์ œ์ : (์ขŒ์ธก๋ถ€ํ„ฐ) ์ธ๊ฐ„ ๋ฆฌ๋ทฐ์™€์˜ ์˜๋ฏธ์ /์ฃผ์ œ์  ์ฐจ์ด, ์‚ฌ์‹ค์  ๋ถ€์ •ํ™•์„ฑ ๋ฐ ํ™˜๊ฐ, ์ œํ•œ๋œ ๋ถ„์„์  ์ถ”๋ก , ๊ตฌ์ฒด์  ๊ฐœ์„  ์ œ์•ˆ ๋ถ€์กฑ

  1. ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ํ†ต์ฐฐ ๊ฐœ์„ : ๊ธฐ์กด AI ๊ธฐ์ค€์„  ๋Œ€๋น„ 6.78%, ์ „๋ฌธ๊ฐ€ ๋ฆฌ๋ทฐ ๋Œ€๋น„ 47.62% ํ–ฅ์ƒ
  2. ๋ถ„์„ ๊นŠ์ด ๊ฐ•ํ™”: ๊ธฐ์กด AI ๊ธฐ์ค€์„  ๋Œ€๋น„ 3.97%, ์ „๋ฌธ๊ฐ€ ๋ฆฌ๋ทฐ ๋Œ€๋น„ 12.73% ์ฆ๊ฐ€
  3. ๊ฐ€์ด๋“œ๋ผ์ธ ์ค€์ˆ˜ ํ–ฅ์ƒ: ๊ธฐ์กด AI ๊ธฐ์ค€์„  ๋Œ€๋น„ 10.11%, ์ „๋ฌธ๊ฐ€ ๋ฆฌ๋ทฐ ๋Œ€๋น„ 47.26% ๊ฐœ์„ 
  4. ๋‹ค์ฐจ์› ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ: ๊ธฐ์กด ์œ ์‚ฌ์„ฑ ๊ธฐ๋ฐ˜ ํ‰๊ฐ€๋ฅผ ๋„˜์–ด ํˆฌ๋ช…ํ•˜๊ณ  ํ•ด์„ ๊ฐ€๋Šฅํ•œ 5๊ฐœ ์ฐจ์›์˜ ํ‰๊ฐ€ ์ง€ํ‘œ ์ œ๊ณต

How

Figure 3

๋ฉ”ํŠธ๋ฆญ ๊ธฐ์—ฌ๋„ ๋ถ„์„

ReviewEval ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ

ReviewAgent ์„ค๊ณ„

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ์ด ๋…ผ๋ฌธ์€ AI ์ƒ์„ฑ ํ•™์ˆ  ๋ฆฌ๋ทฐ์˜ ํ’ˆ์งˆ์„ ๋‹ค๊ฐ์ ์œผ๋กœ ํ‰๊ฐ€ํ•˜๋Š” ํฌ๊ด„์  ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•˜์—ฌ ์ด ๋ถ„์•ผ์˜ ์ค‘์š”ํ•œ ๊ณต๋ฐฑ์„ ๋ฉ”์šฐ๊ณ  ์žˆ๋‹ค. ํŠนํžˆ ์‚ฌ์‹ค์„ฑ, ๋ถ„์„ ๊นŠ์ด, ์‹คํ–‰ ๊ฐ€๋Šฅ์„ฑ๊ณผ ๊ฐ™์€ ์ƒˆ๋กœ์šด ํ‰๊ฐ€ ์ฐจ์›๊ณผ ์ž๋™ํ™”๋œ ์‚ฌ์‹ค ๊ฒ€์ฆ ํŒŒ์ดํ”„๋ผ์ธ์ด ๊ฐ€์น˜์žˆ๋Š” ๊ธฐ์—ฌ์ด๋‚˜, ์ œํ•œ๋œ ๋ฐ์ดํ„ฐ์…‹ ๊ทœ๋ชจ์™€ ์‹ค์ œ ํ•™ํšŒ ์ ์šฉ ๊ฒ€์ฆ์„ ํ†ตํ•ด ์‹ค๋ฌด์  ์˜ํ–ฅ๋ ฅ์„ ๋”์šฑ ๊ฐ•ํ™”ํ•  ํ•„์š”๊ฐ€ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ORb ๋ฐ์ดํ„ฐ์…‹์€ AI ์ƒ์„ฑ ๋ฆฌ๋ทฐ์˜ ์ž๋™ํ™” ํ‰๊ฐ€ ํ”„๋กœํ† ์ฝœ ๋ฐ ๋ ˆ์ด๋ธ”๋ง ์„ค๊ณ„๋ฅผ ์œ„ํ•œ ๊ธฐ์ดˆ๊ฐ€ ๋˜๋Š” ์‹ค์ œ ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ์ž…๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ReviewEval ๋…ผ๋ฌธ์€ AI ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•ด ContraSciView ๋ฐ์ดํ„ฐ์…‹ ๋ฐ peer review ๋ชจ์ˆœ ํƒ์ง€์˜ ํ‰๊ฐ€ ์ง€์นจ์œผ๋กœ ์ฝ์„ ์ˆ˜ ์žˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
AI ์ƒ์„ฑ ๋ฆฌ๋ทฐ, ๋ช…ํ™•ํ™” ์งˆ๋ฌธ ๋ฐ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ ๊ฐœ๋ฐœ์˜ ์ด๋ก ์  ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•˜๋Š” ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ๋™๋ฃŒํ‰๊ฐ€์ž ์„ ์ •๊ณผ ๋‹ค์ค‘ ํ‰๊ฐ€ ๋ชจ๋ธ ๋…ผ์˜๊ฐ€ ์‹ ๋ขฐ์„ฑ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์ด๋ก ์  ๊ทผ๊ฑฐ๋กœ ํ™œ์šฉ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ํ•™์ˆ  ํ‰๊ฐ€ ์‹œ์Šคํ…œ์˜ ๊ธฐ์ˆ ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
679 ๋…ผ๋ฌธ์€ AI ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ํ‰๊ฐ€์ฒด๊ณ„๋ฅผ ์„ค๊ณ„ํ•˜์—ฌ, 262์—์„œ ์ œ์‹œํ•œ ๋‹จ๊ณ„๋ณ„ LLM ๋…ผ๋ฌธ ์‹ฌ์‚ฌ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ํšจ๊ณผ ๊ฒ€์ฆ์— ์ฐธ๊ณ ๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Standard terminology for peer review ๋…ผ๋ฌธ์€ ํ”ผ์–ด๋ฆฌ๋ทฐ ํ‰๊ฐ€์˜ ํ‘œ์ค€ํ™”์™€ ์ฒด๊ณ„์  ๋ถ„์„์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•˜์—ฌ AI ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ ์‹œ์Šคํ…œ ๋น„๊ตํ‰๊ฐ€์˜ ๋ฐ”ํƒ•์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Leiden Manifesto์˜ ์ฑ…์ž„ ์žˆ๋Š” ๋ฌธํ—Œ๊ณ„๋Ÿ‰ํ•™ ์›์น™์„ ์ œ๊ณตํ•˜๋Š” ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
GPT ๊ธฐ๋ฐ˜ ํ”ผ์–ด๋ฆฌ๋ทฐ ์ง€์› ์‹œ์Šคํ…œ์„ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ๊ตฌํ˜„ํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI๊ฐ€ ์ƒ์„ฑํ•œ ๋ฆฌ๋ทฐ๊ฐ€ ์‹ค์ œ ํ‰๊ฐ€์— ์–ผ๋งˆ๋‚˜ ์ ํ•ฉํ•œ์ง€, ๋‹ค์–‘ํ•œ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํ†ตํ•ด ๊ฒ€์ฆํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewEval ๋…ผ๋ฌธ์€ AI ๊ธฐ๋ฐ˜ ์‹ฌ์‚ฌ ํ‰๊ฐ€์˜ ๊ณต์ •์„ฑ๊ณผ ์‹ ๋ขฐ์„ฑ ํ™•๋ณด๋ผ๋Š” ๊ด€์ ์—์„œ text-matching ์ทจ์•ฝ์  ๊ทน๋ณต์„ ์œ„ํ•œ ๋˜ ๋‹ค๋ฅธ ํ‰๊ฐ€๋ฐฉ๋ฒ•์„ ์—ฐ๊ตฌํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewEval(679)์€ AI ์ƒ์„ฑ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ํ’ˆ์งˆ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋‹ค๋ฃจ์–ด, 445์˜ ํƒ์ง€ ์ค‘์‹ฌ ํ‰๊ฐ€์™€ ์ƒํ˜ธ๋ณด์™„์ ์œผ๋กœ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๋ฐ ์ธ๊ฐ„ ๊ฐ„ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ํ’ˆ์งˆ ๋น„๊ต์™€ AI ๋ฆฌ๋ทฐ์–ด์˜ ์‹ ๋ขฐ์„ฑ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋‹ค๋ฃจ์–ด ReviewEval๊ณผ ์ƒํ˜ธ๋ณด์™„์ ์ž„.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ๋Šฅ๋ ฅ์„ ๋Œ€๊ทœ๋ชจ๋กœ ์ž๋™ ํ‰๊ฐ€ํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•˜์—ฌ, AI-์ƒ์„ฑ ๋ฆฌ๋ทฐ ํ‰๊ฐ€์™€ ๋ฐ์ดํ„ฐ์˜ ์„ค๊ณ„์  ์ฐจ์ด๋ฅผ ๋น„๊ตํ•จ.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹ค์ค‘ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์„ ํ™œ์šฉํ•œ ํ•™์ˆ  ๋ฆฌ๋ทฐ ๋ฐ ํ‰๊ฐ€์˜ ํ’ˆ์งˆ ํ–ฅ์ƒ ๋ฐฉ๋ฒ•์„ ํƒ๊ตฌํ•˜๋Š” ๊ด€๋ จ ๋…ผ๋ฌธ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewEval ๋…ผ๋ฌธ์€ AI ์ƒ์„ฑ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ์˜ ํ‰๊ฐ€ ์ฒด๊ณ„๋ฅผ ์ง‘์ค‘์ ์œผ๋กœ ๋ถ„์„ํ•˜๋ฉฐ, 654์—์„œ ์ƒ์„ฑ ๋ฐ์ดํ„ฐ์…‹์˜ ํ™œ์šฉ ๋ฐ ์„ฑ๋Šฅ ํ‰๊ฐ€ ๊ด€์ ์—์„œ ์ƒํ˜ธ ๋ณด์™„์ ์ธ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹ค์ค‘ ์—์ด์ „ํŠธ ํ† ๋ก  ์‹œ์Šคํ…œ์—์„œ ํŒ€ ๊ตฌ์„ฑ๊ณผ ๋ฆฌ๋”์‹ญ์ด ์•„์ด๋””์–ด ํ’ˆ์งˆ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ๋‹ค๋ฃฌ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewEval ๋…ผ๋ฌธ์€ AI ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ ํ’ˆ์งˆ ํ‰๊ฐ€์— ๋Œ€ํ•œ ์ ‘๊ทผ๋ฒ•๊ณผ ์ง€ํ‘œ๋ฅผ ๋น„๊ตํ•ด LAZYREVIEW ๋ฐ์ดํ„ฐ์…‹์˜ ์ ์šฉ ์˜์—ญ์„ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewEval ๋…ผ๋ฌธ์€ AI ์ƒ์„ฑ ๋ถ„์ž๊ฐ€ ์˜์•ฝํ™”ํ•™ ํ‰๊ฐ€์—์„œ ์–ด๋–ค ํ˜์‹ ์„ฑ๊ณผ ์œ ํšจ์„ฑ์„ ๊ฐ–๋Š”์ง€ ๋ฆฌ๋ทฐ ๊ธฐ๋ฐ˜์œผ๋กœ ์ •๋Ÿ‰ ํ‰๊ฐ€ํ•˜์—ฌ, ์ƒ์„ฑ๋œ ๋ถ„์ž์˜ ํ‰๊ฐ€ ๊ด€์ ์„ ๋ณด์™„ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ReviewEval ๋…ผ๋ฌธ์€ AI๊ฐ€ ์ƒ์„ฑํ•œ ๋ฆฌ๋ทฐ์˜ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, ์ •๋‹นํ™” ์ž๋™์ƒ์„ฑ ์‹œ์Šคํ…œ ๊ฒฐ๊ณผ์˜ ํ’ˆ์งˆ ๊ฒ€์ฆ์— ์ฐธ๊ณ ํ•  ๋งŒํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI ์ƒ์„ฑ ๋ฆฌ๋ทฐ ๋ฐ LLM ํ‰๊ฐ€์ง€ํ‘œ์˜ ์‹ ๋ขฐ์„ฑ ํ‰๊ฐ€๋ฅผ ํ›„์† ์—ฐ๊ตฌ๋กœ, ๋‹ค์–‘ํ•œ ํ‰๊ฐ€์ง€ํ‘œ ๋ฐ ๊ฐœ์„  ๋ฃจํ”„ ์ œ์•ˆ์ด ๋น„์Šทํ•œ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ReviewEval์€ AI ์ƒ์„ฑ ๋ฆฌ๋ทฐ์˜ ํ’ˆ์งˆ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, ์ƒ์„ฑ ๋ชจ๋ธ(์˜ˆ: OpenReviewer)์ด ์ƒ์„ฑํ•œ ์‹ฌ์‚ฌํ‰์˜ ์‹ค์ œ ํ™œ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ์ •๋Ÿ‰์ ์œผ๋กœ ๋ถ„์„ํ•˜๋Š” ๋ฐ ๋„์›€์„ ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ReviewEval ๋…ผ๋ฌธ์€ AI๋กœ ์ƒ์„ฑ๋œ ๋ฆฌ๋ทฐ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•˜์—ฌ ๋™๋ฃŒ ์‹ฌ์‚ฌ ์ž๋™ํ™”์—์„œ ๋ฆฌ๋ทฐ์˜ ์งˆ ์ธก์ •๊ณผ ํ–ฅ์ƒ์— ์ง์ ‘์ ์œผ๋กœ ์—ฐ๊ฒฐ๋œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI ์ƒ์„ฑ ๋ฆฌ๋ทฐ์˜ ํ’ˆ์งˆ์„ ๋‹ค์–‘ํ•œ ๊ด€์ ์—์„œ ํ‰๊ฐ€ํ•˜๋Š” ReviewEval ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํ†ตํ•ด ํ’ˆ์งˆ ์ •๋ ฌ๊ณผ ํŽธํ–ฅ ๊ฐ์†Œ ๊ด€๋ จ ๋…ผ์˜๋ฅผ ์‹ฌํ™”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
679๋ฒˆ์€ AI ์ƒ์„ฑ ๋ฆฌ๋ทฐ์˜ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, 677๋ฒˆ์˜ ๋‹ค์–‘ํ•œ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ๊ด€์ ์œผ๋กœ ๋น„๊ตยทํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ์ค€์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
679(ReviewEval)์€ AI ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ํ‰๊ฐ€ ์š”์†Œ ํ”„๋ ˆ์ž„์„ ํ™•์žฅํ•ด, 537์˜ ์ดˆ์  ์ˆ˜์ค€(ํฌ์ปค์Šค ๋ ˆ๋ฒจ) ํ‰๊ฐ€ ์ฒด๊ณ„๋ฅผ ๋‹ค์ฐจ์›์ ์œผ๋กœ ๊ตฌ์ฒดํ™”ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
679๋Š” AI ์ƒ์„ฑ ๋ฆฌ๋ทฐ์˜ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ฐœ๋ฐœํ•˜์—ฌ, 127์˜ ์ž๋™ ํ‰๊ฐ€์ง€ํ‘œ ์ œ์•ˆ๊ณผ ์‹œ๋„ˆ์ง€ ํšจ๊ณผ๋ฅผ ๋‚ผ ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI ๊ธฐ๋ฐ˜ ํ”ผ์–ด๋ฆฌ๋ทฐ ๊ฐ€์†ํ™” ์‹ค์ œ ์ ์šฉ ์‚ฌ๋ก€๋กœ, ReviewEval์—์„œ ์ œ์•ˆ๋œ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก ์˜ ์‹ค์งˆ์  ์ž„ํŒฉํŠธ๋ฅผ ๊ฒ€ํ† ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Peerarg๋ผ๋Š” ์‹ค์ œ ๋…ผ์ฆ ๊ธฐ๋ฐ˜ ํ”ผ์–ด๋ฆฌ๋ทฐ ์‹คํ—˜์ด ReviewEval์˜ ํ‰๊ฐ€ ์ฒด๊ณ„์™€ ๊ฒฐ๊ณผ ๋น„๊ต๋ฅผ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AI ๋ฆฌ๋ทฐ์–ด ์‹œ์Šคํ…œ ๋ฐ peer review ๋™์  ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ์‹ค์ œ MT ๋ฐ์ดํ„ฐ์™€ ํ•ฉ์ณ์งˆ ๊ฐ€๋Šฅ์„ฑ์ด ํฝ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
ReviewEval์€ AI-์ƒ์„ฑ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ์˜ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•˜๋ฏ€๋กœ, ReviewAgents์™€ ์‹ค์ œ ํ™œ์šฉ ์ธก๋ฉด์ด ์—ฐ๊ฒฐ๋œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •