ReviewAgents: Bridging the Gap Between Human and AI-Generated Paper Reviews

์ €์ž: Xiaojin Gao, Jiacheng Ruan, Zongyun Zhang, Jingsheng Gao, Ting Liu, Yuzhuo Fu | ๋‚ ์งœ: 2025 | ๊ธฐ๊ด€: Shanghai Jiao Tong University 📄 PDF


Essence

๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์„ ํ™œ์šฉํ•˜์—ฌ ํ•™์ˆ  ๋…ผ๋ฌธ ์‹ฌ์‚ฌ๋ฅผ ์ž๋™ํ™”ํ•˜๋˜, ์ธ๊ฐ„ ์‹ฌ์‚ฌ์ž์˜ ๋‹ค๋‹จ๊ณ„ ์ถ”๋ก  ๊ณผ์ •์„ ๋ชจ๋ฐฉํ•œ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ๊ตฌ์กฐํ™”๋œ ์‚ฌ๊ณ (Chain-of-Thought) ๋ฐฉ์‹๊ณผ ๊ด€๋ จ ๋…ผ๋ฌธ ์ธ์‹(relevant-paper-aware) ํ•™์Šต์„ ํ†ตํ•ด AI ์ƒ์„ฑ ์‹ฌ์‚ฌ์˜ ํ’ˆ์งˆ์„ ์ธ๊ฐ„ ์‹ฌ์‚ฌ์— ๊ฐ€๊น๊ฒŒ ํ–ฅ์ƒ์‹œํ‚จ๋‹ค.

Motivation

Achievement

  1. Review-CoT ๋ฐ์ดํ„ฐ์…‹: ICLR(2017-2024), NeurIPS(2016-2024)์˜ 37,403๊ฐœ ๋…ผ๋ฌธ๊ณผ 142,324๊ฐœ ์‹ฌ์‚ฌ ์˜๊ฒฌ์„ ๊ตฌ์กฐํ™”๋œ ํ˜•์‹์œผ๋กœ ์ •์ œ. ์ œ์ถœ ์‹œ์ ๊นŒ์ง€์˜ ์ตœ์‹  ๊ด€๋ จ ๋…ผ๋ฌธ ์ •๋ณด๋ฅผ ํฌํ•จํ•œ ์ตœ์ดˆ์˜ ๋Œ€๊ทœ๋ชจ ๊ตฌ์กฐํ™” ์‹ฌ์‚ฌ ๋ฐ์ดํ„ฐ์…‹
  2. ReviewAgents ํ”„๋ ˆ์ž„์›Œํฌ: ์„ธ ๋‹จ๊ณ„ ๊ตฌ์กฐํ™” ์ถ”๋ก (์š”์•ฝโ†’๋ถ„์„โ†’๊ฒฐ๋ก )์„ ๊ฑฐ์ณ ์ธ๊ฐ„ ์‹ฌ์‚ฌ์ž์˜ ์ธ์ง€ ๊ณผ์ •์„ ๋ชจ๋ฐฉํ•˜๋Š” ๋‹ค์ค‘ ์—ญํ• , ๋‹ค์ค‘ ์—์ด์ „ํŠธ ์‹ฌ์‚ฌ ์‹œ์Šคํ…œ. ๊ธฐ์กด LLM ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ• ๋Œ€๋น„ ์ธ๊ฐ„ ์‹ฌ์‚ฌ์™€์˜ ์ •๋ ฌ๋„(alignment) ํ–ฅ์ƒ
  3. ReviewBench ๋ฒค์น˜๋งˆํฌ: LLM ์ƒ์„ฑ ์‹ฌ์‚ฌ ์˜๊ฒฌ์˜ ํ’ˆ์งˆ์„ 4๊ฐœ ์ฐจ์›์—์„œ ์ •๋Ÿ‰์ ์œผ๋กœ ํ‰๊ฐ€ํ•˜๋Š” ์ „๋ฌธ ๋ฒค์น˜๋งˆํฌ. ์ตœ์‹  ์‹ฌ์‚ฌ ๋ฐ์ดํ„ฐ๋กœ ๊ตฌ์„ฑํ•˜์—ฌ ๊ธฐ์กด LLM ์‚ฌ์ „ํ•™์Šต ๋ฐ์ดํ„ฐ ์˜ค์—ผ ๋ฌธ์ œ ํšŒํ”ผ

How

Figure 1

Figure 1: ์‚ฌ์ „ ์ •์˜๋œ ๊ตฌ์กฐํ™” ์‚ฌ๊ณ  ๊ณผ์ •์— ๋”ฐ๋ฅธ ์‹ฌ์‚ฌ ์˜๊ฒฌ ๋ณ€ํ™˜ ํ”„๋กœ์„ธ์Šค (์š”์•ฝโ†’๋ถ„์„โ†’๊ฒฐ๋ก )

๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•

ReviewAgents ํ”„๋ ˆ์ž„์›Œํฌ

ํ•™์Šต ๋ฐ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ์ธ๊ฐ„ ์‹ฌ์‚ฌ์ž์˜ ๊ตฌ์กฐํ™”๋œ ์‚ฌ๊ณ  ๊ณผ์ •์„ ์ฒด๊ณ„์ ์œผ๋กœ ๋ชจ๋ฐฉํ•œ ์ฒซ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹๊ณผ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ AI ์‹ฌ์‚ฌ์˜ ํ˜„์‹คํ™” ๊ฐ€๋Šฅ์„ฑ์„ ๋†’์˜€๋‹ค. ๋‹ค๋งŒ, ๋ฐ์ดํ„ฐ ์‹œ๊ฐ„์„ฑ ๋ฌธ์ œ, ํ‰๊ฐ€ ์ง€ํ‘œ์˜ ํ•œ๊ณ„, ์‹ค์ œ ์‹ฌ์‚ฌ ์ œ๋„ ๋„์ž… ์‹œ ์œค๋ฆฌ์ ยท์ œ๋„์  ๊ณผ์ œ์— ๋Œ€ํ•œ ๋ณด์ถฉ ๋…ผ์˜๊ฐ€ ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
070 ๋…ผ๋ฌธ์€ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ์‹คํ—˜์„ ํ†ตํ•ด ์—์ด์ „ํŠธ ํ˜‘์—… ๋ชจ๋ธ์˜ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋ฏ€๋กœ 676์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜๊ณผ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Dolphin ๋…ผ๋ฌธ์€ ์ž๋™ํ™”๋œ AI ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ํ‰๊ฐ€ ๋ฐ ๋ฆฌ๋ทฐ ํ”„๋กœ์„ธ์Šค์˜ ๊ธฐ์ดˆ ๊ฐœ๋…๊ณผ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋””์ž์ธ์„ ์ œ๊ณตํ•˜์—ฌ 676 ์‹คํ˜„ ๋ฐฉ์•ˆ์— ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
676 'ReviewAgents' ๋…ผ๋ฌธ์€ ์ธ๊ฐ„/AI ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๊ฒฉ์ฐจ์™€ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ํšจ๊ณผ๋ฅผ ๋ถ„์„ํ•ด 350 FRAME์˜ ์„ค๊ณ„์™€ ํ‰๊ฐ€์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‘ ์—ฐ๊ตฌ ๋ชจ๋‘ ํ…์ŠคํŠธ ์ƒ์„ฑ ๋˜๋Š” ์ˆ˜์ • ์ž‘์—…์—์„œ ์ž์—ฐ์–ด์ฒ˜๋ฆฌ ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•˜์ง€๋งŒ ์ ‘๊ทผ ๋ฐฉ์‹์ด ๋‹ค๋ฅด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewAgents(676)๋Š” AI ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ์ƒ์„ฑยทํ‰๊ฐ€ ์‹œ์Šคํ…œ์œผ๋กœ, SciReviewGen(732)์˜ ์ž๋™ํ™”๋œ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฒค์น˜๋งˆํฌ์™€ ์‹ค์งˆ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewAgents ๋…ผ๋ฌธ์€ ์ธ๊ฐ„-AI ๊ฐ„ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ํŽธ์ฐจ๋ฅผ ๋‹ค๋ฃจ๋ฉฐ ๋‹ค์–‘ํ•œ ๋‹ค์ค‘๋ฌธ์„œ ์š”์•ฝ ๋ฐ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ ํ•™์ˆ  ๋…ผ๋ฌธ ํ‰๊ฐ€ ๋ฐ ๋ฆฌ๋ทฐ ์ง€์›์„ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ์ ‘๊ทผํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
676 ๋…ผ๋ฌธ์€ AI์™€ ์ธ๊ฐ„ ๋ฆฌ๋ทฐ์–ด ์‚ฌ์ด์˜ ์ฐจ์ด๋ฅผ ์ง‘์ค‘ ๋ถ„์„ํ•ด, 250์˜ ์ž๋™ํ™”๋œ ๋…ผ๋ฌธ ์ž‘์„ฑ-๋ฆฌ๋ทฐ ์‚ฌ์ดํด์˜ ์ธ๊ฐ„ ๋Œ€์ฒด ๊ฐ€๋Šฅ์„ฑ๊ณผ ํ•œ๊ณ„๋ฅผ ๋Œ€์กฐํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
676์€ AI ๋ฆฌ๋ทฐ์™€ ์ธ๊ฐ„ ๋ฆฌ๋ทฐ๋ฅผ ๋น„๊ต ๋ถ„์„ํ•˜๋ฉฐ, 126์˜ ์ „์ž๋™ํ™” ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ๊ณผ ์ƒํ˜ธ๋ณด์™„์ ์œผ๋กœ ์ฝํž ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ ์žฅ๋ฌธ ๊ธฐ์‚ฌ ์ƒ์„ฑ์˜ ๋Œ€์•ˆ์  ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ธ๊ฐ„-LLM ์ƒ์„ฑ ๋ฆฌ๋ทฐ ๊ฐ„ ์ฐจ์ด ๋ถ„์„์œผ๋กœ, ๋‹ค์ค‘ํ„ด, ๋กฑ์ปจํ…์ŠคํŠธ ๊ธฐ๋ฐ˜ ์‹ค์ œ ๋Œ€ํ™”์‹ ๋ฆฌ๋ทฐ์˜ ํ’ˆ์งˆ ๋ฐ ๊ฐœ์„ ์  ํŒŒ์•…์— ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
676๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜์˜ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ์ตœ์ ํ™” ๋ฐฉ๋ฒ•์„ ํƒ๊ตฌํ•˜์—ฌ, ์ž๋™ ๋…ผ๋ฌธ ๊ด€๋ จ์„ฑ ํ‰๊ฐ€(664)์™€ ๋™์ผํ•œ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ์ ‘๊ทผํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewAgents ๋…ผ๋ฌธ์€ AI ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ์™€ ์ธ๊ฐ„ ๊ฐ„์˜ ์ •๋ ฌ/๊ฒฉ์ฐจ๋ฅผ ๋ถ„์„ํ•˜๋ฉฐ, ๋Œ€๊ทœ๋ชจ ์ž๋™ ๋ฆฌ๋ทฐ ์‹œ์Šคํ…œ์˜ ํ‰๊ฐ€ ๊ด€์ ์„ ๋‹ค๋ฅด๊ฒŒ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewAgents๋Š” ํ”„๋กฌํ”„ํŠธ ์ตœ์ ํ™” ๋Œ€์‹  ์ธ๊ฐ„ ๋ฆฌ๋ทฐ์™€ AI ์ž‘์„ฑ ๋ฆฌ๋ทฐ์˜ ์ฐจ๋ณ„์„ฑ ๋ฐ ํ‰๊ฐ€์— ์ดˆ์ ์„ ๋‘ก๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
262 ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ์—์„œ ์ธ๊ฐ„๊ณผ ์œ ์‚ฌํ•œ ์‹ฌ์‚ฌ ์ƒ์„ฑ ๋ฐฉ๋ฒ•์„ ํƒ๊ตฌํ•˜๋ฉฐ, 676๊ณผ ์œ ์‚ฌํ•œ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅธ ์ ‘๊ทผ์œผ๋กœ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
665๋ฒˆ์€ ๊ฐ•ํ™”ํ•™์Šต๊ณผ ์ถ”๊ฐ€ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๊ฒฐํ•ฉํ•œ AI ๋…ผ๋ฌธ ์‹ฌ์‚ฌ ์ž๋™ํ™” ์—ฐ๊ตฌ๋กœ 676๋ฒˆ๊ณผ ๋ฌธ์ œ์˜์‹์€ ๊ฐ™์œผ๋‚˜ ์ ‘๊ทผ๋ฒ•์ด ๋‹ค๋ฅด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๋ฐ ์ธ๊ฐ„ ๊ฐ„ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ํ’ˆ์งˆ ๋น„๊ต์™€ AI ๋ฆฌ๋ทฐ์–ด์˜ ์‹ ๋ขฐ์„ฑ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋‹ค๋ฃจ์–ด ReviewEval๊ณผ ์ƒํ˜ธ๋ณด์™„์ ์ž„.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ํ•™์ˆ  ๋…ผ๋ฌธ ๋ถ„์„ ๋ฐ ์ •๋ณด ์ถ”์ถœ์„ ๋‹ค๋ฅธ ๋งฅ๋ฝ์—์„œ ์ ์šฉํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ•™์ˆ  ๋ฌธ์„œ ์ž๋™ ์ƒ์„ฑ์„ ์œ„ํ•œ ๋‹ค๋ฅธ LLM ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI์˜ ๊ณผํ•™์  ์ถ”๋ก  ๋ฐ ์—ฐ๊ตฌ ์ง€์› ๋Šฅ๋ ฅ์„ ๋‹ค๋ฅธ ์ธก๋ฉด์—์„œ ํ‰๊ฐ€ํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewAgents๋Š” LLM์ด ์ œ์•ˆ๋œ ์—ฐ๊ตฌ ์•„์ด๋””์–ด์˜ ์‹ค์งˆ์  ๊ฐ€๋Šฅ์„ฑยทํ’ˆ์งˆ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋ฐ ์ดˆ์ ์„ ๋งž์ถ”์–ด, AI ๊ธฐ๋ฐ˜ ์‹ฌ์‚ฌยท๋ฏธ๋ž˜ ์˜ˆ์ธก ํ‰๊ฐ€ ์ ‘๊ทผ๋ฒ•์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewAgents ๋…ผ๋ฌธ์€ ์ธ๊ฐ„ยทAI ๋ฆฌ๋ทฐ์–ด ํ˜‘๋ ฅ ๊ตฌ์กฐ๋ฅผ ์‹คํ—˜ ๋ฐ์ดํ„ฐ๋กœ ๋ถ„์„ํ•˜์—ฌ, ๋…ผ๋ฌธ ๋„๊ตฌ ๊ฐœ๋ฐœ ๋ฐ ์‹ค๋ฌด ์‘์šฉ ๋ฉด์—์„œ ์ƒํ˜ธ๋ณด์™„๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ ํ•™์ˆ ์  ํ…์ŠคํŠธ ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ ํ‰๊ฐ€๋ผ๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ ๋ชฉ์ ์„ ๊ณต์œ ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ์˜ ์—ฐ๊ตฌ ์ž‘์—… ์ˆ˜ํ–‰ ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋Œ€์•ˆ์  ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AIยท์ธ๊ฐ„ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐ ๋น„๊ต ํ‰๊ฐ€์—์„œ ์นดํƒˆ๋กœ๊ทธ ๊ตฌ์กฐ ๋ถ„์„ ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ์˜ ์‹ค์ œ์  ๋ฒค์น˜๋งˆํฌ ์‚ฌ๋ก€๋กœ ์ ์šฉ๋œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Peer review์˜ AI/์ธ๊ฐ„ ํ˜‘์—… ์‚ฌ๋ก€๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ดˆ์•ˆ ์ž‘์„ฑ ๋‹จ๊ณ„์—์„œ LLM์˜ ์—ญํ•  ํ™•์žฅ ์ ์„ ์‹ค์ฆ์ ์œผ๋กœ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ReviewAgents ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ ์ž๋™ ์ƒ์„ฑ๊ณผ ํ”„๋กœ์„ธ์Šค ์ตœ์ ํ™”๋ฅผ ์‹ฌํ™” ๋ถ„์„ํ•˜์—ฌ, ๋ฆฌ๋ทฐ ํ”ผ๋“œ๋ฐฑ ์ƒ์„ฑ์˜ ๋ฐ˜๋ณต ํ•™์Šต ์ฒด๊ณ„์™€ ์ง์ ‘์ ์œผ๋กœ ์ด์–ด์ง‘๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
676๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์ž๋™ ๋ฆฌ๋ทฐ์™€ ์ธ๊ฐ„๊ฐ„ gap์„ ๋ถ„์„ํ•ด, 776๋ฒˆ ๋…ผ๋ฌธ์˜ annotation ์ง€์› ์ „๋žต์˜ ๊ฒ€์ฆ ๋ฐ ํ•œ๊ณ„ ๋…ผ์˜์— ์‹ค์งˆ์  ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ReviewAgents ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์ถ”๋ก  ์—์ด์ „ํŠธ์˜ ํ‰๊ฐ€์™€ ํ•œ๊ณ„์ ์„ ๋ถ„์„ํ•˜์—ฌ ์‹ค์ œ ์ด‰๋งค ๋ฐœ๊ฒฌ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•์— ์ธ์‚ฌ์ดํŠธ๋ฅผ ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI/LLM์ด ์ƒ์„ฑํ•œ ๊ณผํ•™ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ์˜ ๊ฐ•์ , ํ•œ๊ณ„, ์ธ๊ฐ„๊ณผ ๋น„๊ต ์„ฑ๋Šฅ์„ ์‹ค์ œ ๋ฐ์ดํ„ฐ์™€ ํ•จ๊ป˜ ๋ถ„์„ํ•ด NLP ๊ธฐ๋ฐ˜ ๋™๋ฃŒ์‹ฌ์‚ฌ ์ง€์›์˜ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ๋” ๊นŠ๊ฒŒ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ReviewAgents๋Š” AI ๋ฆฌ๋ทฐ๊ฐ€ ์ธ๊ฐ„ ๋ฆฌ๋ทฐ์–ด์™€ ์œ ์‚ฌํ•œ ์ค‘์š”ํ•œ ๋ฌธ์ œ๋ฅผ ํฌ์ฐฉํ•˜๋Š”์ง€ ๋ถ„์„ํ•ด, LLM ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์‹ค์ œ ์‘์šฉ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
676๋ฒˆ ๋…ผ๋ฌธ์€ AI์™€ ์ธ๊ฐ„ ๋ฆฌ๋ทฐ์˜ ๊ฐ„๊ทน์„ ์ขํžˆ๋Š” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜์—ฌ, 481๋ฒˆ ๊ฒŒ์œผ๋ฅธ ์‚ฌ๊ณ  ํƒ์ง€ ๋ฐ์ดํ„ฐ์…‹๊ณผ ์—ฐ๊ณ„ํ•ด ์‹ค์ œ ๋ฆฌ๋ทฐ ํ’ˆ์งˆ ๊ฐœ์„ ์— ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI-Human ๋ฆฌ๋ทฐ์–ด ํ˜‘๋ ฅ์— ์งˆ๋ฌธ ๊ตฌ์กฐ, ํ† ํฐ ํšจ์œจ์„ฑ ๋“ฑ TreeReview์˜ ์‹ค์ œ ํ™œ์šฉ ๋ฐฉ์•ˆ์„ ์‹คํ—˜์ ์œผ๋กœ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
676๋ฒˆ ๋…ผ๋ฌธ์€ ์ธ๊ฐ„๊ณผ AI๊ฐ„ ๋ฆฌ๋ทฐ ์ƒ์„ฑ์˜ gap์„ ์—ฐ๊ฒฐํ•˜๋ฉฐ, LLM ๊ธฐ๋ฐ˜ ๊ฒ€์ฆ ์‹œ์Šคํ…œ์˜ ๊ฐœ์„  ๋ฐฉํ–ฅ ๋…ผ์˜์— 328๋ฒˆ ๋…ผ๋ฌธ ๋‚ด์šฉ์„ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
676์€ ์ธ๊ฐ„๊ณผ AI ์ƒ์„ฑ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ์˜ ๊ฒฉ์ฐจ๋ฅผ ํ•ด์†Œํ•˜๋ ค๋Š” ํ”„๋กฌํ”„ํŠธ ๋ฐ ํŒŒ์ดํ”„๋ผ์ธ ๊ฐœ์„  ๋ฐฉ์•ˆ์„ ์ œ์•ˆํ•˜์—ฌ, 244์˜ ํ•œ๊ณ„ ๋ถ„์„ ํ›„์†์—ฐ๊ตฌ์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI๊ฐ€ ๋™๋ฃŒํ‰๊ฐ€์— ์‹ค์ œ ์–ด๋–ป๊ฒŒ ํ™œ์šฉ๋˜๊ณ  ํ‰๊ฐ€ ์ฐจ์ด๊ฐ€ ๋ฐœ์ƒํ•˜๋Š”์ง€ ๊ตฌ์ฒด์ ์ธ ๋ฒค์น˜๋งˆํฌ์™€ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
676 ๋…ผ๋ฌธ์€ ์ธ๊ฐ„๊ณผ AI ์ƒ์„ฑ ๋ฆฌ๋ทฐ์˜ ํ’ˆ์งˆ ์ฐจ์ด ๋ฐ ๋ฒค์น˜๋งˆํ‚น์„ ๋‹ค๋ฃจ๋ฏ€๋กœ, 3035์˜ ์‹ค์ œ ํšจ์šฉ์„ฑ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ์™€ ์ ‘๋ชฉํ•˜์—ฌ ๋ณผ ์ˆ˜ ์žˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AI ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ์ถ”์ฒœ, ๊ฐœ๋… ๋งํฌ, ๋ฏธ๋ž˜ ์—ฐ๊ตฌ์˜ˆ์ธก ๋“ฑ '๋ฏธ๋ž˜ ๋ฐฉํ–ฅ์„ฑ ์˜ˆ์ธก'์˜ ์‹ค์ œ ์—ฐ๊ตฌ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ตฌ์ฒด์ ์œผ๋กœ ๋ณด์—ฌ์ค€๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
ReviewEval์€ AI-์ƒ์„ฑ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ์˜ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•˜๋ฏ€๋กœ, ReviewAgents์™€ ์‹ค์ œ ํ™œ์šฉ ์ธก๋ฉด์ด ์—ฐ๊ฒฐ๋œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AI ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ์™€ ์ธ๊ฐ„ ๋ฆฌ๋ทฐ์˜ ์ฐจ์ด๋ฅผ ๋ฒค์น˜๋งˆํ‚นํ•˜๋Š” ๋…ผ๋ฌธ์œผ๋กœ, ์ผ๊ด€์„ฑ ์žˆ๋Š” ํ”ผ์–ด๋ฆฌ๋ทฐ ๋ฐ์ดํ„ฐ์˜ ์‹ค์ œ์  ํ™œ์šฉ ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
What factors affect multimodal in-context learning? ๋…ผ๋ฌธ์€ ๋‹ค์–‘ํ•œ ์š”์†Œ๊ฐ€ LLM ํ‰๊ฐ€์— ์˜ํ–ฅ์„ ์ฃผ๋Š” ์ ์„ ๋น„ํŒ์ ์œผ๋กœ ์กฐ๋ช…ํ•œ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
084๋Š” AI ๊ธฐ๋ฐ˜ ๋™๋ฃŒํ‰๊ฐ€์˜ ์œ„ํ—˜์„ฑ์„ ์ง€์ ํ•˜๋ฉฐ 676์˜ ์ž๋™ํ™”๋œ ๋ฆฌ๋ทฐ ์‹œ์Šคํ…œ ๋ฐœ์ „์— ๋Œ€ํ•œ ์ œ์•ฝ์ ๊ณผ ์ƒํ˜ธ๋ณด์™„์  ์‹œ๊ฐ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •