Streamlining the review process: AI-generated annotations in research manuscripts

์ €์ž: ร“scar Dรญaz, Xabier Garmendia, Juanan Pereira | ๋‚ ์งœ: 2024 | DOI: DOI ๋ฏธ์ œ๊ณต 📄 PDF


Essence

Figure 1

Fig. 1: ๋ฆฌ๋ทฐ ๋ณด๊ณ ์„œ ๋ฐ ๊ทธ UML ๊ฐœ๋…ํ™”

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์„ ํ•™์ˆ  ๋…ผ๋ฌธ ์‹ฌ์‚ฌ ๊ณผ์ •์— ํ†ตํ•ฉํ•˜๋˜, AI๊ฐ€ ์ „์ฒด ์‹ฌ์‚ฌ๋ฅผ ๋Œ€์ฒดํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ manuscript annotation(์›๊ณ  ์ฃผ์„ ๋‹ฌ๊ธฐ)์ด๋ผ๋Š” ํŠน์ • ์ž‘์—…์„ ์ง€์›ํ•˜๋Š” ๋ฐฉ์‹์„ ์ œ์•ˆํ•œ๋‹ค. AnnotateGPT ํ”Œ๋žซํผ์„ ํ†ตํ•ด AI์™€ ์ธ๊ฐ„ ์‹ฌ์‚ฌ์ž์˜ ํ˜‘๋ ฅ์„ ์œ„ํ•œ ์ค‘๊ฐ„์ง€์ ์œผ๋กœ์„œ annotation์˜ ์—ญํ• ์„ ๊ฒ€์ฆํ•œ๋‹ค.

Motivation

Achievement

Figure 2

Fig. 2: Annotation ์ƒ์„ฑ ํ”„๋กœ์„ธ์Šค

Figure 3

Fig. 3: Annotation ์ค‘์‹ฌ ํ”„๋กฌํ”„ํŒ…

  1. Annotation ๊ธฐ๋ฐ˜ AI-์ธ๊ฐ„ ํ˜‘๋ ฅ ๋ชจ๋ธ ์ œ์‹œ: ๊ธฐ์กด '์ž๋™ํ™”(AI for automation)' ํŒจ๋Ÿฌ๋‹ค์ž„์—์„œ ๋ฒ—์–ด๋‚˜ '๋ณด๊ฐ•(AI for augmentation)' ์ ‘๊ทผ๋ฐฉ์‹์„ ๊ตฌํ˜„. ์ด๋Š” ์‹ฌ์‚ฌ์ž๊ฐ€ ์›๊ณ ๋ฅผ ์ฝ๊ธฐ ์ „์— LLM์ด ์ƒ์„ฑํ•œ annotation์„ ํ†ตํ•ด ์ค‘์š” ๋ถ€๋ถ„์„ ๋ฏธ๋ฆฌ ํŒŒ์•…ํ•˜๊ฒŒ ํ•จ.
  2. AnnotateGPT ํ”Œ๋žซํผ ๊ฐœ๋ฐœ: GPT-4๋ฅผ ํ™œ์šฉํ•œ ์ „์šฉ manuscript review ํ”Œ๋žซํผ์„ ๊ตฌํ˜„ํ•˜์—ฌ proof-of-concept ์ œ๊ณต. ์‹ฌ์‚ฌ ๊ธฐ์ค€๋ณ„๋กœ color-coding๋œ annotation์„ ์ง€์›ํ•˜์—ฌ ๋งฅ๋ฝํ™”(contextualization)๋ฅผ ๊ตฌํ˜„.
  3. ๊ตฌ์กฐํ™”๋œ ์‹ฌ์‚ฌ ํ”„๋ ˆ์ž„์›Œํฌ: Review โ†’ CriterionReview โ†’ Annotation์˜ ๊ณ„์ธต์  ๊ตฌ์กฐ๋ฅผ UML๋กœ ์ •์˜ํ•˜์—ฌ, ๊ตฌ์ฒด์„ฑ(specificity), ๋งฅ๋ฝํ™”(contextualization), ์‹œ์˜์„ฑ(timeliness)์„ ๋งŒ์กฑํ•˜๋Š” ์‹ฌ์‚ฌ ๊ตฌ์กฐ๋ฅผ ์ œ์•ˆ.

How

Figure 4

Fig. 4: CriterionReview๋ฅผ ์œ„ํ•œ ๋‹ค์–‘ํ•œ ๊ด€์ 

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ํ•™์ˆ  ์‹ฌ์‚ฌ์—์„œ LLM์„ ๋ณด๊ฐ•(augmentation) ๋„๊ตฌ๋กœ ํ™œ์šฉํ•˜๋Š” ์ƒˆ๋กœ์šด ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์ œ์‹œํ•˜๊ณ , annotation์„ ์ค‘์‹ฌ์œผ๋กœ AI-์ธ๊ฐ„ ํ˜‘๋ ฅ์˜ ์„ค๊ณ„๋ฅผ ์ฒด๊ณ„ํ™”ํ•œ ์ ์€ ์˜๋ฏธ ์žˆ์œผ๋‚˜, ์†Œ๊ทœ๋ชจ ์‚ฌ์šฉ์ž ํ‰๊ฐ€(n=9)์™€ ์ œํ•œ๋œ ๊ธฐ์ˆ  ๊ฒ€์ฆ์œผ๋กœ ์ธํ•ด ํ•™์ˆ ์  ์ž„ํŒฉํŠธ์™€ ์‹ค์šฉ์„ฑ ์ž…์ฆ์ด ๋ฏธํกํ•œ ์ƒํƒœ.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
1087์€ GPT-4๊ฐ€ ํ”ผ์–ด๋ฆฌ๋ทฐ ๊ณผ์ •์—์„œ ์‹ค์ œ๋กœ ์–ผ๋งˆ๋‚˜ ๋„์›€์ด ๋˜๋Š”์ง€ ์ •๋Ÿ‰์ ์œผ๋กœ ๊ฒ€ํ† ํ•ด 776์—์„œ AI ์ง€์› ๋ฆฌ๋ทฐ ์ฃผ์„ ์‹œ์Šคํ…œ์˜ ๊ทผ๊ฑฐ์ž๋ฃŒ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
NLP ๊ด€์ ์—์„œ ํ”ผ์–ด ๋ฆฌ๋ทฐ ํ”„๋กœ์„ธ์Šค์— LLM์„ ํ™œ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ• ๋ฐ ๊ทธ ํ•œ๊ณ„๋ฅผ ๋ถ„์„ํ•ด AnnotateGPT์˜ ์˜์˜๋ฅผ ๋’ท๋ฐ›์นจํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
776๋ฒˆ ๋…ผ๋ฌธ์˜ AI ๊ธฐ๋ฐ˜ ์›๊ณ  ์‹ฌ์‚ฌ๊ณผ์ • ๋ณด์กฐ ์—ญํ• ์€ 445๋ฒˆ ๋…ผ๋ฌธ์—์„œ ์ œ์‹œ๋œ LLM ์‹ฌ์‚ฌ ์—ฌ๋ถ€ ํŒ๋ณ„๊ณผ ํˆฌ๋ช…์„ฑ ๋…ผ์˜์— ์ด๋ก ์  ๊ทผ๊ฑฐ๋ฅผ ๋‘๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Streamlining the review process ๋…ผ๋ฌธ์€ AI ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ ์‹œ์Šคํ…œ์˜ ์‹ค์ œ ๋ฐ์ดํ„ฐ ํ™œ์šฉ๋ฒ•๊ณผ ๋ฉ”ํƒ€-๋ฆฌ๋ทฐ ์ƒ์„ฑ์„ ๋‹ค๋ฅธ ์ ‘๊ทผ ๋ฐฉ์‹์œผ๋กœ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ํ”ผ์–ด๋ฆฌ๋ทฐ ํ’ˆ์งˆ ํ‰๊ฐ€๋ฅผ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ์ˆ˜ํ–‰ํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
609์™€ ๋‹ฌ๋ฆฌ 776์€ LLM์ด ์ „์ฒด ์‹ฌ์‚ฌ๋ฅผ ๋Œ€์‹ ํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ์›๊ณ  ์ฃผ์„์— ํŠนํ™”๋œ ๋ฐฉ์‹์œผ๋กœ ํ”ผ์–ด๋ฆฌ๋ทฐ ๋ณด์กฐ๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
776 ๋…ผ๋ฌธ์€ AI ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ์ž๋™ํ™” ๋ฐฉ๋ฒ•์„ ๋‹ค๋ฃจ๋ฉฐ, SciCode(712)์™€ ํ•จ๊ป˜ AI๊ฐ€ ์‹ค์ œ ์—ฐ๊ตฌยท๋ฆฌ๋ทฐ ์—…๋ฌด๋ฅผ ์–ด๋–ป๊ฒŒ ์ง€์›ํ•˜๋Š”์ง€ ๋น„๊ต ๋ถ„์„์— ์ ํ•ฉํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋™๋ฃŒํ‰๊ฐ€ ๊ณผ์ •์—์„œ AI ์‚ฌ์šฉ์˜ ์šฐ๋ ค์™€ ์œค๋ฆฌ์  ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ๊ด€์ ์˜ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
776์€ AI๊ฐ€ ๋…ผ๋ฌธ ๋™๋ฃŒํ‰๊ฐ€์—์„œ ์ž๋™ ํ‰๊ฐ€ ๋ฐ ์ฃผ์„ ์ƒ์„ฑ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ์‹ค์ฆ์ ์œผ๋กœ ํ™•์ธํ•˜๋ฉฐ, 809์˜ AI ๊ธฐ๋ฐ˜ ๋น ๋ฅธ ์‹ฌ์‚ฌ ์›Œํฌํ”Œ๋กœ์šฐ์— ๋Œ€ํ•œ ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋ฆฌ๋ทฐ์–ด ๊ฐ„ ์˜๊ฒฌ ๋ถˆ์ผ์น˜ ํƒ์ง€ ๊ธฐ์ˆ  ์—ฐ๊ตฌ๋กœ, LLM ๊ธฐ๋ฐ˜ ์ฃผ์„ ์ƒ์„ฑ ๋ฐ ์ธ๊ฐ„ ํ˜‘์—…์˜ ๋ณด์™„ ์ˆ˜๋‹จ์— ์‘์šฉ ๊ฐ€๋Šฅํ•˜๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ ์ฃผ์„ ์ž๋™ํ™” ์—ฐ๊ตฌ๋กœ, ๋™์ผํ•œ ํ•™์ˆ  peer review ํ”„๋กœ์„ธ์Šค ํšจ์œจํ™”์˜ ์‹ค์ œ์  ํ™•์žฅ์ ์„ ๋ณด์—ฌ์คŒ.
ํ›„์† ์—ฐ๊ตฌ
608์€ ํ”ผ์–ด๋ฆฌ๋ทฐ ๊ณผ์ •์„ ๋‹ค์ค‘ ๋ผ์šด๋“œยท์žฅ๋ฌธ ๋งฅ๋ฝ ๋Œ€ํ™”๋กœ ํŒŒ์•…ํ•˜์—ฌ 776์ด ์ œ์•ˆํ•œ annotation ๊ธฐ๋ฐ˜ ํ˜‘์—…์„ ์‹ฌํ™”ยทํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
676๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์ž๋™ ๋ฆฌ๋ทฐ์™€ ์ธ๊ฐ„๊ฐ„ gap์„ ๋ถ„์„ํ•ด, 776๋ฒˆ ๋…ผ๋ฌธ์˜ annotation ์ง€์› ์ „๋žต์˜ ๊ฒ€์ฆ ๋ฐ ํ•œ๊ณ„ ๋…ผ์˜์— ์‹ค์งˆ์  ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Streamlining the review process ๋…ผ๋ฌธ์€ AI ๊ธฐ๋ฐ˜์˜ ์ฃผ์„ ์ž๋™ ์ƒ์„ฑ์œผ๋กœ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ํšจ์œจํ™” ๊ด€๋ จ TreeReview์˜ ์‹ค์ „ ํ™•์žฅ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค€๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
776๋ฒˆ ๋…ผ๋ฌธ์€ LLM์ด ๋…ผ๋ฌธ ์‹ฌ์‚ฌ์—์„œ annotation ์ž‘์—…์„ ์–ด๋–ป๊ฒŒ ์ง€์›ํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ์ œ์•ˆํ•˜์—ฌ, 244๋ฒˆ ๋…ผ๋ฌธ์˜ ์ž„์ƒ ๋ฆฌ๋ทฐ ์ž๋™ ์ƒ์„ฑ ์ฃผ์ œ๋ฅผ ์‹ค์งˆ์ ์œผ๋กœ ํ™•์žฅํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AI๋ฅผ ํ™œ์šฉํ•œ ๋ฆฌ๋ทฐ ํ”„๋กœ์„ธ์Šค ๊ฐœ์„  ๋ฐ ์ž๋™ ์ฃผ์„ ์ƒ์„ฑ์„ ์‹œ๋„ํ•จ์œผ๋กœ์จ, 534์˜ ์ฒดํฌ๋ฆฌ์ŠคํŠธ ๊ธฐ๋ฐ˜ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ์ด ์‹ค๋ฌด์— ์–ด๋–ป๊ฒŒ ์ ์šฉ๋  ์ˆ˜ ์žˆ๋Š”์ง€ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •