Read, Revise, Repeat: A System Demonstration for Human-in-the-Loop Iterative Text Revision

์ €์ž: Wanyu Du, Zae Myung Kim, Vipul Raheja, Dhruv Kumar, Dongyeop Kang | ๋‚ ์งœ: 2022 | DOI: N/A 📄 PDF


Essence

Figure 1

R3 ์‹œ์Šคํ…œ์˜ ์ธ๊ฐ„-๊ธฐ๊ณ„ ํ˜‘๋ ฅ์  ๋ฐ˜๋ณต ํ…์ŠคํŠธ ๊ฐœ์ • ํŒŒ์ดํ”„๋ผ์ธ

๋ณธ ๋…ผ๋ฌธ์€ ์ธ๊ฐ„ ํ”ผ๋“œ๋ฐฑ์„ ํ†ตํ•ฉํ•œ ๋ฐ˜๋ณต์  ํ…์ŠคํŠธ ๊ฐœ์ • ์‹œ์Šคํ…œ R3(Read, Revise, Repeat)์„ ์ œ์‹œํ•œ๋‹ค. ์‚ฌ์šฉ์ž๊ฐ€ ๋ชจ๋ธ์˜ ํŽธ์ง‘ ์ œ์•ˆ์„ ์ˆ˜์šฉ/๊ฑฐ์ ˆํ•˜๋ฉฐ ์ƒํ˜ธ์ž‘์šฉํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ๊ณ ํ’ˆ์งˆ ํ…์ŠคํŠธ ๊ฐœ์ •์„ ๋‹ฌ์„ฑํ•œ๋‹ค.

Motivation

Achievement

Figure 2

R3์˜ ์‚ฌ์šฉ์ž ์ธํ„ฐํŽ˜์ด์Šค: (a) ๋กœ๊ทธ์ธ, (b) ๊ฐ€์ด๋“œ๋ผ์ธ, (c) ๋ฌธ์„œ ์„ ํƒ, (d) ํŽธ์ง‘ ์ œ์•ˆ ๋ฐ ์ƒํ˜ธ์ž‘์šฉ ํŒจ๋„

  1. ๋ฐ˜๋ณต์  ๊ฐœ์ •์˜ ํ•ด์„์„ฑ๊ณผ ์ œ์–ด์„ฑ ํ–ฅ์ƒ: ํŽธ์ง‘ ์˜๋„(fluency, coherence, clarity, style)๋ฅผ ๋ช…์‹œ์ ์œผ๋กœ ํ‘œ์‹œํ•˜์—ฌ ์‚ฌ์šฉ์ž์—๊ฒŒ ์„ธ๋ฐ€ํ•œ ํ†ต์ œ๊ถŒ ์ œ๊ณต. ์ด๋ฏธ ๊ณ ํ’ˆ์งˆ์ธ ๋ถ€๋ถ„์€ ์žฌ๊ฒ€ํ† ํ•  ํ•„์š”๊ฐ€ ์—†์–ด ์ธ์ง€ ๋ถ€ํ•˜ ๊ฐ์†Œ
  2. ํšจ์œจ์„ฑ ์ฆ๋Œ€: ์ธ๊ฐ„-๊ธฐ๊ณ„ ์ƒํ˜ธ์ž‘์šฉ์ด ๋” ์ ์€ ๋ฐ˜๋ณต ํšŸ์ˆ˜์™€ ํŽธ์ง‘์œผ๋กœ ๋†’์€ ํ’ˆ์งˆ์˜ ๊ฐœ์ • ๋‹ฌ์„ฑ. ์‹ค์ฆ ์‹คํ—˜์—์„œ R3์˜ ํŽธ์ง‘ ์ˆ˜์šฉ๋ฅ (acceptance rate)์ด ์ดˆ๊ธฐ ๊ฐœ์ • ๊นŠ์ด(revision depth)์—์„œ ์ธ๊ฐ„ ์ž‘๊ฐ€ ์ˆ˜์ค€๊ณผ ์œ ์‚ฌ
  3. ์ตœ์ดˆ์˜ ํ˜‘๋ ฅํ˜• ๋ฐ˜๋ณต ๊ฐœ์ • ์‹œ์Šคํ…œ: ๊ธฐ์กด ์ผํšŒ์„ฑ ๋ฐฉ์‹์˜ ๊ฐœ์ • ์‹œ์Šคํ…œ๊ณผ ๋‹ฌ๋ฆฌ ๋ฐ˜๋ณต์  ํ˜‘๋ ฅ์„ ์ง€์›ํ•˜๋Š” ์ตœ์ดˆ์˜ ์‹ค์šฉ์  ์‹œ์Šคํ…œ ๊ตฌํ˜„

How

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ์ธ๊ฐ„ ํ”ผ๋“œ๋ฐฑ์„ ๋ฐ˜๋ณต ๋‹จ๊ณ„๋งˆ๋‹ค ํ†ตํ•ฉํ•˜์—ฌ ๊ฐœ์ • ํ’ˆ์งˆ๊ณผ ์‚ฌ์šฉ ๊ฒฝํ—˜์„ ๋™์‹œ์— ๊ฐœ์„ ํ•˜๋Š” ์‹ค์šฉ์  ์‹œ์Šคํ…œ์ด๋‚˜, ๊ธฐ์ˆ ์  ๋…์ฐฝ์„ฑ์€ ์ œํ•œ์ ์ด๋ฉฐ ํ‰๊ฐ€์˜ ๊นŠ์ด๋ฅผ ์‹ฌํ™”ํ•  ํ•„์š”๊ฐ€ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
AI ๊ธฐ๋ฐ˜ ํ”ผ๋“œ๋ฐฑ ๋ฐ˜๋ณต ๊ฐœ์„  ๋ฃจํ”„์˜ ์ƒ์„ฑ ์›๋ฆฌ์™€ ์ด๋ก ์  ์„ค๊ณ„๋ฐฉํ–ฅ์„ ์ธ๊ฐ„-๋จธ์‹  ์ƒํ˜ธ์ž‘์šฉ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๊ด€์ ์—์„œ ์‹ฌํ™”ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์Šคํ† ๋ฆฌํ…”๋ง ๋“ฑ AI-์ธ๊ฐ„ ํ˜‘๋™ ํ…์ŠคํŠธ ํŽธ์ง‘ ์‹œ์Šคํ…œ์œผ๋กœ, ํ•™์ˆ  ํ…์ŠคํŠธ ํŽธ์ง‘์ด ์•„๋‹Œ ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ ํ˜‘์—… ์‚ฌ๋ก€์™€ ๋น„๊ตํ•ด๋ณผ ๊ฐ€์น˜๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํฌ๋ฆฌ์—์ดํ‹ฐ๋ธŒ ์ด๋ฏธ์ง€ ์บก์…˜ ๊ฐ™์€ AI ์ƒ์„ฑ๋ฌผ์— ๋Œ€ํ•œ ์ธ๊ฐ„/๋ชจ๋ธ ํ˜‘์—… ๋ฐ˜๋ณต ๊ฐœ์„  ๋ฐฉ์‹์„ ์†Œ๊ฐœํ•ด R3์™€ ์œ ์‚ฌ์„ฑ๊ณผ ๋Œ€์กฐ์ ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ž๋™ํ™”๋œ ๋ฆฌ๋ทฐ ์›Œํฌํ”Œ๋กœ์šฐ์—์„œ ์ธ๊ฐ„ ๊ฐœ์ž…๊ณผ ์ž๋™ํ™”์˜ ๊ท ํ˜•์„ ๋‹ค๋ฃจ๋Š” ๋…ผ๋ฌธ์œผ๋กœ, human-in-the-loop ์ ‘๊ทผ๋ฒ•๊ณผ์˜ ๋น„๊ต์— ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์‚ฌ์šฉ์ž ๋ช…๋ น ๊ธฐ๋ฐ˜ ํ…์ŠคํŠธ ํŽธ์ง‘ ์‹œ์Šคํ…œ์œผ๋กœ, ๋ฐ˜๋ณต์  ์ธ๊ฐ„-๋ชจ๋ธ ํ”ผ๋“œ๋ฐฑ ๊ธฐ๋ฐ˜ ๊ฐœ์ • ์‹œ์Šคํ…œ์˜ ์‹ค์ œ ๊ตฌํ˜„ ์‚ฌ๋ก€๋กœ ์ฐธ๊ณ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Self-Refine๋Š” LLM ์ž์ฒด ์˜ค๋ฅ˜์ˆ˜์ •/๋ฐ˜๋ณต ๊ฐœ์„  ๊ตฌ์กฐ๋ฅผ ์ž๋™ํ™”ํ•˜์—ฌ ์ธ๊ฐ„ ํ”ผ๋“œ๋ฐฑ ์—ฐ๊ณ„ ๋ชจ๋ธ์„ ์‹ค์ œ๋กœ ํ™•์žฅ ์ ์šฉํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Human-LLM Coevolution ๋…ผ๋ฌธ์€ AI ๋„๊ตฌ๊ฐ€ ์‹ค์ œ ๋…ผ๋ฌธ ์ž‘์„ฑ ๊ณผ์ •์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ๋ถ„์„ํ•˜์—ฌ, R3 ์‹œ์Šคํ…œ์˜ ์‹ค์ œ ์ ์šฉ ๊ฒฐ๊ณผ์™€ ๋น„๊ตํ•ด๋ณผ ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
656์€ Human-in-the-loop ๊ธฐ๋ฐ˜ ๋ฐ˜๋ณต์  Peer Review ๊ฐœ์„  ์‹œ์Šคํ…œ์œผ๋กœ, 809์˜ AI-์ฃผ๋„ ์›Œํฌํ”Œ๋กœ์šฐ์˜ ์‹ค์ œ ์ ์šฉ ๋ฐฉ์•ˆ์— ํ™•์žฅ์„ฑ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AI ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ํŽธ์ง‘ ์ง€์›๊ณผ ๊ณผํ•™ ์—ฐ๊ตฌ ์ž๋™ํ™”์—์„œ ํ…์ŠคํŠธ ๊ฐœ์ • ๋ฐ ์ƒ์„ฑ ๋„๊ตฌ ํ™œ์šฉ ์ธก๋ฉด์ด ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •