Diamonds in the rough: Generating fluent sentences from early-stage drafts for academic writing assistance

์ €์ž: Takumi Ito, Tatsuki Kuribayashi, Hayato Kobayashi, Ana Brassard, Masato Hagiwara, Jun Suzuki, Kentaro Inui | ๋‚ ์งœ: 2019 | DOI: arXiv:1910.09180 📄 PDF


Essence

Figure 1

์“ฐ๊ธฐ ๊ณผ์ •์˜ 4๋‹จ๊ณ„(์ดˆ์•ˆ ์ž‘์„ฑโ†’์ˆ˜์ •โ†’ํŽธ์ง‘โ†’๊ต์ •)์™€ ๋ณธ ์—ฐ๊ตฌ์˜ ์ดˆ์ 

๋น„๋ชจ๊ตญ์–ด ๋ถ€์ •ํ™•ํ•œ ์ดˆ์•ˆ ๋ฌธ์žฅ์„ ์œ ์ฐฝํ•˜๊ณ  ์™„์„ฑ๋œ ํ•™์ˆ  ๋ฌธ์žฅ์œผ๋กœ ์ž๋™ ๋ณ€ํ™˜ํ•˜๋Š” ๋ฌธ์žฅ ์ˆ˜์ค€ ์ˆ˜์ •(Sentence-level Revision, SentRev) ์ž‘์—…์„ ์ œ์•ˆํ•˜๊ณ , ์ด๋ฅผ ์œ„ํ•œ SMITH ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ•˜์—ฌ ๊ธฐ์ค€์„  ์„ฑ๋Šฅ์„ ์„ค์ •ํ•œ๋‹ค.

Motivation

Achievement

Figure 2

SMITH ๋ฐ์ดํ„ฐ์…‹ ์ƒ์„ฑ ์ ˆ์ฐจ: (i) ํ•™์ˆ  ๋…ผ๋ฌธ์—์„œ ์ตœ์ข… ๋ฌธ์žฅ ์ถ”์ถœ โ†’ (ii) ์ผ๋ณธ์–ด ๋ฒˆ์—ญ โ†’ (iii) ํฌ๋ผ์šฐ๋“œ์†Œ์‹ฑ์œผ๋กœ ์˜์–ด ์žฌ๋ฒˆ์—ญ โ†’ (iv) ํ’ˆ์งˆ ๊ด€๋ฆฌ

  1. ์ƒˆ๋กœ์šด ์ž‘์—… ์ •์˜: SentRev ์ž‘์—…์„ ํ•™์ˆ  ์“ฐ๊ธฐ ๋ณด์กฐ์˜ ์ƒˆ๋กœ์šด ์˜์—ญ์œผ๋กœ ์ œ์•ˆํ•˜์—ฌ ์ดˆ์•ˆ ๋‹จ๊ณ„์˜ ๋„์›€์„ ์ฒด๊ณ„ํ™”ํ–ˆ๋‹ค.
  2. SMITH ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•: 10,804๊ฐœ์˜ ์ดˆ์•ˆ-์ตœ์ข… ๋ฌธ์žฅ ์Œ์œผ๋กœ ๊ตฌ์„ฑ๋œ ๊ณต๊ฐœ ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ–ˆ์œผ๋ฉฐ, JFLEG ๋Œ€๋น„ ์•ฝ 7๋ฐฐ ๊ทœ๋ชจ์ด๊ณ  99%์˜ ๋ฌธ์žฅ ์Œ์—์„œ ๋ณ€ํ™”๊ฐ€ ์žˆ๋‹ค(ํ‘œ 3).
  3. ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ ๊ฒ€์ฆ: 95% ์ ์ ˆ์„ฑ ํ™•๋ฅ ๋กœ ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ์„ ๊ฒ€์ฆํ–ˆ์œผ๋ฉฐ, ๋ฌธ์ž ์ˆ˜์ค€ Levenshtein ๊ฑฐ๋ฆฌ(47.0)๊ฐ€ ๊ธฐ์กด ๋ฐ์ดํ„ฐ์…‹๋ณด๋‹ค ํ›จ์”ฌ ํฌ๋‹ค๋Š” ๊ฒƒ์€ ์‹ค์งˆ์ ์ธ ์ˆ˜์ •์ด ์ด๋ฃจ์–ด์กŒ์Œ์„ ๋ณด์—ฌ์ค€๋‹ค.
  4. ๊ธฐ์ค€์„  ์„ค์ •: ๋น„์ง€๋„ ๋ชจ๋ธ๋“ค๋กœ SentRev ์ž‘์—…์˜ ๊ธฐ์ค€์„  ์„ฑ๋Šฅ์„ ํ™•๋ฆฝํ–ˆ๋‹ค.

How

Figure 2

ํฌ๋ผ์šฐ๋“œ์†Œ์‹ฑ ํ”„๋กœํ† ์ฝœ์˜ 4๋‹จ๊ณ„

๋ฐ์ดํ„ฐ์…‹ ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก :

์˜ค๋ฅ˜ ์œ ํ˜•:

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ํ•™์ˆ  ์“ฐ๊ธฐ ๋ณด์กฐ์˜ ๋ฏธ๊ฐœ์ฒ™ ์˜์—ญ์ธ ์ดˆ์•ˆ ์ˆ˜์ • ๋‹จ๊ณ„๋ฅผ ์ƒˆ๋กœ์šด ์ž‘์—…์œผ๋กœ ์ •์˜ํ•˜๊ณ , ์ฐฝ์˜์ ์ธ ํฌ๋ผ์šฐ๋“œ์†Œ์‹ฑ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ์ž์—ฐ์Šค๋Ÿฌ์šด ์˜ค๋ฅ˜ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ–ˆ๋‹ค๋Š” ์ ์—์„œ ์ค‘์š”ํ•œ ๊ธฐ์—ฌ์ด๋‹ค. ๋‹ค๋งŒ ์‹ ๊ฒฝ๋ง ๊ธฐ๋ฐ˜ ๋ชจ๋ธ ๊ฐœ๋ฐœ๊ณผ ์‹ค์ œ ์ ์šฉ ํ‰๊ฐ€๊ฐ€ ๋ฏธํกํ•˜๋ฉฐ, ํ–ฅํ›„ ๋‹ค์–‘ํ•œ ์–ธ์–ด์™€ ๊ทœ๋ชจ์˜ ๋ฐ์ดํ„ฐ ํ™•์žฅ์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๋‹ค๋ฅธ ์ ‘๊ทผ
๋น„๋ชจ๊ตญ์–ด ํ™”์ž์˜ ํ…์ŠคํŠธ ๊ฐœ์„ ์„ ์œ„ํ•œ ์ž์—ฐ์–ด์ฒ˜๋ฆฌ ์ ‘๊ทผ๋ฒ•์ด๋ผ๋Š” ์œ ์‚ฌํ•œ ๋ฌธ์ œ ์˜์—ญ์„ ๋‹ค๋ฃฌ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Learning to split and rephrase from wikipedia edit history ๋…ผ๋ฌธ์€ ์œ„ํ‚ค ๋ฌธ์žฅ ๋ฆฌ๋ผ์ดํŒ…์„ ํ†ตํ•ด ์œ ์ฐฝ์„ฑ๊ณผ ๊ตฌ์กฐ ๊ฐœ์„ ์„ ๋‹ค๋ฃจ์–ด 272์˜ SentRev์™€ ๋ฐ์ดํ„ฐ ๋ฐ ์ ‘๊ทผ ๋ฐฉ์‹ ๋น„๊ต์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Text editing by command๋Š” ๋ช…๋ น ๊ธฐ๋ฐ˜ ๋ฌธ์žฅ ์ˆ˜์ • ๋ฐฉ์‹์„ ๋‹ค๋ฃจ์–ด, ๋ฌธ์žฅ ์ˆ˜์ค€ ์ž๋™ ๊ต์ • ์—ฐ๊ตฌ์˜ ๋Œ€์•ˆ ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Wordcraft๋Š” ์ธ๊ฐ„-AI ๊ณต๋™ ํŽธ์ง‘ ํ™˜๊ฒฝ์—์„œ ๋น„๋ฌธํ•™ ์ดˆ์•ˆ์„ ์œ ์ฐฝํ•˜๊ฒŒ ๋‹ค๋“ฌ๋Š” ๋‹ค์–‘ํ•œ ์‚ฌ์šฉ์ž ์ƒํ˜ธ์ž‘์šฉ ๋ฐฉ์‹์˜ ์‹ค์ฆ์  ์ฐจ์ด๋ฅผ ๋ณด์ธ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋…ผ๋ฌธ ๊ทธ๋ฆผ ์บก์…˜ ์ƒ์„ฑ๊ณผ์ •์—์„œ ์ž…๋ ฅ ํ…์ŠคํŠธ ํ’ˆ์งˆ ๊ฐœ์„  ๋ฐ ์ž์—ฐ์Šค๋Ÿฌ์šด ์ƒ์„ฑ์ด ์ค‘์š”ํ•˜๋ฏ€๋กœ, ๋ฌธ์žฅ ์œ ์ฐฝ์„ฑ ๋ณ€ํ™˜ ๊ด€์ ์—์„œ 272๋ฒˆ๊ณผ ์ฐธ๊ณ ํ• ๋งŒํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ์–ธ์–ด๋ชจ๋ธ์ด ์ธ๊ฐ„์˜ ๊ธ€์“ฐ๊ธฐ ์Šคํƒ€์ผ๊ณผ ๋‚ด์šฉ ๋‹ค์–‘์„ฑ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋Œ€์•ˆ์  ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‘ ์—ฐ๊ตฌ ๋ชจ๋‘ ํ…์ŠคํŠธ ์ƒ์„ฑ ๋˜๋Š” ์ˆ˜์ • ์ž‘์—…์—์„œ ์ž์—ฐ์–ด์ฒ˜๋ฆฌ ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•˜์ง€๋งŒ ์ ‘๊ทผ ๋ฐฉ์‹์ด ๋‹ค๋ฅด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฌธ์žฅ ์ˆ˜์ค€์˜ ํ…์ŠคํŠธ ๋ณ€ํ™˜ ๋˜๋Š” ์ˆ˜์ • ์ž‘์—…์— ๊ด€๋ จ๋œ NLP ์—ฐ๊ตฌ๋กœ ์œ ์‚ฌํ•œ ๋ฐฉ๋ฒ•๋ก ์  ๋งฅ๋ฝ์„ ๊ณต์œ ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ์ž‘์„ฑ ํ”ผ๋“œ๋ฐฑ ์ƒ์„ฑ ์—ฐ๊ตฌ๋กœ, ์ดˆ์•ˆ์˜ ์ž๋™ ์ˆ˜์ •๊ณผ ๊ด€๋ จ๋œ ํ›„์† ์‘์šฉ์„ ๋‹ค๋ฃฌ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Neural automated writing evaluation with corrective feedback ๋…ผ๋ฌธ์€ SentRev ์ž‘์—…์—์„œ ์ƒ์„ฑ๋œ ๋ฌธ์žฅ๊ณผ ์œ ์‚ฌํ•œ ์ž๋™ ๊ต์ • ์‹œ์Šคํ…œ์˜ ์„ฑ๋Šฅ/ํ•œ๊ณ„ ๋ถ„์„์— ๋ฐ”ํƒ•์„ ๋‘” ์‹คํ—˜์„ ์ œ์‹œํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •