์ ์: Izia Xiaoxiao Wang, Xihan Wu, Edith Coates, Min Zeng, Jiexin Kuang, Siliang Liu, Mengyang Qiu, Jungyeul Park | ๋ ์ง: 2024 | DOI: N/A 📄 PDF
Essence
์์คํ
์ํฌํ๋ก์ฐ: ํ์ต์๊ฐ ์์ธ์ด๋ฅผ ์ ์ถํ๋ฉด ์๋ ์ฐ๊ธฐ ํ๊ฐ(AWE)์ ๋ฌธ๋ฒ ์ค๋ฅ ์์ (GEC)์ ํตํฉํ์ฌ ์ ์์ ์์ ํผ๋๋ฐฑ์ ์ ๊ณต
๋ณธ ๋
ผ๋ฌธ์ ์๋ ์ฐ๊ธฐ ํ๊ฐ(AWE: Automated Writing Evaluation)์ ๋ฌธ๋ฒ ์ค๋ฅ ์์ (GEC: Grammatical Error Correction) ์์คํ
์ ํตํฉํ์ฌ, ์ 2์ธ์ด ํ์ต์์๊ฒ ์ฆ๊ฐ์ ์ธ ์์ธ์ด ํ์ ๊ณผ ๋ฌธ๋ฒ ์์ ํผ๋๋ฐฑ์ ๋์์ ์ ๊ณตํ๋ ํตํฉ ์์คํ
์ ์ ์ํ๋ค. ์ด๋ฅผ ํตํด ์ํ ์๋ฎฌ๋ ์ด์
ํ๊ฒฝ์ ๊ตฌํํ์ฌ ๋ณด๋ค ์ค์ง์ ์ธ ์ธ์ด ํ์ต ๊ฒฝํ์ ์ ๊ณตํ๋ค.
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ์๋ํ ์ฐ๊ธฐ ํ๊ฐ์ ๋ฌธ๋ฒ ์ค๋ฅ ์์ ์ ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ์ผ๋ก ์ฒ์ ํตํฉํ์ฌ ์ 2์ธ์ด ํ์ต์์๊ฒ ์ค์ง์ ๊ฐ์น๋ฅผ ์ ๊ณตํ๋ ์์คํ
์ ์ ์ํ์ผ๋, ์ค์ ํ์ต ํจ๊ณผ์ ๋ํ ์ค์ฆ์ ๊ฒ์ฆ๊ณผ ์ฅ๊ธฐ ์ํฅ ๋ถ์์ด ๋ณด์๋๋ฉด ๋์ฑ ๊ฐ๋ ฅํ ๊ธฐ์ฌ๊ฐ ๋ ์ ์๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
662๋ฒ ๋
ผ๋ฌธ์ ๊ฐํํ์ต ๊ธฐ๋ฐ ์คํ ์ ์ด ์๋ํ๋ฅผ ๋ค๋ฃจ์ด, 571๋ฒ๊ณผ ๊ฐ์ด ์๋ํ AI ํ๊ฐ ์์คํ
์ ๊ธฐ์ ๊ฐ ๋๋ ์คํ์ ๋ฐฉ๋ฒ๋ก ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
ํผ๋๋ฐฑ ์์ฑ ์๋ํ ์ฐ๊ตฌ์ ๊ธฐ๋ฐ์ด ๋๋ ๋
ผ๋ฌธ์ผ๋ก, ์๋ํ๋ ์ฐ๊ธฐ ํ๊ฐ ๋ฐ ํผ๋๋ฐฑ ์ ๊ณต ์์คํ
๊ฐ๋ฐ์ ์๊ฐ์ ์ค๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
360 ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ณผํ์ ์ปค๋ฎค๋์ผ์ด์
์ฌ๋ฆฌ์ ์ํ ๋ถ์์ 571์ ์๋ ํ๊ฐ ๊ธฐ๋ฐ ์์ฑ ํ
์คํธ ํผ๋๋ฐฑ ๊ด์ ๊ณผ ๋ง๋ฟ์ ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
AI ๊ธฐ๋ฐ ๊ธ์ฐ๊ธฐ ํ๊ฐ ์งํ์ ์๋ํ ๋ฐฉ์ ๋ฐ ํ์ค์ ํ๊ณ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ๋
ผ์ํ์ฌ, NER ๊ธฐ๋ฐ GEC ํตํฉ ์์คํ
์ ํ๊ฐ์ค๊ณ์ ๊ทผ๊ฑฐ๊ฐ ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ฝ๋ ์๋ ์์ฑ์์ ์ธ์ง๋ ์์ฐ์ฑ ํ๊ฐ์ ์ ์ฌํ๊ฒ, ์ธ์ด ํ์ตยท์์ธ์ด ํ๊ฐ์์ ์๋ํ ์์คํ
์ ์ค์ ํจ์ฉ์ ๋น๊ตํ๋ ๊ทผ๊ฑฐ์๋ฃ๊ฐ ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Neural automated writing evaluation with corrective feedback ๋
ผ๋ฌธ์ ์๋ฌธ ์๋ ์ฒจ์ญ ๋ฐ ์ค๋ฅ ๊ต์ ์ ์ง์คํ๊ณ ์์ด CSED์ ์ค๊ตญ์ด ์๋ฏธ ์ค๋ฅ ์ง๋จ๊ณผ ๋๋นํด์ ์ฝ๊ธฐ ์ข์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
592๋ฒ ๋
ผ๋ฌธ์ ๋
ผ๋ฌธ ๋๋ฃ์ฌ์ฌ์ ํนํ๋ LLM์, 571๋ฒ์ ์๋ ์ฐ๊ธฐยท๋ฌธ๋ฒ ํ๊ฐ ํตํฉ ์์คํ
์ ์ ์ํ์ฌ AI๊ฐ ํ๊ฐ ํผ๋๋ฐฑ์ ์ ๊ณตํ๋ ๋์์ ์ฌ๋ก์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
GEC ๋ฐฉ์์ ๊ฒฝ๋ํ ๋ชจ๋ธ๊ณผ ์ง์ ์ฌ์์ฑ ๊ธฐ๋ฐ ์ค๋ฅ ์์ ์์คํ
์ ๋น๊ตํ์ฌ, ์
๋ ฅ ๋์ยทํผ๋๋ฐฑ ์ค๊ณ์์ ์ฐจ๋ณ์ ํ์
์ด ๊ฐ๋ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Text editing by command ๋
ผ๋ฌธ์ ๋ช
๋ น์ด ๊ธฐ๋ฐ ์์ธ์ด ํธ์ง์ ์ ์ํ์ฌ, ์๋ํ๋ ์ฐ๊ธฐ ํ๊ฐ ๋ฐ ๊ต์ ์ฐ๊ตฌ์ ๊ฒฐํฉ๋ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
Peer Review as A Multi-Turn Dialogue๋ LLM ๊ธฐ๋ฐ ๋
ผ๋ฌธ ์ฅ๋ฌธ ํ๊ฐ๋ฅผ ๋ค๋ฃจ๋ฉฐ, ํ๊ฐ ์๋ํ์ ํผ๋๋ฐฑ์ ์ค์ง์ ์์ฉ ์ฌ๋ก๋ฅผ ์ ๊ณตํ๋ค.
์์ฉ ์ฌ๋ก
662๋ฒ์ ์คํ์ ๊ฐํํ์ต ์๋์ ์ด ํ๋ ์์ํฌ๋ 571๋ฒ์ ์๋ ์ฐ๊ธฐํ๊ฐ ๋ฐ ํผ๋๋ฐฑ ์์คํ
๊ตฌ์กฐ์ ์ฐ๊ตฌ ๋ฐฉ๋ฒ๋ก ์ผ๋ก ์ฐธ๊ณ ๋ ์ ์๋ค.
์์ฉ ์ฌ๋ก
Neural automated writing evaluation with corrective feedback ๋
ผ๋ฌธ์ SentRev ์์
์์ ์์ฑ๋ ๋ฌธ์ฅ๊ณผ ์ ์ฌํ ์๋ ๊ต์ ์์คํ
์ ์ฑ๋ฅ/ํ๊ณ ๋ถ์์ ๋ฐํ์ ๋ ์คํ์ ์ ์ํ๋ค.
์์ฉ ์ฌ๋ก
OverleafCopilot์ LLM์ ์ค์ ๋
ผ๋ฌธ ์์ฑ์ ํตํฉ ์ ์ฉํ ์ฌ๋ก๋ก, ์๋ํ๋ ๊ธ์ฐ๊ธฐ ํ๊ฐ ์์คํ
์ด ์ค๋ฌด์์ ์ด๋ป๊ฒ ์์ฉ๋๋์ง ๋ณด์ฌ์ค๋ค.