People who frequently use ChatGPT for writing tasks are accurate and robust detectors of AI-generated text

์ €์ž: Jenna Russell, Marzena Karpinska, Mohit Iyyer | ๋‚ ์งœ: 2025-01-26 | DOI: 10.48550/arXiv.2501.15654 📄 PDF


Essence

Figure 1

Figure 1: ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€์˜ AI ์ƒ์„ฑ ํ…์ŠคํŠธ ์ฃผ์„ ์˜ˆ์‹œ - ํŒ๋‹จ, ์‹ ๋ขฐ๋„ ์ ์ˆ˜, ์ƒ์„ธ ์„ค๋ช… ํฌํ•จ

LLM์„ ๊ธ€์“ฐ๊ธฐ ์ž‘์—…์— ์ž์ฃผ ์‚ฌ์šฉํ•˜๋Š” ์‚ฌ๋žŒ๋“ค์€ ํŠน๋ณ„ํ•œ ํ•™์Šต ์—†์ด๋„ AI ์ƒ์„ฑ ํ…์ŠคํŠธ๋ฅผ ๊ทน๋„๋กœ ์ •ํ™•ํ•˜๊ฒŒ ํƒ์ง€ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ž๋™ ํƒ์ง€ ์‹œ์Šคํ…œ๋ณด๋‹ค ํ›จ์”ฌ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ธ๋‹ค. ๋ณธ ์—ฐ๊ตฌ๋Š” 300๊ฐœ์˜ ๋…ผํ”ฝ์…˜ ๊ธฐ์‚ฌ์— ๋Œ€ํ•œ 9๋ช…์˜ ์ฃผ์„์ž ๋ถ„์„์„ ํ†ตํ•ด ์ด๋ฅผ ์ž…์ฆํ•œ๋‹ค.

Motivation

Achievement

Figure 2

Figure 2: ์ „๋ฌธ๊ฐ€ ์‹ ๋ขฐ๋„๋Š” ๋‚œ์ด๋„๊ฐ€ ๋†’์•„์งˆ์ˆ˜๋ก ๊ฐ์†Œํ•˜์ง€๋งŒ ์ •ํ™•๋„๋Š” ์œ ์ง€

  1. LLM ์ž์ฃผ ์‚ฌ์šฉ์ž์˜ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ: LLM์„ ๊ธ€์“ฐ๊ธฐ์— ์ž์ฃผ ์‚ฌ์šฉํ•˜๋Š” 5๋ช…์˜ "์ „๋ฌธ๊ฐ€" ์ฃผ์„์ž์˜ ๋‹ค์ˆ˜๊ฒฐ ํˆฌํ‘œ๋Š” 300๊ฐœ ๊ธฐ์‚ฌ ์ค‘ ๋‹จ 1๊ฐœ๋งŒ ์˜ค๋ถ„๋ฅ˜(99.67% ์ •ํ™•๋„). ๋น„๊ต๊ตฐ(LLM์„ ๊ฑฐ์˜ ์‚ฌ์šฉํ•˜์ง€ ์•Š๋Š” ์ฃผ์„์ž)์€ ๊ฑฐ์˜ ๋ฌด์ž‘์œ„ ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ์„ ๋ณด์ž„.
  2. ์ž๋™ ํƒ์ง€ ์‹œ์Šคํ…œ ์ดˆ์›”: Pangram ์ƒ์šฉ ๋ชจ๋ธ์„ ์ œ์™ธํ•œ ๊ฑฐ์˜ ๋ชจ๋“  ์˜คํ”ˆ์†Œ์Šค ํƒ์ง€๊ธฐ(Binoculars 6.7%, Fast-DetectGPT 23.3%)๋ฅผ ๋Šฅ๊ฐ€. ํŠนํžˆ O1-Pro ํœด๋จธ๋‹ˆ์ œ์ด์…˜ ํ…์ŠคํŠธ ํƒ์ง€์—์„œ ์ „๋ฌธ๊ฐ€๋Š” 100% ์ •ํ™•๋„, ์ž๋™ ๋ฐฉ์‹์€ ์‹ฌ๊ฐํ•œ ์„ฑ๋Šฅ ์ €ํ•˜.

How

Figure 3

Figure 3: ์ „๋ฌธ๊ฐ€๊ฐ€ ์–ธ๊ธ‰ํ•œ ํƒ์ง€ ๋‹จ์„œ์˜ ๋ฒ”์ฃผ๋ณ„ ๋นˆ๋„ ๋ถ„ํฌ

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4.5/5 Overall: 4.4/5

์ดํ‰: ํ˜„๋Œ€ LLM ์‹œ๋Œ€์— ์ธ๊ฐ„ ํƒ์ง€์ž์˜ ์ž ์žฌ๋ ฅ์„ ์ฒด๊ณ„์ ์œผ๋กœ ์žฌํ‰๊ฐ€ํ•œ ์ค‘์š”ํ•œ ์‹ค์ฆ ์—ฐ๊ตฌ์ด๋ฉฐ, ์‹ค๋ฌด์  ๊ฐ€์น˜๊ฐ€ ๋†’์œผ๋‚˜, ๋„๋ฉ”์ธ๊ณผ ์ „๋ฌธ๊ฐ€ ํ‘œ๋ณธ์˜ ์ œํ•œ์„ฑ์œผ๋กœ ์ธํ•ด ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ์— ์ฃผ์˜๊ฐ€ ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
611 ๋…ผ๋ฌธ์€ LLM์ด ์ง€์†์  ์‚ฌ์šฉ์‹œ ๋ฒˆ์—ญยท์ž‘๋ฌธ์—์„œ ํ”ผ์ƒ์ ์‚ฌ๊ณ  ๋ฐ ๋‹ค์–‘์„ฑ ํ•œ๊ณ„๊ฐ€ ์‹ค์ œ๋กœ ๋‚˜ํƒ€๋‚จ์„ ์‹ค์ฆ, 284์˜ ํ•ต์‹ฌ ์‹คํ—˜๊ฒฐ๊ณผ์˜ ์‚ฌํšŒ์  ํŒŒ๊ธ‰๋ ฅ์„ ๋’ท๋ฐ›์นจํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
529 ๋…ผ๋ฌธ์˜ ๋‹ค์ค‘ ์—ญํ•  ์—์ด์ „ํŠธ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ธฐ๋ฐ˜ ์˜๋ฃŒ ์ถ”๋ก ์€ 611์—์„œ ๋‹ค๋ฃจ๋Š” ์ฑ—๋ด‡ ๊ธฐ๋ฐ˜ ์ž„์ƒํ˜„์žฅ ๊ฒฝํ—˜๊ณผ ๊ฐœ๋…์ ์œผ๋กœ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ์ƒ์„ฑ ํ…์ŠคํŠธ ํƒ์ง€๋ฅผ ๋‹ค๋ฅธ ๋„๋ฉ”์ธ์ด๋‚˜ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ์ ‘๊ทผํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
796๋ฒˆ ๋…ผ๋ฌธ์€ AI ๊ธ€์“ฐ๊ธฐ์˜ ์‹ค์ œ ์˜ํ–ฅ๊ณผ ์‚ฌํšŒ์  ๋ณ€ํ™”์— ๋Œ€ํ•œ ๋…ผ์˜๋กœ, AI ์‚ฌ์šฉ์ž๊ฐ€ AI ์ƒ์„ฑ ํ…์ŠคํŠธ๋ฅผ ํƒ์ง€ํ•˜๋Š” ๊ฒฝํ—˜์  ํ˜„์ƒ์„ ์‚ฌํšŒ์  ๋งฅ๋ฝ์—์„œ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
611๋ฒˆ ๋…ผ๋ฌธ์€ ChatGPT ํ™œ์šฉ ๋นˆ๋„๊ฐ€ ์‹ค์ œ ๊ธ€์“ฐ๊ธฐ ๋Šฅ๋ ฅ์„ ์–ด๋–ป๊ฒŒ ๋ณ€ํ™”์‹œํ‚ค๋Š”์ง€ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด ๋ฐํ˜€, 900๋ฒˆ์˜ ๊ต์œก์  ํ•จ์˜์— ์‹ค์ฆ์„ ์ถ”๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI ๊ธ€์“ฐ๊ธฐ ๋„๊ตฌ(์˜ˆ: ChatGPT) ์‹ค์‚ฌ์šฉ์ž์˜ ํ–‰๋™๊ณผ ํƒœ๋„๋ฅผ ๋ถ„์„ํ•œ ๋…ผ๋ฌธ์œผ๋กœ, OverleafCopilot ๋„๊ตฌ ๋„์ž… ์ดํ›„ ์—ฐ๊ตฌ์ž ์‚ฌ์šฉ ํ–‰ํƒœ์™€ ๊ฒฝํ—˜ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
611 ๋…ผ๋ฌธ์€ LLM ์‚ฌ์šฉ์ด ์ €์ž ์ง‘๋‹จ๋ณ„๋กœ ์‹ค์ œ ๊ณผ์—… ์˜ํ–ฅ์— ๋ฏธ์น˜๋Š” ์ •๋Ÿ‰์  ํšจ๊ณผ๊นŒ์ง€ ๋‹ค๋ฃจ๋ฉฐ, 508์—์„œ ์ œ์‹œํ•œ ์ธ์‹/๋ถ„ํ™” ๋ฐ์ดํ„ฐ๋ฅผ ๊ตฌ์ฒดํ™”ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
445๋ฒˆ ๋…ผ๋ฌธ์€ LLM์ด ์‹ค์ œ ๋ฆฌ๋ทฐ์— ํ™œ์šฉ๋๋Š”์ง€ ํƒ์ง€ํ•˜๋Š” ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ์–ด, 611๋ฒˆ์˜ ์ธ๊ฐ„-AI ์ƒ์„ฑ ํ…์ŠคํŠธ ํŒ๋ณ„ ์—ฐ๊ตฌ์—์„œ ๋” ์‹ค์ „์  ํ™•์žฅ ์‚ฌ๋ก€๋กœ ์—ฐ๊ณ„๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Detecting LLM-written Peer Reviews ๋…ผ๋ฌธ์€ ์‹ฌ์‚ฌ ๊ณผ์ •์—์„œ AI ํ™œ์šฉ ๊ฒ€์ถœ์— ์ดˆ์ ์„ ๋งž์ถ”์–ด, ์ธ๊ฐ„ ํƒ์ง€์ž์™€์˜ ์ •ํ™•๋„ ๋น„๊ต์— ๋…ผ์˜ ํ™•์žฅ์ด ๊ฐ€๋Šฅํ•˜๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
611 ๋…ผ๋ฌธ์€ ๊ณผํ•™์ž ๋ฐ ์ง€์‹๋…ธ๋™์ž๊ฐ€ AI ํ™œ์šฉ ๊ณผ์ •์—์„œ ๋‚˜ํƒ€๋‚˜๋Š” ์œ„ํ—˜๊ณผ ์ธ์ง€ ๋ถ€์ฑ„ ๋ฌธ์ œ๋ฅผ ์–‘์  ์„ค๋ฌธ ๋ฐ ์‹คํƒœ์กฐ์‚ฌ๋กœ ์ œ์‹œ, 378์˜ ์ธํ„ฐ๋ทฐ ๊ธฐ๋ฐ˜ ์‚ฌ๋ก€์™€ ์ƒํ˜ธ ๊ฐ•ํ™”ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
611 ๋…ผ๋ฌธ์€ ChatGPT ๋“ฑ LLM ๋นˆ๋ฒˆ ์‚ฌ์šฉ์ž๊ฐ€ ์ธ์ง€์  ๋ถ€์ฑ„(cognitive debt)๋ฅผ ์ถ•์ ํ•œ๋‹ค๋Š” 890์˜ ๊ฒฐ๊ณผ๋ฅผ ์‹ค์ œ ์„ค๋ฌธ ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ๋กœ ๋’ท๋ฐ›์นจํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
People who frequently use ChatGPT for writing tasks ๋…ผ๋ฌธ์€ AI ๋„๊ตฌ๋ฅผ ๊ธ€์“ฐ๊ธฐ ์‹ค์ „์—์„œ ์ž์ฃผ ์‚ฌ์šฉํ•˜๋Š” ์ด์šฉ์ž์˜ ์Šต๊ด€, ํšจ์œจ, ์œ„ํ—˜ ๋“ฑ์„ ๋Œ€๊ทœ๋ชจ ์„ค๋ฌธ๊ณผ ๋ถ„์„์œผ๋กœ ์ œ์‹œํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AI Copilot Code Quality ๋ฐ์ดํ„ฐ ์—ญ์‹œ ์‚ฌ๋žŒ๋“ค์ด AI ์ž‘์„ฑ ์ฝ”๋“œ ํ’ˆ์งˆ ๋ฐ ๊ฐ์ง€์—์„œ ์–ด๋–ค ๋ฐฉ์‹์œผ๋กœ LLM ํ™œ์šฉ๋„๊ฐ€ ๋ณ€ํ•˜๋Š”์ง€ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
875๋ฒˆ Nature ๊ฐ€์ด๋“œ๋Š” ์‹ค์ œ ์—ฐ๊ตฌ ๋„๊ตฌ๋กœ์จ AI ํ™œ์šฉ๊ณผ ํ•œ๊ณ„์— ๋Œ€ํ•œ ๋ฆฌ๋ทฐ๋ฅผ ์ œ๊ณตํ•˜๋ฏ€๋กœ, 611๋ฒˆ์˜ AI ์ƒ์„ฑ ํ…์ŠคํŠธ ํŒ๋ณ„ ์—ญ๋Ÿ‰ ์—ฐ๊ตฌ์™€ ํ˜„์žฅ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ์—ฐ๊ฒฐํ•ด ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
ChatGPT ํ™œ์šฉ ๋นˆ๋„์™€ ํ‰๊ฐ€ ์ฐจ์ด๋ฅผ ์‹ค์ œ ๋…ผ๋ฌธ์ž‘์„ฑ ํ˜„์žฅ์—์„œ ๋ถ„์„ํ•จ์œผ๋กœ์จ, ์œค๋ฆฌ์„ฑ ๋ฐ ์ธ์‹ ๋…ผ์Ÿ์˜ ํ˜„์‹ค์  ๊ทผ๊ฑฐ๋ฅผ ๋ณด๊ฐ•ํ•ฉ๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
611 ๋…ผ๋ฌธ์€ AI ์ฑ—๋ด‡ ์‚ฌ์šฉ ์‚ฌ๋ก€์— ๋Œ€ํ•ด ๊ธ์ •์  ํšจ๊ณผ์— ์ฃผ๋ชฉํ•˜๋Š” ๋ฐ˜๋ฉด, 360์€ ์œ„ํ—˜์„ฑ ๋ฐ ๋ถ€์ •์  ์‹ฌ๋ฆฌ ํšจ๊ณผ์— ์ง‘์ค‘ํ•ฉ๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
444 ๋…ผ๋ฌธ์€ Nature ์„ค๋ฌธ์„ ํ†ตํ•ด ์‹ค์ œ ์—ฐ๊ตฌ์ž๋“ค์ด AI ๊ธ€์“ฐ๊ธฐ ์ฑ„ํƒ์— ๋น„ํŒยท์šฐ๋ ค๋ฅผ ๋“œ๋Ÿฌ๋‚ด๋ฏ€๋กœ, AI ์ƒ์„ฑ ํƒ์ง€ ๋Šฅ๋ ฅ ๊ฐ•ํ™”์˜ ์‹คํšจ์„ฑ๊ณผ ํ•œ๊ณ„์— ๋Œ€ํ•ด ๊ท ํ˜•๋œ ์‹œ๊ฐ์„ ์–ป์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •