All that glitters is not novel: Plagiarism in ai generated research

์ €์ž: Tarun Gupta, Danish Pruthi | ๋‚ ์งœ: 2025 | DOI: ๋ฏธ์ œ๊ณต 📄 PDF


Essence

Figure 1

๊ทธ๋ฆผ 1: LLM ์ƒ์„ฑ ์—ฐ๊ตฌ ์ œ์•ˆ์„œ์˜ ํ‘œ์ ˆ ํƒ์ง€๋ฅผ ์œ„ํ•œ ์ „๋ฌธ๊ฐ€ ํ‰๊ฐ€ ๊ฐœ์š”. ์„ ํ–‰ ์—ฐ๊ตฌ์™€ ๋‹ฌ๋ฆฌ ๋ณธ ์—ฐ๊ตฌ์˜ ์ฐธ์—ฌ์ž๋“ค์€ ํ‘œ์ ˆ์„ ์ ๊ทน์ ์œผ๋กœ ํƒ์ƒ‰ํ•˜๋„๋ก ์ง€์‹œ๋ฐ›์Œ

์ตœ๊ทผ ์ž๋™ํ™”๋œ ์—ฐ๊ตฌ ์—์ด์ „ํŠธ๊ฐ€ ํ˜์‹ ์ ์ธ ์—ฐ๊ตฌ ์•„์ด๋””์–ด๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ์ฃผ์žฅ๋˜๊ณ  ์žˆ์œผ๋‚˜, ๋ณธ ๋…ผ๋ฌธ์€ LLM์ด ์ƒ์„ฑํ•œ ์—ฐ๊ตฌ ๋ฌธ์„œ์˜ 24%๊ฐ€ ๊ธฐ์กด ๋…ผ๋ฌธ์œผ๋กœ๋ถ€ํ„ฐ ์ •๊ตํ•˜๊ฒŒ ํ‘œ์ ˆ๋˜์—ˆ์Œ์„ ์ž…์ฆํ•œ๋‹ค. ํŠนํžˆ ์ด๋Ÿฌํ•œ ํ‘œ์ ˆ์ด ๋‚ด์žฅ๋œ ํ‘œ์ ˆ ํƒ์ง€ ์‹œ์Šคํ…œ์„ ์šฐํšŒํ•˜๋ฉฐ ์ถœ์ฒ˜๋ฅผ ์ธ์ •ํ•˜์ง€ ์•Š๋Š” ๋ฌธ์ œ๋ฅผ ์ง€์ ํ•œ๋‹ค.

Motivation

Achievement

  1. ํ‘œ์ ˆ ๊ฒ€์ฆ ๊ฒฐ๊ณผ: 50๊ฐœ์˜ LLM ์ƒ์„ฑ ์—ฐ๊ตฌ ๋ฌธ์„œ ์ค‘ 14%๊ฐ€ 5์ (์ง์ ‘ ํ‘œ์ ˆ), 10%๊ฐ€ 4์ (ํ˜ผํ•ฉ ์ฐจ์šฉ)์œผ๋กœ ์ด 24%๊ฐ€ ๊ฒ€์ฆ๋œ ํ‘œ์ ˆ ์‚ฌ๋ก€์ด๋ฉฐ, ์ด๋Š” ์ถœ์ฒ˜ ๋…ผ๋ฌธ ์ €์ž๋“ค์˜ ๊ต์ฐจ ๊ฒ€์ฆ์„ ๊ฑฐ์นจ
  2. ๊ด‘๋ฒ”์œ„ํ•œ ์œ ์‚ฌ์„ฑ: ๋‚˜๋จธ์ง€ 76%์˜ ๋ฌธ์„œ๋„ ๊ธฐ์กด ์ž‘์—…๊ณผ ๋‹ค์–‘ํ•œ ์ •๋„์˜ ์œ ์‚ฌ์„ฑ์„ ๋ณด์ด๋ฉฐ, ์™„์ „ํžˆ ์ƒˆ๋กœ์šด ๊ฒƒ์œผ๋กœ ๋ณด์ด๋Š” ์†Œ์ˆ˜์˜ ๊ฒฝ์šฐ๋ฅผ ์ œ์™ธํ•˜๊ณ ๋Š” ๋Œ€๋ถ€๋ถ„ ๊ธฐ์กด ์—ฐ๊ตฌ์™€ ์—ฐ๊ฒฐ๋˜์–ด ์žˆ์Œ
  3. ์ถœ์ฒ˜ ๋ฏธ์ธ์ •: ํ‰๊ฐ€๋œ LLM ์ƒ์„ฑ ๋ฌธ์„œ๋“ค์ด ์›๋ณธ ์ถœ์ฒ˜๋ฅผ ์ธ์ •ํ•˜์ง€ ์•Š์œผ๋ฉฐ, Si et al. (2024)๊ณผ Lu et al. (2024a)์˜ ์ €๋ช…ํ•œ ์˜ˆ์‹œ๋“ค๋„ ํ‘œ์ ˆ๋˜์—ˆ๊ฑฐ๋‚˜ ๊ธฐ์กด ์ž‘์—…๊ณผ ์ƒ๋‹นํžˆ ์œ ์‚ฌํ•œ ๊ฒƒ์œผ๋กœ ๋ฐœ๊ฒฌ๋จ
  4. ์ž๋™ํ™” ํƒ์ง€ ์‹คํŒจ: SSAG(Semantic Scholar Augmented Generation), OpenScholar, Turnitin ๋“ฑ์˜ ์ž๋™ํ™”๋œ ํ‘œ์ ˆ ํƒ์ง€ ๋ฐฉ๋ฒ•๋“ค์ด LLM ์ƒ์„ฑ ์—ฐ๊ตฌ ์ œ์•ˆ์„œ์˜ ํ‘œ์ ˆ์„ ์ ์ ˆํžˆ ํƒ์ง€ํ•˜์ง€ ๋ชปํ•˜๋ฉฐ, ํ†ต์ œ ์‹คํ—˜์„ ํ†ตํ•ด ์ด๋ฅผ ์ž…์ฆํ•จ

How

Figure 3

๊ทธ๋ฆผ 3: ์ œ๋ชฉ๊ณผ ์ดˆ๋ก์„ ์—ฐ๊ฒฐํ•œ PCA ํˆฌ์˜ ๋ถ„์„

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์ž๋™ํ™” ์—ฐ๊ตฌ์˜ ์ฐธ์‹ ์„ฑ์— ๋Œ€ํ•œ ๋‚™๊ด€๋ก ์— ์ค‘์š”ํ•œ ์ œ๋™์„ ๊ฑธ๋ฉฐ, ์ฒด๊ณ„์ ์ธ ์ „๋ฌธ๊ฐ€ ํ‰๊ฐ€๋ฅผ ํ†ตํ•ด 24%์˜ ๊ฒ€์ฆ๋œ ํ‘œ์ ˆ์„ ์ž…์ฆํ•œ๋‹ค. ๊ธฐ์กด ์ž๋™ํ™” ํƒ์ง€ ์‹œ์Šคํ…œ์˜ ํ•œ๊ณ„๋ฅผ ๋ช…ํ™•ํžˆ ๋“œ๋Ÿฌ๋‚ธ ์ ์—์„œ ํ•™์ˆ  ์ถœํŒ ์ปค๋ฎค๋‹ˆํ‹ฐ์— ์ฆ‰๊ฐ์ ์ธ ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ๋Š” ์˜๋ฏธ ์žˆ๋Š” ์—ฐ๊ตฌ์ด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
352๋ฒˆ From AI for Science to Agentic Science ์„œ๋ฒ ์ด๋Š” AI ์—ฐ๊ตฌ ์ž๋™ํ™”์˜ ๊ฐ€๋Šฅ์„ฑ๊ณผ ๋ฆฌ์Šคํฌ๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, 093๋ฒˆ์—์„œ ์ง€์ ํ•˜๋Š” ์ž๋™ํ™” ํ‘œ์ ˆ ๋ฌธ์ œ ๋…ผ์˜์˜ ํฌ๊ด„์  ๋ฐฐ๊ฒฝ์ด ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ณธ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ์ž๋™์ž‘์„ฑ์ด ๋‚ด์šฉ ๋‹ค์–‘์„ฑ ๊ฐ์†Œ๋ฅผ ์•ผ๊ธฐํ•จ์„ ๋ถ„์„ํ•ด ํ‘œ์ ˆ ๋ฌธ์ œ ๋…ผ์˜์™€ ๋งฅ๋ฝ์„ ๊ณต์œ ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
885๋ฒˆ ๋…ผ๋ฌธ์˜ arXiv ์ฒ ํšŒ ๋ฐ์ดํ„ฐ์…‹์€ 093๋ฒˆ์˜ AI ์ƒ์„ฑ ํ‘œ์ ˆ ์‚ฌ๋ก€์™€ ๊ทธ ์˜ํ–ฅ(์‹ค์ œ ๋…ผ๋ฌธ ์ฒ ํšŒ)๊นŒ์ง€ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ๋Š” ์‹ค์ œ์  ์—ฐ์†์„ฑ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Detecting LLM-written Peer Reviews ๋…ผ๋ฌธ์€ LLM์ด ์ž‘์„ฑํ•œ ํ…์ŠคํŠธ์˜ ์‹๋ณ„ยท๊ฒ€์ฆ ๊ด€์ ์—์„œ ํ‘œ์ ˆ ๋ฌธ์ œ ๋Œ€์ฑ…์„ ๋…ผ์˜ํ•จ์œผ๋กœ์จ, ์ž๋™ ๋…ผ๋ฌธ ์ƒ์„ฑ ํ‘œ์ ˆ ๋ถ„์„์„ ์‹ค์งˆ์ ์œผ๋กœ ํ™•์žฅํ•ด ์ค€๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Peer review์—์„œ AI ํ…์ŠคํŠธ ํƒ์ง€ ๋ฐฉ๋ฒ•์„ ์‹ค์ œ๋กœ ์กฐ์‚ฌํ•˜๋ฉฐ ํ‘œ์ ˆ ๋ฐ AI ์ƒ์„ฑ๋ฌผ์˜ ๊ฒ€์ถœ ๋ฌธ์ œ์— ์‘์šฉํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •