Vulnerability of text-matching in ml/ai conference reviewer assignments to collusions

์ €์ž: Jhih-Yi Hsieh, Aditi Raghunathan, Nihar B. Shah | ๋‚ ์งœ: 2024 | DOI: N/A 📄 PDF


Essence

ML/AI ํ•™์ˆ ๋Œ€ํšŒ์˜ ์ž๋™ํ™”๋œ ์‹ฌ์‚ฌ์œ„์› ๋ฐฐ์ • ์‹œ์Šคํ…œ์—์„œ ํ…์ŠคํŠธ ๋งค์นญ(text-matching) ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๋‹ดํ•ฉ(collusion) ๊ณต๊ฒฉ์— ์ทจ์•ฝํ•จ์„ ์ž…์ฆํ•œ๋‹ค. SPECTER ์ž„๋ฒ ๋”ฉ ๊ธฐ๋ฐ˜์˜ ์œ ์‚ฌ๋„ ๊ณ„์‚ฐ์ด ๊ณต๋ชจํ•˜๋Š” ์ €์ž์™€ ์‹ฌ์‚ฌ์œ„์›์— ์˜ํ•ด ์กฐ์ž‘๋  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ์‹ฌ์‚ฌ์œ„์›์˜ ์ˆœ์œ„๋ฅผ 101์œ„์—์„œ ์ƒ์œ„ 5์œ„๋กœ ์˜ฌ๋ฆด ์ˆ˜ ์žˆ์Œ์„ ๋ณด์˜€๋‹ค.

Motivation

Achievement

Figure 1: ๊ณต๊ฒฉ ์ ˆ์ฐจ์˜ ์˜ˆ์‹œ - ์‹ฌ์‚ฌ์œ„์›์˜ ๋…ผ๋ฌธ ์„ ๋ณ„ ํ–‰๋™(1a)๊ณผ ์ €์ž์˜ ์ดˆ๋ก ์ˆ˜์ • ํ–‰๋™(1b)

๋‹ดํ•ฉํ•˜๋Š” ์ €์ž์™€ ์‹ฌ์‚ฌ์œ„์›์˜ ํ˜‘๋ ฅ ๊ณต๊ฒฉ ๋ฉ”์ปค๋‹ˆ์ฆ˜ illustration

  1. SPECTER ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ์ทจ์•ฝ์„ฑ ์ž…์ฆ: NeurIPS 2023 ๋ฐ์ดํ„ฐ์—์„œ ์ œ์•ˆ ๊ณต๊ฒฉ์ด 92% ์„ฑ๊ณต๋ฅ ๋กœ ์‹ฌ์‚ฌ์œ„์› ์ˆœ์œ„๋ฅผ 101์œ„โ†’์ƒ์œ„5์œ„๋กœ ์ƒํ–ฅ. ์ตœ๋Œ€๊ฐ’ ํ’€๋ง(max pooling) ์‚ฌ์šฉ ์‹œ ๋”์šฑ ์ทจ์•ฝ(49% vs. ํ‰๊ท ๊ฐ’ 32%).
  2. ํฌ๋กœ์Šค ์—ฐ๋„ ์˜ˆ์ธก ๊ฐ€๋Šฅ์„ฑ: NeurIPS 2022(๊ณต๊ฐœ ๋ฐ์ดํ„ฐ)์™€ 2023(๋ฏธ๊ณต๊ฐœ ๋ฐ์ดํ„ฐ) ๊ฐ„ ์œ ์‚ฌ๋„ ์ˆœ์œ„์˜ ๊ฐ•ํ•œ ์ƒ๊ด€๊ด€๊ณ„(r=0.62~0.93) ๋ฐœ๊ฒฌ. ๊ณต๊ฒฉ์ž๊ฐ€ ๊ณผ๊ฑฐ ๋ฐ์ดํ„ฐ๋กœ ์„ฑ๊ณต ๊ฐ€๋Šฅ์„ฑ ์‚ฌ์ „ ํ‰๊ฐ€ ๊ฐ€๋Šฅ.
  3. ํ”„๋กœํ•„ ์„ ๋ณ„ ๊ธฐ๋ฐ˜ ๊ณต๊ฒฉ: ์‹ฌ์‚ฌ์œ„์›์ด ์ž์‹ ์˜ ๊ณผ๊ฑฐ ๋…ผ๋ฌธ์„ ์„ ํƒ ๊ฐ€๋Šฅํ•œ ๊ฒฝ์šฐ, ๋‹จ 1๊ฐœ์˜ ๊ฐ€์žฅ ์œ ์‚ฌํ•œ ๋…ผ๋ฌธ๋งŒ ์„ ํƒํ•˜๋ฉด ์ถ”์ƒ ์ˆ˜์ • ์—†์ด๋„ 41% ์„ฑ๊ณต๋ฅ  ๋‹ฌ์„ฑ.
  4. ํƒ์ง€ ๊ฐ€๋Šฅ์„ฑ์˜ ์ด์ค‘์„ฑ: ์ธ๊ฐ„ ํ”ผํ—˜์ž๊ฐ€ ๊ณต๊ฒฉ๋œ ์ถ”์ƒ์„ ๋” ์ž์ฃผ ์ง€์ (coherence/consistency ๋ฌธ์ œ)ํ•˜๋‚˜, ์ •์ƒ ์ถ”์ƒ๋„ ์ƒ๋‹น ๋น„์œจ ์ง€์ ๋ฐ›์Œ(plausible deniability ์ œ๊ณต).

How

Figure 4: ์‹ฌ์‚ฌ์œ„์›์ด ๋ณด์œ ํ•  ๋…ผ๋ฌธ ๊ฐœ์ˆ˜๋ณ„ ๊ณต๊ฒฉ ์„ฑ๊ณต๋ฅ  ๋ณ€ํ™”

ํ”„๋กœํ•„ ์„ ๋ณ„(adversarial curation)์— ๋”ฐ๋ฅธ ์„ฑ๊ณต๋ฅ  ํŽธ์ฐจ

Figure 5: 2022๋…„๊ณผ 2023๋…„ NeurIPS์˜ ์กฐ์ž‘๋œ ์ˆœ์œ„ ๊ฐ•ํ•œ ์ƒ๊ด€๊ด€๊ณ„

๊ณผ๊ฑฐ ๋ฐ์ดํ„ฐ๋กœ ๋ฏธ๋ž˜ ๊ณต๊ฒฉ ์„ฑ๊ณต๋ฅ  ์˜ˆ์ธก ๊ฐ€๋Šฅ์„ฑ

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.25/5

์ดํ‰: ์ด ๋…ผ๋ฌธ์€ ์ž๋™ํ™”๋œ ํ•™์ˆ  ์‹ฌ์‚ฌ ์‹œ์Šคํ…œ์˜ ํ…์ŠคํŠธ ๋งค์นญ ๊ธฐ๋ฐ˜ ์‹ฌ์‚ฌ์œ„์› ๋ฐฐ์ •์ด ์˜ˆ์ƒ์™ธ๋กœ ๋‹ดํ•ฉ์— ์ทจ์•ฝํ•จ์„ ์ฒ˜์Œ ์ž…์ฆํ•˜๋ฉฐ, NeurIPS ์‹ค์ œ ๋ฐ์ดํ„ฐ๋กœ 92% ๊ณต๊ฒฉ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค. ์ด๋ฏธ OpenReview ๋“ฑ ์ฃผ์š” ํ”Œ๋žซํผ์— ๋ณด์•ˆ ๊ฐœ์„ ์ด ์ ์šฉ๋˜์–ด ์‹ค์งˆ์  ์˜ํ–ฅ๋ ฅ์„ ๋ฐœํœ˜ํ•˜๊ณ  ์žˆ๋Š” ์ค‘์š”ํ•œ ๋ณด์•ˆ ์—ฐ๊ตฌ์ด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ํ•™์ˆ ๋Œ€ํšŒ ์‹ฌ์‚ฌ ๊ณผ์ •์—์„œ LLM ๊ธ€ ํŒ๋ณ„ ์ทจ์•ฝ์ (ํ…์ŠคํŠธ ๋งค์นญ)์ด ํ”ผ๋“œ๋ฐฑ ์‹œ์Šคํ…œ ๋„์ž… ๋˜๋Š” ์‹ฌ์‚ฌ์ž ํ€„๋ฆฌํ‹ฐ ๊ด€๋ฆฌ ๋ฌธ์ œ์™€ ์–ด๋–ป๊ฒŒ ์—ฐ๊ด€๋  ์ˆ˜ ์žˆ๋Š”์ง€ ํ†ต์ฐฐ์„ ์ค๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
870๋ฒˆ ๋…ผ๋ฌธ์€ ํ…์ŠคํŠธ ๋งค์นญ์— ๊ธฐ๋ฐ˜ํ•œ ๋ฆฌ๋ทฐ ํ’ˆ์งˆ ํ‰๊ฐ€ ์ทจ์•ฝ์„ฑ์„ ์ง€์ ํ•˜์—ฌ, 537๋ฒˆ ๋…ผ๋ฌธ์˜ ์ž๋™ ์ฃผ์„ ์ฒ˜๋ฆฌ ๊ธฐ๋ฐ˜ ํ‰๊ฐ€์˜ ํ•œ๊ณ„์™€ ์žฅ์ ์„ ํ˜„์‹ค์ ์œผ๋กœ ์กฐ๋ช…ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
870 ๋…ผ๋ฌธ์€ ํ•™์ˆ  ๋…ผ๋ฌธ ํ‰๊ฐ€(ํ…์ŠคํŠธ ๋งค์นญ)์˜ ํ•œ๊ณ„์™€ ์ทจ์•ฝ์ ์„ ์ง€์ ํ•˜์—ฌ, 3037์˜ ๋„๊ตฌ ํ‰๊ฐ€ ์‹ ๋ขฐ๋„ ๋ฐ ๋„์ถœ ์ง€ํ‘œ ํ•ด์„ ์‹œ ์ฐธ๊ณ ํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‘ ๋…ผ๋ฌธ ๋ชจ๋‘ AI ๊ธฐ๋ฐ˜ ํ•™์ˆ ๋Œ€ํšŒ ์‹ฌ์‚ฌ์œ„์› ๋ฐฐ์ •์˜ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ๋‚˜, 070์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ธฐ๋ฐ˜ ๋ถ„์„์— ์ดˆ์ ์„ ๋‘๊ณ  870์€ ์ทจ์•ฝ์  ์‹ค์ฆ์— ์ง‘์ค‘ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Vulnerability of text-matching in ml/ai conference reviewer ๋…ผ๋ฌธ์€ ๋ฆฌ๋ทฐ๊ณผ์ •์—์„œ์˜ LLM ๊ธฐ๋ฐ˜ ํ‘œ์ ˆ ํƒ์ง€ ๋ฐ ์ทจ์•ฝ์  ์ด์Šˆ๋ฅผ ๋ถ„์„ํ•˜๋ฉฐ, LLM ํ™œ์šฉ ์œ„ํ—˜์„ฑ์˜ ๋‹ค์–‘ํ•œ ์–‘์ƒ์„ ๋…ผ์˜ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Is Your Paper Being Reviewed by an LLM ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ํ…์ŠคํŠธ๋งค์นญ ๋ฐ ์ž๋™ ์‹ฌ์‚ฌ์˜ ์‹ ๋ขฐ์„ฑ๊ณผ ํ•œ๊ณ„๋ฅผ ๋‹ค๋ฃจ์–ด ํ…์ŠคํŠธ ๋งค์นญ ๊ธฐ๋ฐ˜ ๋ฐฐ์ • ์ทจ์•ฝ์„ฑ ๋…ผ๋ฌธ๊ณผ ์ƒํ˜ธ๋ณด์™„์  ๋ถ„์„์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewEval ๋…ผ๋ฌธ์€ AI ๊ธฐ๋ฐ˜ ์‹ฌ์‚ฌ ํ‰๊ฐ€์˜ ๊ณต์ •์„ฑ๊ณผ ์‹ ๋ขฐ์„ฑ ํ™•๋ณด๋ผ๋Š” ๊ด€์ ์—์„œ text-matching ์ทจ์•ฝ์  ๊ทน๋ณต์„ ์œ„ํ•œ ๋˜ ๋‹ค๋ฅธ ํ‰๊ฐ€๋ฐฉ๋ฒ•์„ ์—ฐ๊ตฌํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ์ง€์› ๋ฐ ๊ณต์ •์„ฑ, ํˆฌ๋ช…์„ฑ์˜ ์ž ์žฌ์  ๋ฆฌ์Šคํฌ๋ฅผ ์ ๊ฒ€ํ•˜๋Š” ์‹œ๊ฐ์œผ๋กœ 870๋ฒˆ ๋…ผ๋ฌธ์˜ ๋…ผ์˜๋ฅผ ํ™•์žฅํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์‹ฌ์‚ฌ ๋ฐฐ์ • ๋ฐ ์ธ์šฉ์ถ”์ฒœ์˜ ๊ณต์ •์„ฑ, ๋ฉ”ํŠธ๋ฆญ ์ผ๊ด€์„ฑ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ค„ 870๋ฒˆ ๋…ผ๋ฌธ์˜ MLํ•™ํšŒ ์‹ฌ์‚ฌ์‹œ์Šคํ…œ ์ทจ์•ฝ์„ฑ ๋ฌธ์ œ์™€ ์ง์ ‘์ ์œผ๋กœ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
628 ๋…ผ๋ฌธ์€ AI ์ปจํผ๋Ÿฐ์Šค ์‹ฌ์‚ฌ ์‹œ์Šคํ…œ์˜ ๊ทผ๋ณธ์  ์œ„๊ธฐ๋ฅผ ๋…ผ์˜ํ•˜๋ฉฐ, 870์˜ ์ทจ์•ฝ์  ์‚ฌ๋ก€๋ฅผ ์ œ๋„์  ๊ด€์ ์—์„œ ํ™•์žฅ์ ์œผ๋กœ ๋ถ„์„ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI๊ฐ€ ๊ณผํ•™ ์ „๋ฐ˜์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ, ์œค๋ฆฌ ๋ฐ ๊ณต์ •์„ฑ ์ด์Šˆ๋ฅผ ์ข…ํ•ฉ์ ์œผ๋กœ ๋‹ค๋ฃจ๋ฉฐ ์‹ฌ์‚ฌ ์‹œ์Šคํ…œ์˜ ๋ณด์•ˆ ๋ฐ ์œ„ํ˜‘ ์‚ฌ๋ก€์™€๋„ ์—ฐ๊ฒฐ๋œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AI ๊ธฐ๋ฐ˜ ๋™๋ฃŒํ‰๊ฐ€ ์ž๋™ํ™”์™€ ์‹ฌ์‚ฌ ์‹œ์Šคํ…œ์˜ ์ทจ์•ฝ์  ๋ฌธ์ œ๋ฅผ ์‹ค์ œ ๋ฆฌ๋ทฐ ํ”„๋กœ์„ธ์Šค ์ž๋™ํ™” ๋งฅ๋ฝ์—์„œ ์‘์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์ธ์šฉ์ถ”์ฒœ, ์‹ฌ์‚ฌ ๋ฐฐ์ •, reviewer-author ๊ฐ„ ์ธ์šฉ ํŒจํ„ด ๋“ฑ ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ์˜ ์‹ค์งˆ์  ์ทจ์•ฝ์„ฑ ๋ฐ ์กฐ์ž‘ ๋ฆฌ์Šคํฌ ๋…ผ์˜๋ฅผ ํ™•๋Œ€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
591์€ OpenReview ์‹œ์Šคํ…œ์˜ ํ™œ์šฉ๊ณผ ๋ณดํ˜ธ ํ•„์š”์„ฑ์„ ์ œ์•ˆํ•˜๋ฉฐ, 870์—์„œ ๋‹ค๋ฃฌ ์‹ฌ์‚ฌ ๊ณผ์ •์˜ ์ทจ์•ฝ์ ์ด ์‹ค์ œ ํ”Œ๋žซํผ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ๋…ผ์˜ํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •