Essence
ML/AI ํ์ ๋ํ์ ์๋ํ๋ ์ฌ์ฌ์์ ๋ฐฐ์ ์์คํ
์์ ํ
์คํธ ๋งค์นญ(text-matching) ์๊ณ ๋ฆฌ์ฆ์ด ๋ดํฉ(collusion) ๊ณต๊ฒฉ์ ์ทจ์ฝํจ์ ์
์ฆํ๋ค. SPECTER ์๋ฒ ๋ฉ ๊ธฐ๋ฐ์ ์ ์ฌ๋ ๊ณ์ฐ์ด ๊ณต๋ชจํ๋ ์ ์์ ์ฌ์ฌ์์์ ์ํด ์กฐ์๋ ์ ์์ผ๋ฉฐ, ์ด๋ฅผ ํตํด ์ฌ์ฌ์์์ ์์๋ฅผ 101์์์ ์์ 5์๋ก ์ฌ๋ฆด ์ ์์์ ๋ณด์๋ค.
Evaluation
Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.25/5
์ดํ: ์ด ๋
ผ๋ฌธ์ ์๋ํ๋ ํ์ ์ฌ์ฌ ์์คํ
์ ํ
์คํธ ๋งค์นญ ๊ธฐ๋ฐ ์ฌ์ฌ์์ ๋ฐฐ์ ์ด ์์์ธ๋ก ๋ดํฉ์ ์ทจ์ฝํจ์ ์ฒ์ ์
์ฆํ๋ฉฐ, NeurIPS ์ค์ ๋ฐ์ดํฐ๋ก 92% ๊ณต๊ฒฉ ์ฑ๊ณต๋ฅ ์ ๋ฌ์ฑํ๋ค. ์ด๋ฏธ OpenReview ๋ฑ ์ฃผ์ ํ๋ซํผ์ ๋ณด์ ๊ฐ์ ์ด ์ ์ฉ๋์ด ์ค์ง์ ์ํฅ๋ ฅ์ ๋ฐํํ๊ณ ์๋ ์ค์ํ ๋ณด์ ์ฐ๊ตฌ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
ํ์ ๋ํ ์ฌ์ฌ ๊ณผ์ ์์ LLM ๊ธ ํ๋ณ ์ทจ์ฝ์ (ํ
์คํธ ๋งค์นญ)์ด ํผ๋๋ฐฑ ์์คํ
๋์
๋๋ ์ฌ์ฌ์ ํ๋ฆฌํฐ ๊ด๋ฆฌ ๋ฌธ์ ์ ์ด๋ป๊ฒ ์ฐ๊ด๋ ์ ์๋์ง ํต์ฐฐ์ ์ค๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
870๋ฒ ๋
ผ๋ฌธ์ ํ
์คํธ ๋งค์นญ์ ๊ธฐ๋ฐํ ๋ฆฌ๋ทฐ ํ์ง ํ๊ฐ ์ทจ์ฝ์ฑ์ ์ง์ ํ์ฌ, 537๋ฒ ๋
ผ๋ฌธ์ ์๋ ์ฃผ์ ์ฒ๋ฆฌ ๊ธฐ๋ฐ ํ๊ฐ์ ํ๊ณ์ ์ฅ์ ์ ํ์ค์ ์ผ๋ก ์กฐ๋ช
ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
870 ๋
ผ๋ฌธ์ ํ์ ๋
ผ๋ฌธ ํ๊ฐ(ํ
์คํธ ๋งค์นญ)์ ํ๊ณ์ ์ทจ์ฝ์ ์ ์ง์ ํ์ฌ, 3037์ ๋๊ตฌ ํ๊ฐ ์ ๋ขฐ๋ ๋ฐ ๋์ถ ์งํ ํด์ ์ ์ฐธ๊ณ ํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ ๋
ผ๋ฌธ ๋ชจ๋ AI ๊ธฐ๋ฐ ํ์ ๋ํ ์ฌ์ฌ์์ ๋ฐฐ์ ์ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๋, 070์ ์๋ฎฌ๋ ์ด์
๊ธฐ๋ฐ ๋ถ์์ ์ด์ ์ ๋๊ณ 870์ ์ทจ์ฝ์ ์ค์ฆ์ ์ง์คํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
Vulnerability of text-matching in ml/ai conference reviewer ๋
ผ๋ฌธ์ ๋ฆฌ๋ทฐ๊ณผ์ ์์์ LLM ๊ธฐ๋ฐ ํ์ ํ์ง ๋ฐ ์ทจ์ฝ์ ์ด์๋ฅผ ๋ถ์ํ๋ฉฐ, LLM ํ์ฉ ์ํ์ฑ์ ๋ค์ํ ์์์ ๋
ผ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
Is Your Paper Being Reviewed by an LLM ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ํ
์คํธ๋งค์นญ ๋ฐ ์๋ ์ฌ์ฌ์ ์ ๋ขฐ์ฑ๊ณผ ํ๊ณ๋ฅผ ๋ค๋ฃจ์ด ํ
์คํธ ๋งค์นญ ๊ธฐ๋ฐ ๋ฐฐ์ ์ทจ์ฝ์ฑ ๋
ผ๋ฌธ๊ณผ ์ํธ๋ณด์์ ๋ถ์์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ReviewEval ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ ์ฌ์ฌ ํ๊ฐ์ ๊ณต์ ์ฑ๊ณผ ์ ๋ขฐ์ฑ ํ๋ณด๋ผ๋ ๊ด์ ์์ text-matching ์ทจ์ฝ์ ๊ทน๋ณต์ ์ํ ๋ ๋ค๋ฅธ ํ๊ฐ๋ฐฉ๋ฒ์ ์ฐ๊ตฌํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ๊ธฐ๋ฐ ์ฐ๊ตฌ์ง์ ๋ฐ ๊ณต์ ์ฑ, ํฌ๋ช
์ฑ์ ์ ์ฌ์ ๋ฆฌ์คํฌ๋ฅผ ์ ๊ฒํ๋ ์๊ฐ์ผ๋ก 870๋ฒ ๋
ผ๋ฌธ์ ๋
ผ์๋ฅผ ํ์ฅํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
์ฌ์ฌ ๋ฐฐ์ ๋ฐ ์ธ์ฉ์ถ์ฒ์ ๊ณต์ ์ฑ, ๋ฉํธ๋ฆญ ์ผ๊ด์ฑ ๋ฌธ์ ๋ฅผ ๋ค๋ค 870๋ฒ ๋
ผ๋ฌธ์ MLํํ ์ฌ์ฌ์์คํ
์ทจ์ฝ์ฑ ๋ฌธ์ ์ ์ง์ ์ ์ผ๋ก ์ฐ๊ฒฐ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
628 ๋
ผ๋ฌธ์ AI ์ปจํผ๋ฐ์ค ์ฌ์ฌ ์์คํ
์ ๊ทผ๋ณธ์ ์๊ธฐ๋ฅผ ๋
ผ์ํ๋ฉฐ, 870์ ์ทจ์ฝ์ ์ฌ๋ก๋ฅผ ์ ๋์ ๊ด์ ์์ ํ์ฅ์ ์ผ๋ก ๋ถ์ํ๋ค.
ํ์ ์ฐ๊ตฌ
AI๊ฐ ๊ณผํ ์ ๋ฐ์ ๋ฏธ์น๋ ์ํฅ, ์ค๋ฆฌ ๋ฐ ๊ณต์ ์ฑ ์ด์๋ฅผ ์ข
ํฉ์ ์ผ๋ก ๋ค๋ฃจ๋ฉฐ ์ฌ์ฌ ์์คํ
์ ๋ณด์ ๋ฐ ์ํ ์ฌ๋ก์๋ ์ฐ๊ฒฐ๋๋ค.
์์ฉ ์ฌ๋ก
AI ๊ธฐ๋ฐ ๋๋ฃํ๊ฐ ์๋ํ์ ์ฌ์ฌ ์์คํ
์ ์ทจ์ฝ์ ๋ฌธ์ ๋ฅผ ์ค์ ๋ฆฌ๋ทฐ ํ๋ก์ธ์ค ์๋ํ ๋งฅ๋ฝ์์ ์์ฉํ ์ ์๋ค.
์์ฉ ์ฌ๋ก
์ธ์ฉ์ถ์ฒ, ์ฌ์ฌ ๋ฐฐ์ , reviewer-author ๊ฐ ์ธ์ฉ ํจํด ๋ฑ ํ๊ฐ ๋ฉํธ๋ฆญ์ ์ค์ง์ ์ทจ์ฝ์ฑ ๋ฐ ์กฐ์ ๋ฆฌ์คํฌ ๋
ผ์๋ฅผ ํ๋ํ ์ ์์ต๋๋ค.
์์ฉ ์ฌ๋ก
591์ OpenReview ์์คํ
์ ํ์ฉ๊ณผ ๋ณดํธ ํ์์ฑ์ ์ ์ํ๋ฉฐ, 870์์ ๋ค๋ฃฌ ์ฌ์ฌ ๊ณผ์ ์ ์ทจ์ฝ์ ์ด ์ค์ ํ๋ซํผ์ ๋ฏธ์น๋ ์ํฅ์ ๋
ผ์ํ๋ค.