Unveiling the sentinels: Assessing ai performance in cybersecurity peer review

์ €์ž: Liang Niu, Nian Xue, Christina Pรถpper | ๋‚ ์งœ: 2023 | DOI: ๋ฏธ์ œ๊ณต 📄 PDF


Essence

Figure 1

๋…ผ๋ฌธ ๋ถ„๋ฅ˜ ๋ชจ๋ธ์˜ ํŒŒ์ดํ”„๋ผ์ธ: ์ฒซ ๋‹จ๊ณ„๋Š” Doc2Vec ๊ธฐ๋ฐ˜ ๋ฌธ์„œ ์ž„๋ฒ ๋”ฉ, ๋‘ ๋ฒˆ์งธ ๋‹จ๊ณ„๋Š” ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ํ†ตํ•œ ์ˆ˜์šฉ/๊ฑฐ์ ˆ ์˜ˆ์ธก

๋ณธ ์—ฐ๊ตฌ๋Š” ์ธ๊ณต์ง€๋Šฅ์ด ์‚ฌ์ด๋ฒ„๋ณด์•ˆ ํ•™์ˆ ์ง€ ๋™๋ฃŒ ๊ฒ€ํ† (peer review) ๊ณผ์ •์—์„œ ์–ผ๋งˆ๋‚˜ ํšจ๊ณผ์ ์œผ๋กœ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•  ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ์ •๋Ÿ‰์ ์œผ๋กœ ํ‰๊ฐ€ํ•œ๋‹ค. Doc2Vec ๊ธฐ๋ฐ˜ ๋‘ ๋‹จ๊ณ„ ๋ถ„๋ฅ˜ ์ ‘๊ทผ๋ฒ•์ด 91% ์ด์ƒ์˜ ์ •ํ™•๋„๋กœ ๋…ผ๋ฌธ์˜ ์ˆ˜์šฉ/๊ฑฐ์ ˆ์„ ์˜ˆ์ธกํ•˜๋ฉฐ, ChatGPT๋ฅผ ํฌ๊ฒŒ ์ƒํšŒํ•œ๋‹ค.

Motivation

Achievement

Figure 2

"Big-4" ๋ณด์•ˆํ•™์ˆ ์ง€์˜ ๋™๋ฃŒ ๊ฒ€ํ†  ํŒจ๋Ÿฌ๋‹ค์ž„: ์ด์ค‘๋งน๊ฒ€ ๊ฒ€ํ†  ํ”„๋กœ์„ธ์Šค์˜ ๊ตฌ์กฐํ™”๋œ ํ๋ฆ„

  1. ๋†’์€ ์˜ˆ์ธก ์ •ํ™•๋„: Doc2Vec ๊ธฐ๋ฐ˜ ๋ถ„๋ฅ˜ ๋ชจ๋ธ์ด 91% ์ด์ƒ์˜ ์ •ํ™•๋„๋กœ ๋ณด์•ˆ ๋…ผ๋ฌธ์˜ ์ˆ˜์šฉ/๊ฑฐ์ ˆ ์˜ˆ์ธก ๋‹ฌ์„ฑ. ChatGPT์˜ ์„ฑ๋Šฅ์„ ํฌ๊ฒŒ ์ดˆ๊ณผ
  2. ๋Œ€๊ทœ๋ชจ ๋ณด์•ˆ ํ•™์ˆ  ๋ฐ์ดํ„ฐ์…‹: 14,000ํŽธ ์ด์ƒ์˜ ๋…ผ๋ฌธ์„ ํฌํ•จํ•˜๋Š” ์ข…ํ•ฉ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•. ์ด๋Š” ํ–ฅํ›„ ์œ ์‚ฌ ์—ฐ๊ตฌ์˜ ๋ฒค์น˜๋งˆํฌ ์ œ๊ณต
  3. ์ถ”์ƒ(abstract) ๊ธฐ๋ฐ˜ ์˜ˆ์ธก ๋ฐ ์‹ ๊ทœ ๋…ผ๋ฌธ ์ฒ˜๋ฆฌ: ์ „์ฒด ๋…ผ๋ฌธ๋ฟ ์•„๋‹ˆ๋ผ ์ถ”์ƒ ์ •๋ณด๋งŒ ํ™œ์šฉํ•œ ์˜ˆ์ธก, ํ•™์Šต ๋ฐ์ดํ„ฐ์— ์—†๋Š” ์‹ ๊ทœ ๋…ผ๋ฌธ ์ฒ˜๋ฆฌ ๊ฐ€๋Šฅ์„ฑ ์ž…์ฆ
  4. AI์˜ ํ•œ๊ณ„์™€ ์—ญํ•  ๊ทœ๋ช…: ML ๊ธฐ๋ฒ•์ด ๊ธฐ์ˆ ์  ์ •๋‹น์„ฑ, ์‹คํ—˜ ์™„์„ฑ๋„ ๋“ฑ ๊ฐ๊ด€์  ์š”์†Œ๋Š” ํฌ์ฐฉํ•˜๋‚˜, ์ฐฝ์˜์„ฑยทํ˜์‹ ์„ฑ ๋“ฑ ์ฃผ๊ด€์  ๊ฐ€์น˜ ํŒ๋‹จ์€ ๋ถˆ๊ฐ€๋Šฅํ•จ์„ ์‹ค์ฆ์ ์œผ๋กœ ์ œ์‹œ

How

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3.5/5 Significance: 4/5 Clarity: 4/5 Overall: 3.8/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ์‚ฌ์ด๋ฒ„๋ณด์•ˆ ํ•™์ˆ ์ง€์˜ ๋™๋ฃŒ ๊ฒ€ํ† ๋ฅผ AI๋กœ ์˜ˆ์ธกํ•˜๋Š” ์ตœ์ดˆ์˜ ์ •๋Ÿ‰ ์—ฐ๊ตฌ๋กœ์„œ ์‹ค๋ฌด์ ยทํ•™์ˆ ์  ์˜์˜๊ฐ€ ์žˆ์œผ๋‚˜, ์Œ์„ฑ ์ƒ˜ํ”Œ์˜ ๊ทผ์‚ฌ์„ฑ, ๊ธฐ์ˆ  ๋ฐฉ๋ฒ•๋ก ์˜ ๋ณด์ˆ˜์„ฑ, ๊ทธ๋ฆฌ๊ณ  ์ฃผ๊ด€์  ํ‰๊ฐ€ ์š”์†Œ๋ฅผ ํฌ์ฐฉํ•˜์ง€ ๋ชปํ•œ๋‹ค๋Š” ๊ทผ๋ณธ์  ํ•œ๊ณ„๋กœ ์ธํ•ด AI๊ฐ€ ์ธ๊ฐ„ ๊ฒ€ํ† ์ž๋ฅผ ์™„์ „ํžˆ ๋Œ€์ฒดํ•  ์ˆ˜ ์—†์Œ์„ ๋ณด์—ฌ์ค€๋‹ค. ์ด๋Š” ์—ญ์„ค์ ์œผ๋กœ ์—ฐ๊ตฌ์˜ ๊ฐ€์น˜๋ฅผ ์ž…์ฆํ•œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
629 ๋…ผ๋ฌธ์€ Peer Review ํ‰๊ฐ€์— ํŠนํ™”๋œ LLM ํ‰๊ฐ€๊ธฐ์ œ ์—ฐ๊ตฌ๋กœ, 860์˜ ์‚ฌ์ด๋ฒ„๋ณด์•ˆ ํ•™์ˆ ์ง€ ์ž๋™ ํ‰๊ฐ€์˜ ๊ธฐ์ˆ ์  ๋ฐฐ๊ฒฝ์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Unveiling the sentinels ๋…ผ๋ฌธ์€ ๋™๋ฃŒ์‹ฌ์‚ฌ ์ˆ˜์šฉ/๊ฑฐ์ ˆ ์˜ˆ์ธก์˜ ์ž๋™ํ™” ๊ฐ€๋Šฅ์„ฑ๊ณผ ํ•œ๊ณ„๋ฅผ ๊ฐ๊ด€์ ์œผ๋กœ ๋ถ„์„ํ•˜์—ฌ, LLM ๊ธฐ๋ฐ˜ Peerarg์˜ ๋…ผ์ฆํ˜• ๋ฆฌ๋ทฐ ์ž๋™ํ™” ์˜์˜์™€ ์„ฑ๊ณผ ํ‰๊ฐ€์— ํ•ต์‹ฌ์  ๊ทผ๊ฑฐ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
664๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ๊ด€๋ จ์„ฑ ํ‰๊ฐ€ ๋ฒค์น˜๋งˆํฌ๋ฅผ ๋„์ž…ํ•˜์—ฌ, 860๋ฒˆ์˜ ๋…ผ๋ฌธ ์ˆ˜์šฉ/๊ฑฐ์ ˆ ์˜ˆ์ธก๊ณผ ์œ ์‚ฌ ๋ถ„์•ผ ๋‚ด ๋‹ค๋ฅธ ํ‰๊ฐ€ ๋ฐฉ์‹์œผ๋กœ ์ฐธ๊ณ ํ•  ๋งŒํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋™์  ์งˆ๋ฌธ ์ ์‘ ๋˜๋Š” ์Šค์ผ€์ผ๋Ÿฌ๋ธ” AI ๋ฆฌ๋ทฐ ์‹œ์Šคํ…œ์„ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI์˜ ๋…ผ๋ฌธ ์‹ฌ์‚ฌ ํ‰๊ฐ€๋Šฅ๋ ฅ ์ธก์ •์„ ๋‹ค๋ฅธ ํ‰๊ฐ€ ๊ธฐ์ค€ ๋ฐ ๋ฐ์ดํ„ฐ์…‹์—์„œ ๊ตฌํ˜„ํ•œ ์‚ฌ๋ก€๋กœ ๋ณผ ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
270์€ LLM์ด ์ž‘์„ฑํ•œ ๋ฆฌ๋ทฐ ํƒ์ง€ ๋ฐฉ์‹์„ ์ œ์•ˆํ•˜์—ฌ, 860๊ณผ ๋‹ฌ๋ฆฌ AI ๋ฆฌ๋ทฐ ์ž๋™ ํŒ๋ณ„ ์ ‘๊ทผ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Unveiling the sentinels: Assessing ai performance in cybersecurity ๋…ผ๋ฌธ์€ ๋ถˆํ™•์‹ค์„ฑ(uncertainty)์„ ๋‹ค๋ฃจ๋Š” ์ƒ์„ฑ ๋ชจ๋ธ์˜ ์‹ค์ œ ์‘์šฉ ๋ถ„์•ผ ์‚ฌ๋ก€๋ฅผ ๋ณด์ธ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Peerarg ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ํ”ผ์–ด ๋ฆฌ๋ทฐ ์ž๋™ํ™”์—์„œ ๋…ผ์ฆ ๊ตฌ์กฐํ™”๋ฅผ ํ†ตํ•ด ๋ฆฌ๋ทฐ ํŒ๋‹จ์˜ ๋…ผ๋ฆฌ์  ๊ทผ๊ฑฐ์™€ ํ•ด์„๋ ฅ์„ ๊ฐ•์กฐํ•˜๋ฉฐ, 860์˜ ์ž๋™ ๋ถ„๋ฅ˜๋ณด๋‹ค ์‹ฌํ™”๋œ ํ‰๊ฐ€ ๋ฐฉ์‹์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ํ‰๊ฐ€ ์ž๋™ํ™”์˜ ์‹ค์ œ ํšจ๊ณผ์™€ ์‚ฌ์šฉ ์‚ฌ๋ก€, ํ”„๋กฌํ”„ํŠธ ์ตœ์ ํ™”, ๋ฆฌ๋ทฐ ํ’ˆ์งˆ ๋น„๊ต ๊ฐ€๋Šฅ์„ฑ๊นŒ์ง€ ๋ณด์—ฌ์ค€๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๋™์‹œ ์‹คํ–‰ ๊ฐ€๋Šฅ ์ œ์–ด ์ •์ฑ…์˜ ํ•™์Šต ์•ˆ์ „์„ฑยท์‹ ๋ขฐ์„ฑ ๋ฌธ์ œ๋ฅผ ์‹ค์ œ ์‚ฌ์ด๋ฒ„๋ณด์•ˆ ํ‰๊ฐ€ ๋งฅ๋ฝ์— ์ ์šฉํ•œ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
445๋Š” ํ•™์ˆ ์ง€์—์„œ LLM ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ๊ฐ€ ์‚ฌ์šฉ๋˜๋Š”์ง€์— ๋Œ€ํ•œ ์‹ค์ฆ์  ํƒ์ƒ‰์œผ๋กœ, 860์˜ AI ์˜ˆ์ธก ๊ธฐ๋ฐ˜ ํ‰๊ฐ€์™€ ๋Œ€์กฐ์  ์‹œ๊ฐ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •