The open review-based (orb) dataset: Towards automatic assessment of scientific papers and experiment proposals in high-energy physics

์ €์ž: Jarosล‚aw Szumega, Lamine Bougueroua, Blerina Gkotse, Pierre Jouvelot, Federico Ravotti | ๋‚ ์งœ: 2023 | DOI: ๋ฏธ๋ช…์‹œ 📄 PDF


Essence

๋ณธ ๋…ผ๋ฌธ์€ OpenReview.net๊ณผ SciPost.org์—์„œ ์ˆ˜์ง‘ํ•œ 36,000๊ฐœ ์ด์ƒ์˜ ๊ณผํ•™๋…ผ๋ฌธ๊ณผ 89,000๊ฐœ ์ด์ƒ์˜ ํ”ผ์–ด๋ฆฌ๋ทฐ๋กœ ๊ตฌ์„ฑ๋œ ๊ณต๊ฐœ ํ”ผ์–ด๋ฆฌ๋ทฐ ๋ฐ์ดํ„ฐ์…‹(ORB: Open Review-Based dataset)์„ ์†Œ๊ฐœํ•œ๋‹ค. NLP ๊ธฐ๋ฐ˜ ์ž๋™ ๋…ผ๋ฌธ ํ‰๊ฐ€ ๋ฐ ๊ณ ์—๋„ˆ์ง€๋ฌผ๋ฆฌ ์‹คํ—˜ ์ œ์•ˆ์˜ ์ž๋™ ์‹ฌ์‚ฌ๋ฅผ ์ง€์›ํ•˜๊ธฐ ์œ„ํ•œ ํฌ๊ด„์ ์ธ ๋ฐ์ดํ„ฐ ์ธํ”„๋ผ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.

Motivation

Achievement

Figure 3

ETL ํ”„๋กœ์„ธ์Šค ๋ฐ ์—ฐ์†์ ์ธ ๋‹จ๊ณ„๋ณ„ ๋ฐ์ดํ„ฐ ํ‘œํ˜„

  1. ํฌ๊ด„์  ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•: 36,949๊ฐœ์˜ ๊ณ ์œ  ์ œ์ถœ๋ฌผ, 92,879๊ฐœ์˜ ๋ฆฌ๋ทฐ, ์ตœ์ข… ์ˆ˜์šฉ/๊ฑฐ๋ถ€ ๊ฒฐ์ •์ด ํฌํ•จ๋œ ๋ฉ€ํ‹ฐ๋„๋ฉ”์ธ ๋ฐ์ดํ„ฐ์…‹ ์ œ๊ณต. OpenReview.net์—์„œ 34,030๊ฐœ, SciPost.org์—์„œ 2,919๊ฐœ์˜ ๋…ผ๋ฌธ ์ˆ˜์ง‘.
  2. ์žฌ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ์†Œํ”„ํŠธ์›จ์–ด ์ธํ”„๋ผ:
    • Python ๊ธฐ๋ฐ˜ ์ธํ„ฐํŽ˜์ด์Šค ๋ฐ ๊ตฌํ˜„ (OrbRaw, Orb dataclasses)
    • ์ž๋™ํ™”๋œ ETL (Extract, Transform, Load) ํ”„๋กœ์„ธ์Šค๋กœ ์ •๊ธฐ์  ์—…๋ฐ์ดํŠธ ๊ฐ€๋Šฅ
    • REST API ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ ์ถ”์ถœ ๋ฐ ์›น ์Šคํฌ๋ž˜ํ•‘ ๋ชจ๋“ˆ ํฌํ•จ
  3. ์›๋ณธ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์„ค๊ณ„: ๊ธฐ์กด ๋ฐ์ดํ„ฐ์…‹๊ณผ ๋‹ฌ๋ฆฌ ์›๋ณธ ์†Œ์Šค ๋ฐ์ดํ„ฐ๋ฅผ ๋ณด์กดํ•˜๊ณ , ์‚ฌ์šฉ์ž๊ฐ€ ํ•„์š”์— ๋”ฐ๋ผ ์ „์ฒ˜๋ฆฌ๋ฅผ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋„๋ก ์„ค๊ณ„ํ•˜์—ฌ ์‹คํ—˜์˜ ๋ฒ”์œ„๋ฅผ ํ™•๋Œ€ํ•จ.
  4. NLP ์‘์šฉ ๊ฐ€๋Šฅ์„ฑ ์ž…์ฆ:
    • ํ…์ŠคํŠธ ์ž„๋ฒ ๋”ฉ ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ์ˆ˜์šฉ ์˜ˆ์ธก
    • ์ž„๋ฒ ๋”ฉ์œผ๋กœ๋ถ€ํ„ฐ ์ฑ„์  ํ†ต๊ณ„ ์ถ”๋ก 

How

Figure 1

OrbRaw ์ธํ„ฐํŽ˜์ด์Šค์™€ ๊ตฌํ˜„์„ ๋‚˜ํƒ€๋‚ด๋Š” UML ๋‹ค์ด์–ด๊ทธ๋žจ*

Figure 2

ORB ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๋Œ€์ƒ Orb ๋ฐ์ดํ„ฐํด๋ž˜์Šค. OrbPapers์˜ ๋ชจ๋“  OrbSubmissions*

Originality

Limitation & Further Study

ํ•œ๊ณ„:

ํ›„์† ์—ฐ๊ตฌ:

Evaluation

Novelty: 4/5 Technical Soundness: 3.5/5 Significance: 4/5 Clarity: 3.5/5 Overall: 3.5/5

์ดํ‰: ORB ๋ฐ์ดํ„ฐ์…‹์€ ์˜คํ”ˆ ํ”ผ์–ด๋ฆฌ๋ทฐ ๋ถ„์•ผ์˜ ๋ฐ์ดํ„ฐ ๋ถ€์กฑ ๋ฌธ์ œ๋ฅผ ํฌ๊ฒŒ ์™„ํ™”ํ•  ์ˆ˜ ์žˆ๋Š” ์ค‘์š”ํ•œ ์ž์›์ด๋ฉฐ, ํŠนํžˆ ๊ณ ์—๋„ˆ์ง€๋ฌผ๋ฆฌ ์‹คํ—˜ ์ œ์•ˆ ์ž๋™ ํ‰๊ฐ€๋ผ๋Š” ๊ตฌ์ฒด์  ์‘์šฉ์„ ์ง€์›ํ•œ๋‹ค๋Š” ์ ์—์„œ ๊ฐ€์น˜๊ฐ€ ์žˆ๋‹ค. ๋‹ค๋งŒ ๋ฐ์ดํ„ฐ ํ†ตํ•ฉ์˜ ๋ณต์žก์„ฑ, NLP ์‹คํ—˜์˜ ๊ธฐ์ดˆ์  ์ˆ˜์ค€, ํ”Œ๋žซํผ ์˜์กด์„ฑ ๋“ฑ์œผ๋กœ ์ธํ•ด ๊ธฐ์ˆ ์  ๊ฒฌ๊ณ ์„ฑ์—์„œ ๊ฐœ์„  ์—ฌ์ง€๊ฐ€ ์žˆ๊ณ , ๋Œ€๊ทœ๋ชจ ์‹ค์ œ ์‘์šฉ๊นŒ์ง€๋Š” ์ถ”๊ฐ€ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•˜๋‹ค. ์˜คํ”ˆ ์‚ฌ์ด์–ธ์Šค ์ปค๋ฎค๋‹ˆํ‹ฐ์— ๊ธ์ •์  ๊ธฐ์—ฌ๋ฅผ ํ•  ์ˆ˜ ์žˆ๋Š” ๋ฆฌ์†Œ์Šค์ด๋‚˜, ๊ฐœ๋ณ„ ๋…ผ๋ฌธ์œผ๋กœ์„œ์˜ ๊ธฐ์ˆ ์  ํ˜์‹ ์„ฑ์€ ์ œํ•œ์ ์ด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ํ”ผ์–ด ๋ฆฌ๋ทฐ ์ „๊ณผ์ •์„ ๋ถ„์„ ๊ฐ€๋Šฅํ•œ ์˜คํ”ˆ๋ฆฌ๋ทฐ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ๋ฒค์น˜๋งˆํฌ์ด์ž, ๋ฆฌ๋ทฐ ์ฝ”๋ฉ˜ํŠธ ๋ถ„์„ ์—ฐ๊ตฌ์˜ ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
803 ๋…ผ๋ฌธ์€ ORB ์ž๋™ํ™” ๋ฆฌ๋ทฐ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ๊ณตํ•˜๋ฉฐ, 250์—์„œ LLM ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ ์ž๋™ํ™”์˜ ์‹ค์ฆ ๋ฐ ๋ฒค์น˜๋งˆํฌ๋กœ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
803์€ ๊ณต๊ฐœ ํ”ผ์–ด๋ฆฌ๋ทฐ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ๊ณตํ•˜์—ฌ 609์˜ LLM ๊ธฐ๋ฐ˜ ๋…ผ์ฆ์  ํ”ผ์–ด๋ฆฌ๋ทฐ ์‹œ์Šคํ…œ์— ํ•ต์‹ฌ ๋ฐ์ดํ„ฐ ์ธํ”„๋ผ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ORb ๋ฐ์ดํ„ฐ์…‹์€ AI ์ƒ์„ฑ ๋ฆฌ๋ทฐ์˜ ์ž๋™ํ™” ํ‰๊ฐ€ ํ”„๋กœํ† ์ฝœ ๋ฐ ๋ ˆ์ด๋ธ”๋ง ์„ค๊ณ„๋ฅผ ์œ„ํ•œ ๊ธฐ์ดˆ๊ฐ€ ๋˜๋Š” ์‹ค์ œ ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ์ž…๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋…ผ๋ฌธ peer review์˜ ์ž๋™ ํ‰๊ฐ€ยท์‹ ๋ขฐ์„ฑ ์ง€ํ‘œ ์„ค๊ณ„์ฒ˜๋Ÿผ, ๊ณผํ•™ ์—์ด์ „ํŠธ ํ‰๊ฐ€์—์„œ ๋ฒค์น˜๋งˆํฌ ์‹ ๋ขฐ์„ฑ๊ณผ ๊ฐ๊ด€์„ฑ ๋…ผ์˜๋ฅผ ๋ณด๊ฐ•ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
080 ๋…ผ๋ฌธ์€ AI๊ฐ€ ํ”ผ์–ด๋ฆฌ๋ทฐ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ๊ณผ ์œ„ํ—˜์„ ๋…ผ์˜ํ•ด, 803์—์„œ ์ œ์‹œํ•œ ์ž๋™ํ™” ํ‰๊ฐ€ ๋ฐฉ๋ฒ•์˜ ์‚ฌํšŒ์ ยท์œค๋ฆฌ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
803์˜ OpenReview ๊ธฐ๋ฐ˜ ๋Œ€๊ทœ๋ชจ ๋…ผ๋ฌธ/๋ฆฌ๋ทฐ ๋ฐ์ดํ„ฐ์…‹(ORB)์€ 809์—์„œ AI ๊ธฐ๋ฐ˜ ํ”ผ์–ด๋ฆฌ๋ทฐ ์ž๋™ํ™” ๋ฐฉ๋ฒ•์„ ์‹คํ—˜ํ•˜๊ณ  ํ‰๊ฐ€ํ•˜๋Š” ๋ฐ ๋ฐ์ดํ„ฐ ์ธํ”„๋ผ๋กœ ์ง์ ‘ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ํ•™์ˆ  ๋ฌธํ—Œ์˜ ๊ณ„๋Ÿ‰์„œ์ง€ํ•™์  ๋ถ„์„์„ ์œ„ํ•œ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
803 'The open review-based (orb) dataset' ๋…ผ๋ฌธ์€ ์˜คํ”ˆ ๋ฆฌ๋ทฐ ๊ธฐ๋ฐ˜ ์ž๋™ ํ‰๊ฐ€์™€ ๋ฆฌ๋ทฐ์–ด ํ–‰๋™ ๋ฐ์ดํ„ฐ์— ์ดˆ์ ์„ ๋งž์ถ”๋ฏ€๋กœ, 778 PEERSUM์˜ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ž๋™์ƒ์„ฑ๊ณผ ์ƒ๋ณด์ ์œผ๋กœ ์ฝ์œผ๋ฉด ๋ฆฌ๋ทฐ ์ž๋™ํ™” ์—ฐ๊ตฌ ํ๋ฆ„์„ ํญ๋„“๊ฒŒ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ORBiC ๋ฐ์ดํ„ฐ์…‹์€ ํ•™์ˆ  ๋ฆฌ๋ทฐ ํ‰๊ฐ€์— ์ดˆ์ ์„ ๋งž์ถ”์—ˆ์œผ๋‚˜, OAG-Bench์™€ ๊ฐ™์ด ํ•™์ˆ  ๋น…๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋‹ค์–‘ํ•œ ๊ณผ์ œ ๋ฒค์น˜๋งˆํฌ๋ฅผ ๊ตฌ์ถ•ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Pre ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ๋™๋ฃŒํ‰๊ฐ€ ๊ธฐ๋ฐ˜ LLM ํ‰๊ฐ€์ž ๊ตฌ์กฐ๋ฅผ, ORb ๋ฐ์ดํ„ฐ์…‹์€ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ํ‰๊ฐ€์šฉ ์‹ค์ œ ๋ฐ์ดํ„ฐ๋กœ ์ž๋™ํ™” ํ‰๊ฐ€์˜ ๋Œ€์•ˆ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
The open review-based (orb) dataset๋Š” LLM ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์ž๋™ํ™”์—์„œ ํ”ผ์–ด๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐ ๊ฒ€์ฆ์˜ ์˜คํ”ˆ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ๊ณตํ•˜์—ฌ ํŒŒ์ผ/์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ AI ์ž๋™ํ™”์˜ ์‘์šฉ ์ธก๋ฉด์„ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ORb Dataset์€ ๋ฆฌ๋ทฐ์–ด์˜ ํ’ˆ์งˆ ๋ฐ ์‹ ๋ขฐ๋„ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ•˜์—ฌ ๋…ผ๋ฌธ ์ฒ ํšŒ ์—ฐ๊ตฌ์—์„œ ๋‚˜ํƒ€๋‚˜๋Š” ๊ฒ€์ฆ ๋ฌธ์ œ ์ ‘๊ทผ๋ฒ•์„ ๋‹ฌ๋ฆฌํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
803๋ฒˆ ๋…ผ๋ฌธ์€ ์˜คํ”ˆ ๋ฆฌ๋ทฐ ๋ฐ์ดํ„ฐ์…‹ ํ‰๊ฐ€์— ์ดˆ์ ์„ ๋งž์ถฐ, 520๋ฒˆ ๋…ผ๋ฌธ์˜ LLM ๊ธฐ๋ฐ˜ ๊ตฌ์กฐ์  ๋…ผ๋ฌธ ์š”์•ฝยทํ‰๊ฐ€์™€ ๋น„๊ต๋ถ„์„ํ•  ์ˆ˜ ์žˆ๋Š” ์‹œ๊ฐ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
877 ๋…ผ๋ฌธ์€ NLP ๊ธฐ๋ฐ˜ ํ”ผ์–ด๋ฆฌ๋ทฐ ์ž๋™ํ™” ํ‰๊ฐ€์™€ ๊ด€๋ จํ•˜์—ฌ ๋‹ค์–‘ํ•œ ํ‰๊ฐ€ ๋„๊ตฌ๋ฅผ ์†Œ๊ฐœํ•˜๋ฏ€๋กœ, 803์˜ ORB ๋ฐ์ดํ„ฐ์…‹ ํ™œ์šฉ๋ฒ•๊ณผ ์ง์ ‘ ๋น„๊ตํ•ด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ์ž๋™ ๋…ผ๋ฌธ ํ‰๊ฐ€ ๋ฐ ๋ฆฌ๋ทฐ ํ’ˆ์งˆ์— ๋Œ€ํ•œ ๋‹ค์–‘ํ•œ ์กฐ์งํ™” ๋ฐ ํ”„๋กฌํ”„ํŠธ ์ „๋žต๊ณผ ๋Œ€์กฐ๋  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
591์€ OpenReview๋ฅผ ํฌํ•จํ•œ ํ”ผ์–ด๋ฆฌ๋ทฐ ํ‰๊ฐ€ ์ƒํƒœ๊ณ„ ์ž์ฒด์— ๋Œ€ํ•œ ๋ถ„์„์œผ๋กœ 803 ๋…ผ๋ฌธ์˜ ORB ๋ฐ์ดํ„ฐ์…‹ ์ธํ”„๋ผ์˜ ํ™œ์šฉ๊ณผ ํŒŒ๊ธ‰ํšจ๊ณผ๋ฅผ ํ˜„์žฅ ๋งฅ๋ฝ์—์„œ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋„์™€์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์˜คํ”ˆ๋ฆฌ๋ทฐ ๊ธฐ๋ฐ˜ ํ‰๊ฐ€ ์ž๋™ํ™”์™€ AI ๋ฆฌ๋ทฐ์–ด์˜ ์—ญํ• , ์‹ฌ์‚ฌ ๊ณผ์ • ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ• ๋ฐฉ์‹์„ ๋‹ค๋ฃฌ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์˜คํ”ˆ๋ฆฌ๋ทฐ ๊ธฐ๋ฐ˜์˜ ํ•™์ˆ  ๋ฆฌ๋ทฐ์™€ ์žฌ๋ฐ˜๋ฐ• ๋ฐ์ดํ„ฐ์…‹์„ ์ด์šฉํ•œ ์ž๋™ ํ‰๊ฐ€์™€ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ์‹œ์Šคํ…œ ์—ฐ๊ตฌ๋กœ์„œ, ๋ฐ์ดํ„ฐ ๊ตฌ์ถ• ์ธก๋ฉด์—์„œ ์ƒํ˜ธ ๋ณด์™„๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
803 ๋…ผ๋ฌธ์€ ์˜คํ”ˆ๋ฆฌ๋ทฐ ๋ฐ์ดํ„ฐ์…‹ ๊ธฐ๋ฐ˜ ์ž๋™ํ™” ํ‰๊ฐ€๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, 807์˜ ๋น„๋””์˜ค ์„ค๋ช… ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ ํ‰๊ฐ€์™€ ๋น„๊ตํ•ด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ ์—ฐ๊ตฌ ํ‰๊ฐ€ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ๊ณผ ํ•œ๊ณ„๋ฅผ ๋ถ„์„ํ•œ ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
803๋ฒˆ ๋…ผ๋ฌธ์€ ์˜คํ”ˆ ๋ฆฌ๋ทฐ ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ• ๋ฐ ์ž๋™ํ™” ํ‰๊ฐ€ ๋ฐฉ๋ฒ•์„ ๊ธฐ์ˆ ํ•ด, ํ”ผ์–ด ๋ฆฌ๋ทฐ ์ฝ”๋ฉ˜ํŠธ์˜ ํ‘œ์ค€ ์šฉ์–ดํ™”์™€ ๊ทธ ํ˜„์‹ค ์ ์šฉ ๋ฌธ์ œ ์œ ์‚ฌ์ ์„ ๊ณต์œ ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
OpenReview ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•œ ์ž๋™ ํ‰๊ฐ€ ๋„๊ตฌ์™€ ๊ณต๊ฐœ ๋ฐ์ดํ„ฐ์…‹์„ ํ†ตํ•œ ํ•™์Šต๋ถ„์„ ํ๋ฆ„์„ ๋น„๊ตยท์ฐธ์กฐํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
The open review-based (orb) dataset: Towards automatic assessment ๋…ผ๋ฌธ์€ ๋„์„œ๊ด€ ๊ธฐ๋ฐ˜ ์‚ฌ๋ก€ ๋Œ€์‹  ๊ณต๊ฐœ peer review ๋ฐ์ดํ„ฐ๋ฅผ ๊ณผํ•™-์‚ฌํšŒ ์—ฐ๊ฒฐ์˜ ์‚ฌ๋ก€๋กœ ๋ณด๊ณ , ์˜๋ฏธ๋ก  ๋ถ„์„ ๋ฐฉ์‹์˜ ์ ์šฉ ๋Œ€์ƒ์„ ์ฐจ๋ณ„ํ™”ํ•จ์œผ๋กœ์จ 942์˜ ์—ฐ๊ตฌ ์ ‘๊ทผ๋ฒ•์— ๋น„๊ต์ ์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋ฌธํ—Œ ๋ถ„์„์„ ์œ„ํ•œ ๊ณ„๋Ÿ‰์„œ์ง€ํ•™์  ๋ฐฉ๋ฒ•๋ก ์„ ์ ์šฉํ•œ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹จ๋ฐฑ์งˆ ๊ธฐ๋Šฅ ์˜ˆ์ธก์˜ ์žฌํ˜„์„ฑ ๋ฐ ์ผ๋ฐ˜ํ™”๋ฅผ ๋‹ค๋ฅธ ๊ด€์ ์—์„œ ํ‰๊ฐ€ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์•” ๋ฉด์—ญ์น˜๋ฃŒ ์—ฐ๊ตฌ ๋™ํ–ฅ์„ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ๋ถ„์„ํ•œ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
629์˜ Peer Review ๊ธฐ๋ฐ˜ LLM ์„ฑ๋Šฅ ํ‰๊ฐ€์ž ๊ฐœ๋ฐœ์€ 803์˜ OpenReview ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•๊ณผ ์ง๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ORb ๋ฐ์ดํ„ฐ์…‹์€ ReviewMT์™€ ์œ ์‚ฌํ•˜๊ฒŒ ์ž๋™ํ™”๋œ ๋ฆฌ๋ทฐ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ์‹ค์ œ ์‹คํ—˜ ๋ฐ ํ‰๊ฐ€ ์ผ€์ด์Šค๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
262 ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐ ์ธ๊ฐ„ ํ‰๊ฐ€ ์ง€์นจ์„ ํ†ตํ•ด ORB ๋ฐ์ดํ„ฐ์…‹์„ ํ™œ์šฉํ•œ ์ž๋™ํ™” ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก ์„ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
OpenReview์˜ ๋ฆฌ๋ทฐ-๋ฉ”ํƒ€๋ฆฌ๋ทฐ-๋…ผ๋ฌธ ์ „์ฒด ๊ณต๊ฐœ์™€ ์ž๋™ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ• ์‹œ์— ํ•ต์‹ฌ ๋…ผ์˜์— ์‹ค์ œ ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
The open review-based (orb) dataset ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ๊ณผํ•™ ํ‰๊ฐ€ ๋ฐ ์žฌํ˜„์„ฑ ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ๋ฅผ ์ œ๊ณตํ•˜์—ฌ 698์˜ AI ๊ธฐ๋ฐ˜ ์žฌํ‰๊ฐ€ ์‹œ์Šคํ…œ ์ ์šฉ ์˜์—ญ์„ ๋„“ํž ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Neural ODE์™€ ๊ณผํ•™์  ๋ฐฉ์ •์‹ ๋ฐœ๊ฒฌ์˜ ์ ‘๋ชฉ์— ๋Œ€ํ•œ ๋ฒค์น˜๋งˆํ‚น ๋…ผ๋ฌธ์œผ๋กœ, ์‹ค์ œ ๋ฐฉ์ •์‹ ๋ฐœ๊ฒฌ ๋ฌธ์ œ์— Neural ODE ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ์‚ดํŽด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
803์˜ ๋ฐ์ดํ„ฐ์…‹์€ 021์—์„œ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์ง€์‹ ์ถ”์ถœ ๋ฐ ์ž๋™ ๋ฆฌ๋ทฐ ํ‰๊ฐ€์˜ ์‹ค์ฆ์  ์‹คํ—˜ ์ž๋ฃŒ๋กœ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
803์€ ๋…ผ๋ฌธ-ํ”ผ์–ด๋ฆฌ๋ทฐ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ๊ณตํ•˜์—ฌ 670์—์„œ ๋ชจ๋ธ์ด ์—ฐ๊ตฌ ๋ฐฉ๋ฒ•๋ก ๊ณผ ์‹ค์ œ ์ฝ”๋“œ ๊ตฌํ˜„์„ ์—ฐ๊ฒฐํ•˜๋Š” ํ›ˆ๋ จ ์ž๋ฃŒ๋กœ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •