ARA: Agentic Reproducibility Assessment For Scalable Support Of Scientific Peer-Review

์ €์ž: Kevin Riehl, Andres L. Marin, Nikofors Zacharof, Fan Wu, Patrick Langer, Robert Jakob, Anastasios Kouvelas, G. Fontaras, M. Makridis | ๋‚ ์งœ: 2026 | URL: https://arxiv.org/abs/2605.02651 📄 PDF


Essence

Figure 1

Figure 1:

ARA๋Š” ๊ณผํ•™ ๋…ผ๋ฌธ์„ ์›Œํฌํ”Œ๋กœ์šฐ ๊ทธ๋ž˜ํ”„๋กœ ๋ณ€ํ™˜ํ•˜์—ฌ ์žฌํ˜„์„ฑ์„ ์ž๋™์œผ๋กœ ํ‰๊ฐ€ํ•˜๋Š” LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์ด๋‹ค. 213๊ฐœ ReScience C ๋…ผ๋ฌธ์„ ํ†ตํ•ด ๋„๋ฉ”์ธ ๊ฐ„ ์ผ๊ด€๋œ ์žฌํ˜„์„ฑ ํ‰๊ฐ€ ๋Šฅ๋ ฅ์„ ์ž…์ฆํ•œ๋‹ค.

Motivation

Achievement

Figure 1

Figure 1:

How

Figure 3

Figure 3: Workflow Graph Generated From A Scientific Paper.

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ARA๋Š” ํ™•์žฅ ๊ฐ€๋Šฅํ•œ ํ”ผ์–ด ๋ฆฌ๋ทฐ ์ง€์›์„ ์œ„ํ•œ ์‹ค์šฉ์  ์†”๋ฃจ์…˜์„ ์ œ์‹œํ•˜๋ฉฐ, ์ตœ๋Œ€ ๊ทœ๋ชจ์˜ cross-domain ์žฌํ˜„์„ฑ ๋ฒค์น˜๋งˆํฌ๋ฅผ ๊ตฌ์ถ•ํ•˜๊ณ  ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ์ž…์ฆํ–ˆ๋‹ค. ๋„๋ฉ”์ธ ๋ฌด๊ด€์  ๊ตฌ์กฐ์  ์ถ”๋ก  ๊ธฐ๋ฐ˜์˜ ์ฐธ์‹ ํ•œ ์ ‘๊ทผ๊ณผ ๋†’์€ ์‹ ๋ขฐ์„ฑ์œผ๋กœ ๊ณผํ•™ ์žฌํ˜„์„ฑ ํ‰๊ฐ€ ๋ถ„์•ผ์˜ ์ค‘์š”ํ•œ ์ง„์ „์„ ์ด๋ฃจ์—ˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์„ ์ด์šฉํ•œ ๊ณผํ•™์  ์žฌํ˜„์„ฑ ํ‰๊ฐ€์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์žฌํ˜„์„ฑ ์ž๋™ ํ‰๊ฐ€ ์‹œ์Šคํ…œ ๊ตฌ์ถ•์„ ์œ„ํ•œ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณผํ•™ ๋…ผ๋ฌธ์˜ ์›Œํฌํ”Œ๋กœ์šฐ ๋ถ„์„๊ณผ ๋ฐฉ๋ฒ•๋ก ์  ์žฌํ˜„์„ฑ ํ‰๊ฐ€์˜ ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ฝ”๋“œ์™€ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ๊ฒ€์ฆ์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ธ์šฉ ๊ด€๊ณ„ ๋ถ„์„๊ณผ ์ฝ”๋“œ ์žฌํ˜„์„ ์—ฐ๊ฒฐํ•˜๋Š” ์œ ์‚ฌํ•œ ์ ‘๊ทผ ๋ฐฉ์‹์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋…ผ๋ฌธ ์žฌํ˜„์„ฑ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅธ AI ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์œผ๋กœ ํ•ด๊ฒฐํ•˜๋ ค๋Š” ์œ ์‚ฌ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์žฌํ˜„์„ฑ ํ‰๊ฐ€๋ฅผ ์ž๋™ํ™”ํ•˜๋Š” ์œ ์‚ฌํ•œ ์ปดํ“จํ„ฐ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์„ ์ทจํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋…ผ๋ฌธ ์ž๋™ ๋ถ„์„ ๋ฐ ํ‰๊ฐ€ ์‹œ์Šคํ…œ์œผ๋กœ ์œ ์‚ฌํ•œ AI ์—์ด์ „ํŠธ ์ ‘๊ทผ๋ฒ•์„ ๊ณต์œ ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๊ฐœ๋ฐœ๊ณผ ๊ฒ€์ฆ์— ๊ด€ํ•œ ์œ ์‚ฌํ•œ ๋ฐฉ๋ฒ•๋ก ์  ์ ‘๊ทผ๋ฒ•์„ ์ทจํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ํ‰๊ฐ€์˜ ์‹ ๋ขฐ์„ฑ๊ณผ ์‚ฌ์‹ค์„ฑ ๊ฒ€์ฆ์„ ์œ„ํ•œ ํ”„๋ ˆ์ž„์›Œํฌ ๊ฐœ๋ฐœ์— ๊ด€ํ•œ ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋…ผ๋ฌธ์˜ ์žฌํ˜„์„ฑ ํ‰๊ฐ€๋ฅผ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ์ž๋™ํ™”ํ•˜๋ ค๋Š” ๋Œ€์•ˆ์  ์ ‘๊ทผ๋ฒ•์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๋ฐœ๊ฒฌ ์ง€์› ๋„๊ตฌ์˜ ๊ฐœ๋ฐœ๊ณผ ํ‰๊ฐ€์— ๊ด€ํ•œ ์œ ์‚ฌํ•œ ๋ฐฉ๋ฒ•๋ก ์  ๊ด€์‹ฌ์‚ฌ๋ฅผ ๊ณต์œ ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ์‹œ์Šคํ…œ์˜ ์„ฑ๋Šฅ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ๋ฒค์น˜๋งˆํฌ ์„ค๊ณ„์™€ ์žฌํ˜„ ๊ฐ€๋Šฅ์„ฑ์„ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ณผํ•™ ๋…ผ๋ฌธ ์›Œํฌํ”Œ๋กœ์šฐ ๊ทธ๋ž˜ํ”„ ๋ณ€ํ™˜ ๋ฐ ์žฌํ˜„์„ฑ ํ‰๊ฐ€ ๊ฐœ๋…์„ ํ™•์žฅํ•˜๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •