REFORMS: Consensus-based Recommendations for Machine-learning-based Science

์ €์ž: Sayash Kapoor, Emily M. Cantrell, Kenny Peng, Thanh Hien Pham, Christopher A. Bail, Odd Erik Gundersen, Jake M. Hofman, Jessica Hullman, Michael A. Lones, Momin M. Malik, Priyanka Nanayakkara, Russell A. Poldrack, Inioluwa Deborah Raji, Michael Roberts, Matthew J. Salganik, Marta Serra-Garcia, Brandon M. Stewart, Gilles Vandewiele, Arvind Narayanan | ๋‚ ์งœ: 2024-05-03 | DOI: 10.1126/sciadv.adk3452 📄 PDF


Essence

๊ธฐ๊ณ„ํ•™์Šต ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์—ฐ๊ตฌ์˜ ํƒ€๋‹น์„ฑ, ์žฌํ˜„์„ฑ, ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์žฅํ•˜๊ธฐ ์œ„ํ•œ ํ•™์ œ ๊ฐ„ ํ•ฉ์˜ ๊ธฐ๋ฐ˜ ์ฒดํฌ๋ฆฌ์ŠคํŠธ REFORMS (32๊ฐœ ํ•ญ๋ชฉ, 8๊ฐœ ๋ชจ๋“ˆ)์„ ์ œ์‹œํ•œ๋‹ค.

Motivation

Achievement

How

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ML ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์‹ ๋ขฐ์„ฑ ์œ„๊ธฐ๋ฅผ ์ง๋ฉดํ•˜์—ฌ, ๊ด‘๋ฒ”์œ„ํ•œ ํ•™์ œ ๊ฐ„ ํ•ฉ์˜๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ช…ํ™•ํ•˜๊ณ  ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ์ฒดํฌ๋ฆฌ์ŠคํŠธ๋ฅผ ์ œ์‹œํ•œ ์ค‘์š”ํ•œ ๋ฉ”ํƒ€-๊ณผํ•™ ๊ธฐ์—ฌ๋กœ, ๊ณผํ•™ ์ƒ์‚ฐ์„ฑ๊ณผ ํˆฌ๋ช…์„ฑ ํ–ฅ์ƒ์— ์ฆ‰์‹œ์  ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์—ฐ๊ตฌ ๊ฒฐ๊ณผ์˜ ์‹ ๋ขฐ์„ฑ๊ณผ ์žฌํ˜„์„ฑ ๋ฌธ์ œ๋ฅผ ์ด๋ก ์ ์œผ๋กœ ์ œ๊ธฐํ•˜์—ฌ REFORMS ์ฒดํฌ๋ฆฌ์ŠคํŠธ์˜ ํ•„์š”์„ฑ ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฌธํ—Œ ํด๋Ÿฌ์Šคํ„ฐ๋ง๊ณผ ์œ ์‚ฌ์„ฑ ์ธก์ •์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์žฌํ˜„์„ฑ ์ธก์ • ๋ฐฉ๋ฒ•๋ก ์˜ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•จ
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณผํ•™์˜ ๊ณผํ•™ ๋ถ„์•ผ์—์„œ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ์˜ ๋ฐฉ๋ฒ•๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ํ† ํ”ฝ ๋ชจ๋ธ๋ง๊ณผ ํ…์ŠคํŠธ ๋ถ„์„์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์‹คํ—˜ ์žฌํ˜„์„ฑ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•จ
๋‹ค๋ฅธ ์ ‘๊ทผ
๋„คํŠธ์›Œํฌ ๊ตฌ์กฐ ๋ถ„์„์˜ ๋ฐฉ๋ฒ•๋ก ์„ ๊ณต์œ ํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์žฌํ˜„์„ฑ ์œ„๊ธฐ๋ฅผ ๋‹ค๋ฅธ ๊ด€์ ์—์„œ ๋‹ค๋ฃจ๋ฉฐ ๋ฐฉ๋ฒ•๋ก ์  ๊ฐœ์„  ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์—ฐ๊ตฌ ๋ฐฉ๋ฒ•๋ก ์˜ ์‹ ๋ขฐ์„ฑ๊ณผ ํŽธํ–ฅ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์‹ ๋ขฐ์„ฑ๊ณผ ์žฌํ˜„์„ฑ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ํ•ด๊ฒฐํ•˜๋ ค๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์žฌํ˜„์„ฑ๊ณผ ํƒ€๋‹น์„ฑ์„ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์  ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ์ ‘๊ทผํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์ด ์ƒ์„ฑํ•œ ํ•™์ˆ  ์ฝ˜ํ…์ธ ์˜ ํ’ˆ์งˆ๊ณผ ์‹ ๋ขฐ์„ฑ์„ ํ‰๊ฐ€ํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ํ‰๊ฐ€ ๊ณผ์ •์—์„œ์˜ ๋ฌด์ž‘์œ„ ์‹คํ—˜์„ ํ†ตํ•ด ํ”ผ์–ด ๋ฆฌ๋ทฐ์˜ ํŠน์„ฑ์„ ๋ถ„์„ํ•œ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ธฐ๊ณ„ํ•™์Šต ์—ฐ๊ตฌ์˜ ์žฌํ˜„์„ฑ๊ณผ ํƒ€๋‹น์„ฑ์„ ๋ณด์žฅํ•˜๊ธฐ ์œ„ํ•œ ๋‹ค๋ฅธ ๊ฐ€์ด๋“œ๋ผ์ธ์ด๋‚˜ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์‹คํ—˜ ์„ค๊ณ„์—์„œ ๋ชจ๋ธ ์˜ค๋ช…์‹œ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ์ ‘๊ทผํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณต๊ฐ„ ์ „์‚ฌ์ฒด ๋ฐ์ดํ„ฐ ๋ถ„์„์„ ์œ„ํ•œ ์ƒ์„ฑ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๋Œ€์•ˆ์  ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์•ˆํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ธฐ๊ณ„ํ•™์Šต ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์žฌํ˜„์„ฑ๊ณผ ํƒ€๋‹น์„ฑ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ์–ด ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋ถ„์„์„ ๋ณด์™„ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ธฐ๊ณ„ํ•™์Šต ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์žฌํ˜„์„ฑ ์ฒดํฌ๋ฆฌ์ŠคํŠธ๋ฅผ ์ œ์‹œํ•˜์—ฌ ์‹ค์ฆ์  ๋ฐฉ๋ฒ•๋ก  ๋…ผ์˜๋ฅผ ๋ณด์™„ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋จธ์‹ ๋Ÿฌ๋‹ ๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์ฒดํฌ๋ฆฌ์ŠคํŠธ๋ฅผ ํŠน์ • ๋ถ„์•ผ์— ์ ์šฉํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •