์ ์: Cheng Tan, Dongxin Lyu, Siyuan Li, Zhangyang Gao, Jingxuan Wei, Siqi Ma, Zicheng Liu, Stan Z. Li | ๋ ์ง: 2024-06-09 | DOI: 10.48550/arXiv.2406.05688 📄 PDF
Essence
๊ทธ๋ฆผ 1: ๊ธฐ์กด LLM ํผ์ด๋ฆฌ๋ทฐ ์ ๊ทผ๋ฒ๊ณผ ๊ฐ์ ๋ ํ๋ ์์ํฌ ๋น๊ต
๋๊ท๋ชจ์ธ์ด๋ชจ๋ธ(LLM)์ ํ์ ๋
ผ๋ฌธ ํผ์ด๋ฆฌ๋ทฐ ๊ณผ์ ์ ๋จ์ํ ์ ์ ๊ฒํ ์์ฑ์์ ์ ์-๊ฒํ ์-์์ฌ๊ฒฐ์ ์ ๊ฐ์ ๋์ ๋ค์คํด ๋ํ๋ก ์ฌ์ ์ํ๊ณ , 92,017๊ฐ์ ๊ฒํ ๋ฌธ์ ํฌํจํ ๋๊ท๋ชจ ๋ฐ์ดํฐ์
(ReviewMT)์ ๊ตฌ์ถํ๋ค.
Evaluation
์ดํ: ์ด ๋
ผ๋ฌธ์ ๋๊ท๋ชจ์ธ์ด๋ชจ๋ธ์ ํ์ ํผ์ด๋ฆฌ๋ทฐ ์ ์ฉ์ ํ์ค์ ๋ค์คํด ๋ํ ๊ตฌ์กฐ๋ก ํ์ ์ ์ผ๋ก ์ฌ์ค์ ํ๊ณ , ์ด๋ฅผ ๋ท๋ฐ์นจํ๋ ๋๊ท๋ชจ ๊ณ ํ์ง ๋ฐ์ดํฐ์
์ ๊ณต๊ฐํจ์ผ๋ก์จ ํ์ AI ์์ฉ์ ์ค์ํ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ๋ค. ๋ค๋ง LLM ์ฑ๋ฅ ํ๊ฐ ๊ฒฐ๊ณผ์ ๋ถ์ฌ์ ์๋ ํ๊ฐ ๋ฉํธ๋ฆญ์ค์ ๋ฏธ์ฑ์์ด ์๊ธํ ๊ณผ์ ์ด๋ฉฐ, ์ค์ ํ์ ์ํ๊ณ์ ๋ฏธ์น๋ ์ํฅ์ ๋ํ ์ฌ์ธต ๋
ผ์๊ฐ ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
809(Three AI-powered steps to faster, smarter peer review)์ AI ๊ธฐ๋ฐ ํผ์ด๋ฆฌ๋ทฐ์ ์๋ํ, ์ ๋ขฐ์ฑ, ํ์ง ๋
ผ์๋ฅผ ์ค๋ฌด์ ๊ด์ ์์ ์ ์ํจ์ผ๋ก์จ 608 ๋
ผ๋ฌธ์ ๋ฐ์ดํฐ์
๊ตฌ์ถ๊ณผ ๋ฆฌ๋ทฐ ๋ชจ๋ธ๋ง์ ๊ธฐ์ด ๋
ผ์๋ฅผ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Peer Review as A Multi-Turn... ๋
ผ๋ฌธ์ ๋ฆฌ๋ทฐ/ํผ๋๋ฐฑ์ ๋ํ์ ํ๋ก์ธ์ค๋ฅผ ๋ถ์ํ๋ฉฐ, SEAGraph์ ๋ฆฌ๋ทฐ์-์ ์ ์ดํด ๊ตฌ์กฐ์ ๋น๊ต ๊ฐ๋ฅํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ค์ค ์์ด์ ํธ ์์คํ
์ ์ด์ฉํ ์ฌํ์ ์ํธ์์ฉ ์๋ฎฌ๋ ์ด์
์์ ์ ์ฌํ ์ ๊ทผ๋ฒ์ ์ฌ์ฉํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ค์ค ์์ด์ ํธ ์๋ฎฌ๋ ์ด์
ํ๊ฒฝ์์์ LLM ํ๊ฐ๋ฅผ ๋ค๋ฃจ๋ ์ ์ฌํ ์ ๊ทผ๋ฒ์ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ๋ฆฌ๋ทฐ์ด์ ์๋ฒ ์ด ๋ฆฌ๋ทฐ ํ๊ฐ ๋ฒค์น๋งํฌ์, ๋์ ๋ฆฌ๋ทฐ ๋ํ ๋ฐ์ดํฐ์
์ ๋น๊ต ๋ถ์ํจ์ผ๋ก์จ LLM ๊ธฐ๋ฐ ํผ์ด๋ฆฌ๋ทฐ ํ๊ฐ๋ฐฉ์์ ์ฐจ๋ณ์ ์ ์ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ธ๊ฐ-LLM ์์ฑ ๋ฆฌ๋ทฐ ๊ฐ ์ฐจ์ด ๋ถ์์ผ๋ก, ๋ค์คํด, ๋กฑ์ปจํ
์คํธ ๊ธฐ๋ฐ ์ค์ ๋ํ์ ๋ฆฌ๋ทฐ์ ํ์ง ๋ฐ ๊ฐ์ ์ ํ์
์ ๋์์ด ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
ORb ๋ฐ์ดํฐ์
์ ReviewMT์ ์ ์ฌํ๊ฒ ์๋ํ๋ ๋ฆฌ๋ทฐ ํ๊ฐ๋ฅผ ์ํ ์ค์ ์คํ ๋ฐ ํ๊ฐ ์ผ์ด์ค๋ฅผ ์ ๊ณตํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
608 ๋
ผ๋ฌธ์ ํผ์ด๋ฆฌ๋ทฐ์ ๋ฉํฐํดยท์ฅ๋ฌธ ๋ํ ์ฒ๋ฆฌ ์ธก๋ฉด์์, 534์ ๋ฉํ๋ฆฌ๋ทฐ ์๋ ์์ฑ ํ๋ ์์ ์ฅ๊ธฐ ๋ํํ ์์
์ผ๋ก ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
Peer Review as A Multi-Turn Dialogue ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋ฆฌ๋ทฐ๋ฅผ ๋ค์คํด ๋ํ ๊ด์ ์ผ๋ก ๋ถ์ํ์ฌ ์ค์ ์ ์ฉ์ฑ ๋
ผ์๋ฅผ ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
609(Peerarg)๋ LLM์ ํ์ฉํ ๋
ผ์์ , ๋
ผ์ฆ์ ํผ์ด๋ฆฌ๋ทฐ ์์ฑ ๋ฐ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ ์ํด, 608์ ๋ฉํฐํดยท๋กค ๊ธฐ๋ฐ ๋ํ์ ๋ฆฌ๋ทฐ ๋ชจ๋ธ์ ๋
ผ์ฆ์ฑ ์ค์ฌ์ผ๋ก ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Peer Review as A Multi-Turn Dialogue๋ LLM ๊ธฐ๋ฐ ๋
ผ๋ฌธ ์ฅ๋ฌธ ํ๊ฐ๋ฅผ ๋ค๋ฃจ๋ฉฐ, ํ๊ฐ ์๋ํ์ ํผ๋๋ฐฑ์ ์ค์ง์ ์์ฉ ์ฌ๋ก๋ฅผ ์ ๊ณตํ๋ค.
ํ์ ์ฐ๊ตฌ
608์ ํผ์ด๋ฆฌ๋ทฐ ๊ณผ์ ์ ๋ค์ค ๋ผ์ด๋ยท์ฅ๋ฌธ ๋งฅ๋ฝ ๋ํ๋ก ํ์
ํ์ฌ 776์ด ์ ์ํ annotation ๊ธฐ๋ฐ ํ์
์ ์ฌํยทํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
๋ฆฌ๋ทฐ-์ ์ ๊ฐ์ ๋ค์คํด ์ฅ๊ธฐ๋ํ์ ์ธ์ ๋๊ธฐ์์๋ฅผ ๋ฐ์ํ ํ๊ฐ ์์คํ
์ ์ ์ํ์ฌ, ๋
ผ๋ฌธ์์ ๊ฐ์กฐํ ์๋ฐฉํฅ ํผ๋๋ฐฑ๊ณผ ์ฌ์ฌ์ ์ฑ
์์ฑ ๊ฐํ ๋ฐฉ์์ ๊ตฌ์ฒดํํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ๋๋ฃํ๊ฐ์์ ์ค์ ๋ํํ, ์ฅ๊ธฐ๋ฌธ๋งฅ ์์ฑ ๊ณผ์ ์ ์ธ๋ฐํ ์ํฌํ๋ก์ฐ์ ๊ทธ ํจ๊ณผ๋ฅผ ๊ตฌ์ฒด์ ์ผ๋ก ๋ณด์ฌ์ค๋ค.
์์ฉ ์ฌ๋ก
AI ๋ฆฌ๋ทฐ์ด ์์คํ
๋ฐ peer review ๋์ ํ๊ฐ ํ๋ ์์ํฌ๊ฐ ์ค์ MT ๋ฐ์ดํฐ์ ํฉ์ณ์ง ๊ฐ๋ฅ์ฑ์ด ํฝ๋๋ค.
์์ฉ ์ฌ๋ก
Paper2Web์์ ์์ฑํ ๋ํํ ๋ฉํฐ๋ฏธ๋์ด ๋
ผ๋ฌธ ํํ์, ๋์ ํผ์ด๋ฆฌ๋ทฐ ๋ํ ๊ธฐ๋ก์ ์ํธ์์ฉ์ ๋ถ์์ด ์ด์ฐ๋ฌ์ ธ ์ค์ peer review dynamics ์ฐ๊ตฌ์ ์ ์ฉ๋ ์ ์์ต๋๋ค.