Essence
๊ธ์๋๋ก ๋ฐ์ ํ๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ด ๊ณผํ ๋
ผ๋ฌธ ์ฌ์ฌ ๊ณผ์ ์์ ๊ฒํ ์๋ฅผ ๋ณด์กฐํ ์ ์๋์ง ์ค์ฆ์ ์ผ๋ก ํ๊ฐํ ์ฐ๊ตฌ๋ก, GPT-4๊ฐ ํน์ ์์
์์๋ ์ ๋งํ์ง๋ง ์์ ํ ๋
ผ๋ฌธ ํ๊ฐ๋ ์์ง ๋ถ๊ฐ๋ฅํจ์ ๋ณด์ฌ์ค๋ค.
Evaluation
์ดํ: ๊ธ๋ถ์ํ๋ LLM์ ๋
ผ๋ฌธ ์ฌ์ฌ ํ์ฉ ๊ฐ๋ฅ์ฑ์ ์ต์ด๋ก ์ฒด๊ณ์ ์ผ๋ก ํ์ํ ์ค์ํ ์ฐ๊ตฌ๋ก, GPT-4๊ฐ ์ค๋ฅ ํ์ง์ ์ฒดํฌ๋ฆฌ์คํธ ๊ฒ์ฆ์์๋ ์ ๋งํ์ง๋ง ์์ ํ ํ๊ฐ๋ ์์ง ๋ถ๊ฐ๋ฅํจ์ ์ค์ฆํ๋ค. ๋ค๋ง ์๊ท๋ชจ ์คํ ๋ฐ์ดํฐ์
๊ณผ ์ ํ๋ ๋ชจ๋ธ ๋น๊ต๊ฐ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ ๋ค์ ์ ์ฝํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
ReviewerGPT ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ์๋ ์์ฑ ์ฐ๊ตฌ๋ก, DeepReview ํ๋ ์์ํฌ์ ์ฌ์ ์ฐ๊ตฌ๋ก ์ฐธ์กฐํ ๋งํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ ํ
์คํธ๋ฅผ ์ ์ฑ
๋ฌธ์๋ก ๋ณํํ๋ LLM ํ๊ฐ์ ์ด๋ก ์ ยท๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM์ ํ
์คํธ ํ๊ฐ ๋ฐฉ์๊ณผ ํธํฅ์ ๋ํ ๊ธฐ์ด์ ๋ถ์์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
678 ๋
ผ๋ฌธ์ LLM์ด ๋ฆฌ๋ทฐ์ด ์ญํ ์ ๋์ฒดํ ์ ์๋์ง ํ๊ตฌํ๋ฉฐ, 1087 ๋
ผ๋ฌธ๊ณผ ๊ฐ์ด AI์ ํผ์ด๋ฆฌ๋ทฐ ์ง์ ์คํ ์ฐ๊ตฌ๋ฅผ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ํ์ฉํ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ๋์์ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
184๋ LLM์ด ์ฐ๊ตฌ ์์ด๋์ด์ ๋ํ ํผ๋๋ฐฑ์ ์ ์ฉํ๊ฒ ์ค ์ ์๋์ง ํ๊ตฌํ๋ฉฐ, LLM ๊ธฐ๋ฐ ํ๊ฐ์ ํจ์ฉ๊ณผ ํ๊ณ๋ฅผ ์ถ๊ฐ์ ์ผ๋ก ์กฐ๋งํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Peer review ๋ฉ์ปค๋์ฆ์์ ์๊ฐ์ ์ป์ LLM ํ๊ฐ ๋ฐฉ์๊ณผ, GPT๋ฅผ ์ด์ฉํ ์๋ ๋ฆฌ๋ทฐ ์์ฑ์ ์ฌ์ฉํ๋ ReviewerGPT ๋
ผ๋ฌธ์ ๋น๊ตํด๋ณผ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ReviewerGPT ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ์๋ ์์ฑ์ ์ค์ ์ฌ์ฉ์ฑ ๋ฐ ํ๊ณ, ํ์ง ํ๊ฐ ์ธก๋ฉด์์ ๋น๊ต ์ฝ๊ธฐ์ ์ ํฉํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
678๋ฒ ๋
ผ๋ฌธ์ ๋ค์ํ ์ธ์ด ๋ชจ๋ธ์ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ํ์ง์ ๋น๊ตยทํ๊ตฌํด, OpenReviewer์ ํ๊ฐ ๊ด์ ๊ณผ ๋ณด์์ ์ผ๋ก ์ฝ์ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ์ฌํ๊ณผํ ์ ์ฉ ๋๋ ์ฌํ์ ์๋ฎฌ๋ ์ด์
์ ๋ค๋ฃจ๋ ์ ์ฌํ ๋ฒ์์ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
ReviewerGPT ๋
ผ๋ฌธ์ LLM์ ํ์ฉํด ๋๋ฃ์ฌ์ฌ ๋ฌธ์์ ์์ฑ ๊ณผ์ ๊ณผ ํ๊ณ, ํ์ ๋ฑ์ ์ค์ ๋ก ์คํํ ๋์ฒด์ ์ ๊ทผ์ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
678 ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์๋ ๋ฆฌ๋ทฐ ์์ฑ ์์คํ
์ ์ค์ ํ์ฉ ๊ฐ๋ฅ์ฑ ๋ฐ ํ๊ณ๋ฅผ ์ธ๊ฐ์ฌ์ฌ์ ํ๊ฐ ๊ด์ ์์ ๋ถ์ํด, Reviewer2์ ๋ฐฉ๋ฒ๋ก ์ ๊ฒ์ฆยท๋ณด์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
128์ LLM์ ๋ฆฌ๋ทฐ ํ๊ฐ ๋ฅ๋ ฅ์ ์๋ ํ๊ฐํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ์ฌ, Peer review ๋ณด์กฐ ์ญํ ๋ก์ 678๊ณผ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
680๋ฒ์ LLM ๊ธฐ๋ฐ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ์ ๋ฌธ์ ์ ํฌ์ธํธ์ ๋นํ์ ํ๊ฐ ๋ฅ๋ ฅ์ ์ง์ค์ ์ผ๋ก ๋น๊ตํด, 678๋ฒ์ ReviewerGPT ์คํ ๊ฒฐ๊ณผ ํด์์ ๋ณด์์ด ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ๊ณผํ์ ๊ธ์ฐ๊ธฐ ๋ฅ๋ ฅ์ ๋ค๋ฅธ ์ธก๋ฉด์์ ํ๊ฐํ๋ ๋์์ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
ReviewerGPT๋ LLM์ ์ด์ฉํ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ์ ์ค์ง์ ํ์ง ํ๊ฐ์ ์ธ๊ฐ ๋ฆฌ๋ทฐ์ด ๋น๊ต๋ฅผ ๋ค๋ค, ์ ์ฌ ๋น๊ต ์ฐ๊ตฌ๋ก ์ฐธ๊ณ ํ ๋งํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
678๋ฒ ๋
ผ๋ฌธ์ LLM์ผ๋ก ์๋ ์์ฑ๋ ๋๋ฃํ๊ฐ(๋ฆฌ๋ทฐ) ์ฌ๋ก๋ฅผ ์ฌ์ธต์ ์ผ๋ก ๋ถ์ํด, 080๋ฒ์ 'AI ๋๋ฃํ๊ฐ ํ์ฐ ์ฐ๋ ค' ์ ํจ์จ์ฑ๊ณผ ํ์ง๋ณํ ๋๋น ์ค์ ๋ฐ์ดํฐ๋ฅผ ์ ๊ณตํ๋ค.
ํ์ ์ฐ๊ตฌ
1087 ๋
ผ๋ฌธ์ GPT-4๋ฅผ ํ์ฉํ ๋
ผ๋ฌธ ์ฌ์ฌ ์ง์์ ์ค์ง์ ๊ฐ์น๋ฅผ ํ๊ฐํจ์ผ๋ก์จ 678์ ํ๊ณ ๋
ผ์ ํ์ ์ฐ๊ตฌ๋ก ์ฝํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
678์ LLM์ด ์์ฑํ ํ์ ๋ฆฌ๋ทฐ์ ํ์ง ๋ฐ ํ์ฉ ํ๊ฐ๋ฅผ ํ์ฅ์ ์ผ๋ก ๋ค๋ฃจ์ด, 445์ ๊ฐ๋ณ ๋ฆฌ๋ทฐ ์์ค ํ์ง ๊ธฐ๋ฒ์ ํ์ค ์ ์ฉ์ฑ ๊ฒ์ฆ์ ์ ์ฉํ๋ค.
ํ์ ์ฐ๊ตฌ
853์ AI ๊ธฐ๋ฐ ๋
ผ๋ฌธ ๋ํ ์บก์
์ ์ค์ ํ์ฉ ํํฉ์ ๋ค๋ฃจ์ด, ReviewerGPT๊ฐ ๋์์ ์ฃผ๋ ๋ฆฌ๋ทฐ ์์
์์ญ ์ค ํ๋๋ฅผ ๊ตฌ์ฒด์ ์ผ๋ก ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
ReviewerGPT ๋
ผ๋ฌธ์ LAZYREVIEW์ ์ ์ฌํ ๋ฆฌ๋ทฐ ํผ๋๋ฐฑ ์๋ํ ๋ฌธ์ ์ LLM ํ์ฉ ๋ฐฉ์์ ์ถ๊ฐ์ ์ผ๋ก ํ๊ตฌํฉ๋๋ค.
๋ฐ๋ก /๋นํ
445๋ LLM์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ์ ์ด๋ ์ ๋ ์ฌ์ฉ๋๋์ง๋ฅผ ๋ถ์ํ๋ฉฐ, 678์ ์ฌ์ฌ ๋ณด์กฐ ํจ๊ณผ์ ๋ํ ์ค์ ํ๊ณ์ ๋ฐ์์ ์ธก๋ฉด์ ์ผ๋ก ๋ณด์ฌ์ค๋๋ค.
๋ฐ๋ก /๋นํ
081 ๋
ผ๋ฌธ์ LLM์ ๊ตฌํ๋ ฅ๊ณผ ํ๊ณ์ ๋ํ ๋นํ์ ์๊ฐ์ ์ ์ํ์ฌ 678 ๋
ผ๋ฌธ์ LLM ์คํจ์ฑ ๋
ผ์์ ๊ท ํ์ ๋ํฉ๋๋ค.
๋ฐ๋ก /๋นํ
Is it OK for AI to write science papers? ๋
ผ๋ฌธ์ AI๊ฐ ๋
ผ๋ฌธ์์ฑ์ด๋ ๋ฆฌ๋ทฐ์ ์ค์ ์ฐ์ด๋ ๊ฒ์ ์ค๋ฆฌยท์ค๋ฌด์ ๋ฌธ์ ๋ฅผ ํญ๋๊ฒ ๋
ผ์ํด 678์ ์ค์ ํ๊ณ ํ๊ฐ์ ๋๋น๋ฉ๋๋ค.