Essence
Fig. 1: ๋ฆฌ๋ทฐ ๋ณด๊ณ ์ ๋ฐ ๊ทธ UML ๊ฐ๋
ํ
๋ณธ ๋
ผ๋ฌธ์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ํ์ ๋
ผ๋ฌธ ์ฌ์ฌ ๊ณผ์ ์ ํตํฉํ๋, AI๊ฐ ์ ์ฒด ์ฌ์ฌ๋ฅผ ๋์ฒดํ๋ ๊ฒ์ด ์๋๋ผ manuscript annotation(์๊ณ ์ฃผ์ ๋ฌ๊ธฐ)์ด๋ผ๋ ํน์ ์์
์ ์ง์ํ๋ ๋ฐฉ์์ ์ ์ํ๋ค. AnnotateGPT ํ๋ซํผ์ ํตํด AI์ ์ธ๊ฐ ์ฌ์ฌ์์ ํ๋ ฅ์ ์ํ ์ค๊ฐ์ง์ ์ผ๋ก์ annotation์ ์ญํ ์ ๊ฒ์ฆํ๋ค.
Evaluation
์ดํ: ํ์ ์ฌ์ฌ์์ LLM์ ๋ณด๊ฐ(augmentation) ๋๊ตฌ๋ก ํ์ฉํ๋ ์๋ก์ด ํจ๋ฌ๋ค์์ ์ ์ํ๊ณ , annotation์ ์ค์ฌ์ผ๋ก AI-์ธ๊ฐ ํ๋ ฅ์ ์ค๊ณ๋ฅผ ์ฒด๊ณํํ ์ ์ ์๋ฏธ ์์ผ๋, ์๊ท๋ชจ ์ฌ์ฉ์ ํ๊ฐ(n=9)์ ์ ํ๋ ๊ธฐ์ ๊ฒ์ฆ์ผ๋ก ์ธํด ํ์ ์ ์ํฉํธ์ ์ค์ฉ์ฑ ์
์ฆ์ด ๋ฏธํกํ ์ํ.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
1087์ GPT-4๊ฐ ํผ์ด๋ฆฌ๋ทฐ ๊ณผ์ ์์ ์ค์ ๋ก ์ผ๋ง๋ ๋์์ด ๋๋์ง ์ ๋์ ์ผ๋ก ๊ฒํ ํด 776์์ AI ์ง์ ๋ฆฌ๋ทฐ ์ฃผ์ ์์คํ
์ ๊ทผ๊ฑฐ์๋ฃ๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
NLP ๊ด์ ์์ ํผ์ด ๋ฆฌ๋ทฐ ํ๋ก์ธ์ค์ LLM์ ํ์ฉํ๋ ๋ฐฉ๋ฒ ๋ฐ ๊ทธ ํ๊ณ๋ฅผ ๋ถ์ํด AnnotateGPT์ ์์๋ฅผ ๋ท๋ฐ์นจํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
776๋ฒ ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ ์๊ณ ์ฌ์ฌ๊ณผ์ ๋ณด์กฐ ์ญํ ์ 445๋ฒ ๋
ผ๋ฌธ์์ ์ ์๋ LLM ์ฌ์ฌ ์ฌ๋ถ ํ๋ณ๊ณผ ํฌ๋ช
์ฑ ๋
ผ์์ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ฅผ ๋๊ณ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Streamlining the review process ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ ๋ฆฌ๋ทฐ ์์คํ
์ ์ค์ ๋ฐ์ดํฐ ํ์ฉ๋ฒ๊ณผ ๋ฉํ-๋ฆฌ๋ทฐ ์์ฑ์ ๋ค๋ฅธ ์ ๊ทผ ๋ฐฉ์์ผ๋ก ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ๊ธฐ๋ฐ ํผ์ด๋ฆฌ๋ทฐ ํ์ง ํ๊ฐ๋ฅผ ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ก ์ผ๋ก ์ํํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
609์ ๋ฌ๋ฆฌ 776์ LLM์ด ์ ์ฒด ์ฌ์ฌ๋ฅผ ๋์ ํ๋ ๊ฒ์ด ์๋๋ผ ์๊ณ ์ฃผ์์ ํนํ๋ ๋ฐฉ์์ผ๋ก ํผ์ด๋ฆฌ๋ทฐ ๋ณด์กฐ๋ฅผ ๋ค๋ฃน๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
776 ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ์๋ํ ๋ฐฉ๋ฒ์ ๋ค๋ฃจ๋ฉฐ, SciCode(712)์ ํจ๊ป AI๊ฐ ์ค์ ์ฐ๊ตฌยท๋ฆฌ๋ทฐ ์
๋ฌด๋ฅผ ์ด๋ป๊ฒ ์ง์ํ๋์ง ๋น๊ต ๋ถ์์ ์ ํฉํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋๋ฃํ๊ฐ ๊ณผ์ ์์ AI ์ฌ์ฉ์ ์ฐ๋ ค์ ์ค๋ฆฌ์ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๋ ์ ์ฌํ ๊ด์ ์ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
776์ AI๊ฐ ๋
ผ๋ฌธ ๋๋ฃํ๊ฐ์์ ์๋ ํ๊ฐ ๋ฐ ์ฃผ์ ์์ฑ์ ๋ฏธ์น๋ ์ํฅ์ ์ค์ฆ์ ์ผ๋ก ํ์ธํ๋ฉฐ, 809์ AI ๊ธฐ๋ฐ ๋น ๋ฅธ ์ฌ์ฌ ์ํฌํ๋ก์ฐ์ ๋ํ ๋ค๋ฅธ ์ ๊ทผ๋ฒ์ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
๋ฆฌ๋ทฐ์ด ๊ฐ ์๊ฒฌ ๋ถ์ผ์น ํ์ง ๊ธฐ์ ์ฐ๊ตฌ๋ก, LLM ๊ธฐ๋ฐ ์ฃผ์ ์์ฑ ๋ฐ ์ธ๊ฐ ํ์
์ ๋ณด์ ์๋จ์ ์์ฉ ๊ฐ๋ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
AI ๊ธฐ๋ฐ ๋ฆฌ๋ทฐ ์ฃผ์ ์๋ํ ์ฐ๊ตฌ๋ก, ๋์ผํ ํ์ peer review ํ๋ก์ธ์ค ํจ์จํ์ ์ค์ ์ ํ์ฅ์ ์ ๋ณด์ฌ์ค.
ํ์ ์ฐ๊ตฌ
608์ ํผ์ด๋ฆฌ๋ทฐ ๊ณผ์ ์ ๋ค์ค ๋ผ์ด๋ยท์ฅ๋ฌธ ๋งฅ๋ฝ ๋ํ๋ก ํ์
ํ์ฌ 776์ด ์ ์ํ annotation ๊ธฐ๋ฐ ํ์
์ ์ฌํยทํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
676๋ฒ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์๋ ๋ฆฌ๋ทฐ์ ์ธ๊ฐ๊ฐ gap์ ๋ถ์ํด, 776๋ฒ ๋
ผ๋ฌธ์ annotation ์ง์ ์ ๋ต์ ๊ฒ์ฆ ๋ฐ ํ๊ณ ๋
ผ์์ ์ค์ง์ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํ๋ค.
ํ์ ์ฐ๊ตฌ
Streamlining the review process ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ์ ์ฃผ์ ์๋ ์์ฑ์ผ๋ก ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ํจ์จํ ๊ด๋ จ TreeReview์ ์ค์ ํ์ฅ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค๋ค.
ํ์ ์ฐ๊ตฌ
776๋ฒ ๋
ผ๋ฌธ์ LLM์ด ๋
ผ๋ฌธ ์ฌ์ฌ์์ annotation ์์
์ ์ด๋ป๊ฒ ์ง์ํ ์ ์๋์ง ์ ์ํ์ฌ, 244๋ฒ ๋
ผ๋ฌธ์ ์์ ๋ฆฌ๋ทฐ ์๋ ์์ฑ ์ฃผ์ ๋ฅผ ์ค์ง์ ์ผ๋ก ํ์ฅํ๋ค.
์์ฉ ์ฌ๋ก
AI๋ฅผ ํ์ฉํ ๋ฆฌ๋ทฐ ํ๋ก์ธ์ค ๊ฐ์ ๋ฐ ์๋ ์ฃผ์ ์์ฑ์ ์๋ํจ์ผ๋ก์จ, 534์ ์ฒดํฌ๋ฆฌ์คํธ ๊ธฐ๋ฐ ๋ฉํ๋ฆฌ๋ทฐ ์์ฑ ๋ฐฉ๋ฒ๋ก ์ด ์ค๋ฌด์ ์ด๋ป๊ฒ ์ ์ฉ๋ ์ ์๋์ง ๋ณด์ฌ์ค๋๋ค.