์ ์: Shican Wu, Xiao Ma, Dehui Luo, Lulu Li, Xiangcheng Shi, Xin Chang, Xiaoyun Lin, Ran Luo, Chunlei Pei, Du, Changying, ZhiโJian Zhao, Jinlong Gong | ๋ ์ง: 2024 | DOI: [๋ฏธ์ ๊ณต] 📄 PDF
Essence
๋๊ท๋ชจ์ธ์ด๋ชจ๋ธ(LLM)์ ๊ธฐ๋ฐ์ผ๋ก ํ์ ๋
ผ๋ฌธ ๊ฒ์, ๋ถ์, ๋ฆฌ๋ทฐ ์์ฑ์ ์ ์๋ํํ๋ ์๋-ํฌ-์๋ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ฉฐ, ํต๊ณ์ ์ผ๋ก ๊ฒ์ฆ๋ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ํตํด ์์ฑ๋ ๋ฆฌ๋ทฐ๊ฐ ์ธ๊ฐ ์ ๋ฌธ๊ฐ ์์ค๊ณผ ๋๋ฑ ์ด์์ ํ์ง์ ๋ฌ์ฑํจ์ ์
์ฆํ๋ค.
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์๋ํ ๋ฆฌ๋ทฐ ์์ฑ์ ์ค์ฉ์ ๊ตฌํ์ ๋ณด์ฌ์ฃผ๋ ๊ฐ์น ์๋ ์ฐ๊ตฌ์ด๋ฉฐ, ์ด์ค ๊ธฐ์ค์ ํ๊ฐ ๋ฐ ๋ค์ธต ํ์ง ๊ด๋ฆฌ ์ ๋ต์ ์ ๋ขฐํ ์ ์๋ ํ์ AI ๋๊ตฌ ๊ฐ๋ฐ์ ์ค์ํ ์ฌ๋ก์
๋๋ค. ๋ค๋ง PDH ์ด๋งค ๋จ์ผ ๋ถ์ผ ๊ฒ์ฆ๊ณผ ๋๊ท๋ชจ ๋ชจ๋ธ ์์กด์ฑ์ ๊ด๋ฒ์ํ ์ฑํ์ ์ ํํ ์ ์์ด, ๋ค์ํ ๋ถ์ผ ๊ฒ์ฆ๊ณผ ์ํ ๋ชจ๋ธ ์ต์ ํ ์ฐ๊ตฌ๊ฐ ํ์๋๋ฉด ๋์ฑ ๊ฐํ๋ ๊ฒ์ผ๋ก ์์๋ฉ๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
126๋ฒ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋ฆฌ๋ทฐ ์๋ํ์ ๊ดํ ๊ธฐ๋ณธ ํ๊ณผ ๋ฉํธ๋ฆญ์ ์ ๊ณตํด Pre ์ดํ๋ก์น์ ์ด๋ก ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM์ ์ด์ฉํ ์๋ ๋ฆฌ๋ทฐ ์์ฑ ๋ฐฉ๋ฒ๋ก ์ผ๋ก, ๋ค์ค ์์ด์ ํธ ํ์
๋๋น ๋จ์ผ ๋ชจ๋ธ์ ํ๊ณ ๋ฐ ์
๋ ฅ ํ์ฅ์ฑ ์ฐจ์ด๋ฅผ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ReviewerGPT ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ์๋ ์์ฑ์ ์ค์ ์ฌ์ฉ์ฑ ๋ฐ ํ๊ณ, ํ์ง ํ๊ฐ ์ธก๋ฉด์์ ๋น๊ต ์ฝ๊ธฐ์ ์ ํฉํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ํ๋ ๋ฆฌ๋ทฐ ์์ฑ ๋ฐฉ๋ฒ์ ๋ค๋ฃจ๋ Automated review generation ๋
ผ๋ฌธ์ ๋ฐ๋ณต ์ต์ ํ๊ฐ ์๋ ๋ค๋ฅธ ํ์ต ๋ฐ ํ๊ฐ ์ ๋ต์ ๋น๊ต ๋์์ผ๋ก ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Automated review generation ๋
ผ๋ฌธ๋ LLM์ ํ์ฉํ ๋ฌธํ ๋ฆฌ๋ทฐ ์๋ํ๋ก, CHIME ๋ฐฉ์๊ณผ ๋น๊ต๋ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
677์ ํ๋กฌํํธ ์ต์ ํ๋ฅผ ํตํ AI ๊ธฐ๋ฐ ๋ฆฌ๋ทฐ ์์ฑ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ์ฌ, 126์ ์๋-ํฌ-์๋ LLM ์๋ ๋ฆฌ๋ทฐ ๋ฐฉ๋ฒ๊ณผ ๋์กฐ์ ์ ๊ทผ์ ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
676์ AI ๋ฆฌ๋ทฐ์ ์ธ๊ฐ ๋ฆฌ๋ทฐ๋ฅผ ๋น๊ต ๋ถ์ํ๋ฉฐ, 126์ ์ ์๋ํ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ์์ฑ ๋ฐฉ๋ฒ๋ก ๊ณผ ์ํธ๋ณด์์ ์ผ๋ก ์ฝํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ถ์๋์ญํ ์๋ฎฌ๋ ์ด์
์ AI๋ฅผ ์ ์ฉํ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ๊ธฐ๋ฐ์ ์๋ ๋ฆฌ๋ทฐ ์์ฑ ๋ฐ ๊ตฌ์กฐํ ๋ฐฉ์์ ๋ํ ๋์์ ์ ๊ทผ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ํ์ฉํ ๋ฆฌ๋ทฐ ์๋ ์์ฑ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ฉด์, ๊ต์ก ๋ฐ ์ค์ ๋ฆฌ๋ทฐ ๋ณด์กฐ ํจ๊ณผ์ ๋ํ ์ฒด๊ณ์ ๋น๊ต๊ฐ ๊ฐ๋ฅํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ๊ธฐ๋ฐ ์๋ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ์์คํ
์ ํจ๊ณผ์ ํ๊ณ๋ฅผ ๋
ผ์ํ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ํ์ฉํ ํ
์คํธ ๋ถ๋ฅ ๋ฐ ์ฌ์ฌ ์๋ํ์ ๋์์ ์ ๊ทผ๋ฒ๊ณผ ์ฑ๋ฅ ๋น๊ต๋ฅผ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ์ ๋ถ์ผ์ ์ง์ ์งํ๋ฅผ ๋คํธ์ํฌ ๋ถ์ ๋๋ NLP ๋ฐฉ๋ฒ์ผ๋ก ์ถ์ ํ ์ ์ฌ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ํ ์ธ์ด๋ชจ๋ธ์ ํ๊ฐ ๋ฅ๋ ฅ๊ณผ ์ ๋ฌธ๊ฐ ํ๋จ ๋น๊ต๋ผ๋ ์ ์ฌํ ์ฃผ์ ๋ฅผ ๋ค๋ฃฌ๋ค.
ํ์ ์ฐ๊ตฌ
128์ 126์์ ์ ์ํ LLM ๋ฆฌ๋ทฐ ์์ฑ์ focus-level ํ๊ฐ ๋ฐ ์ธ๊ฐ ์ ๋ฌธ์ฑ ๋น๊ต๋ฅผ ๋ ๊ตฌ์ฒด์ ์ผ๋ก ๋ถ์ํ์ฌ, ์ฑ๋ฅ์ ํ๊ณ์ ๊ฐ์ ์ ์ ๋์ถํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Remor๋ LLM ๊ธฐ๋ฐ ์๋ ๋ฆฌ๋ทฐ ์์ฑ์ human-like ํ๊ฐ ์ฒ๋๋ฅผ ์ ์ฉ, ์ด ๋
ผ๋ฌธ์ ์๋-ํฌ-์๋ ์๋ ๋ฆฌ๋ทฐ ์์ฑ๊ณผ ์ง์ ๋น๊ต ๊ฐ๋ฅํฉ๋๋ค.
์์ฉ ์ฌ๋ก
270์ LLM ๊ธฐ๋ฐ ํผ์ด๋ฆฌ๋ทฐ ์๋ ์์ฑ ํ์ง์ ํ๊ฐ ์ฌ๋ก๋ก, 126์ ์๋ ๋ฆฌ๋ทฐ ์์ฑ ์ฒด๊ณ๋ฅผ ์ค์ ๋ฆฌ๋ทฐ ํ๋ก์ธ์ค์ ์ฐ๊ฒฐํด์ค๋๋ค.
๋ฐ๋ก /๋นํ
What ChatGPT and generative AI mean for science ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ ๋ฆฌ๋ทฐ ์์ฑ์ ๊ฐ๋ฅ์ฑ๊ณผ ํ๊ณ๋ฅผ ํ์ฅ ์ฐ๊ตฌ์ ์ธํฐ๋ทฐ๋ฅผ ๋ฐํ์ผ๋ก ์กฐ๋งํ์ฌ ์ค์ง์ ์ํ๊ณ ์ํฅ์ ๋น๊ตํ ์ ์์ต๋๋ค.