์ ์: Qi Zeng, M. Sidhu, Ansel Blume, Hou Pong Chan, Lu Wang, Heng Ji | ๋ ์ง: 2023 | DOI: N/A 📄 PDF
Essence
๋ณธ ๋
ผ๋ฌธ์ ํ์ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ค์ ๋ฉํ๋ฆฌ๋ทฐ๋ก ์ข
ํฉํ๋ ๊ณผํ์ ์๊ฒฌ ์์ฝ(Scientific Opinion Summarization) ์์
์ ์ ์ํ๊ณ , ์ฒดํฌ๋ฆฌ์คํธ ๊ธฐ๋ฐ ๋ฐ๋ณต ์๊ธฐ์ฑ์ฐฐ(CGI2) ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ์ฌ ๋๊ท๋ชจ ์ค์ ๋ฐ์ดํฐ์
(ORSUM)๊ณผ ํจ๊ป ์ด๋ฅผ ํด๊ฒฐํ๋ค.
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ๊ธฐ์กด ์๊ฒฌ ์์ฝ ์ฐ๊ตฌ์ ํ๊ณ๋ฅผ ๋ช
ํํ ์ธ์ํ๊ณ ํ์ ๋๋ฉ์ธ์ ํน์์ฑ์ ๋ฐ์ํ ์๋ก์ด ์์
๊ณผ ๋ฐ์ดํฐ์
์ ์ ์ํ ์๋ฏธ ์๋ ๊ธฐ์ฌ๋ค. ํนํ ์์
๋ถํด์ ๋ฐ๋ณต ์๊ธฐ์ฑ์ฐฐ์ ๊ฒฐํฉํ CGI2 ๋ฐฉ๋ฒ๋ก ์ ๋ณต์กํ ํ
์คํธ ์์ฑ ์์
์ ์ผ๋ฐํ ๊ฐ๋ฅํ ๊ฐ์น ์๋ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ฒดํฌ๋ฆฌ์คํธ ๊ธฐ๋ฐ ๋ฐ๋ณต ํผ๋๋ฐฑ ๊ตฌ์กฐ๋ก ๋ฉํ๋ฆฌ๋ทฐ ์์ฑ ํ์ง ํฅ์ ๋ชจ๋ธ์ ์ ์ํ์ฌ, ๋
ผ๋ฌธ ์๋ ์์ฑ์ ํ์ง ๊ทน๋ํ ์ด๋ก ์ ๋ณด์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ค์ค ๋ฌธ์ ์์ฝ ์์คํ
์ ์ฑ๋ฅ๊ณผ ํ๊ฐ ๋ฐฉ๋ฒ์ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ค์ ๋ฉํ๋ฆฌ๋ทฐ๋ก ์ข
ํฉํ๋ ๋ฐ๋ณต ์๊ธฐ์ฑ์ฐฐ ๊ธฐ๋ฐ ์์ฝ ๋ฐฉ๋ฒ์ผ๋ก, 402 ๋
ผ๋ฌธ์ ๊ณ์ธต์ ๋ชฉ์ฐจ ์์ฑ ๊ณผ์ ์ ๋ฌ๋ฆฌ ๋ฆฌ๋ทฐ ์์ฝ์ ์ง์คํ ๋์์ ์ ๊ทผ์ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
1089(Prompting llms to compose meta-review drafts)๋ ๋ฆฌ๋ทฐ ์ฝ๋ฉํธ๋ก๋ถํฐ LLM ๊ธฐ๋ฐ ๋ฉํ๋ฆฌ๋ทฐ ์ด์ ์์ฑ ์คํ์ ๋ค๋ฃจ์ด, 534์ ์ฒดํฌ๋ฆฌ์คํธ ๋ฐ๋ณต๋ฒ๊ณผ ์ง์ ๋น๊ต ๊ฐ๋ฅํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ๊ธฐ๋ฐ ๋
ผ๋ฌธ ์ค๊ณ ํ๋๋ ๋ฐ ์ฌ์ ์กฐ์ฌ์ ์ด์ ์ ๋๋ฉด์, 534์ ๋ฉํ๋ฆฌ๋ทฐ ์์ฝ๊ณผ๋ ๋ค๋ฅธ AI ๊ธฐ๋ฐ ๋ฆฌ๋ทฐยท์๊ฒฌ ๊ฒฐํฉ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ์ ๋๋ฃ ํ๊ฐ ์์ฝ์ ์ํ ๋ค๋ฅธ ์๋ํ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ์๋ํ ๋ฐ ํ๊ฐ์ ๊ดํ ์ ์ฌํ ์ฐ๊ตฌ๋ก ์ํธ ๋ณด์์ ๊ด์ ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ์์คํ
์ด ์ธ๊ฐ์ ์์
์ ๋ณด์กฐยท๊ฐํํ๋ ๋ฐฉ๋ฒ์ผ๋ก ๋ฉํ๋ฆฌ๋ทฐ ์๋ํ ์ฌ๋ก๋ฅผ ๋ถ์ํ์ฌ, ์ธ๊ฐ-AI ํ ๊ธฐ๋ฐ ๊ณผํ์ฐ๊ตฌ ์์ฉ์ ์ฐธ๊ณ ๋ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
RAG ๊ธฐ๋ฐ ๊ณผํ ๋ฌธํ ์์ฝ์์ ์ ์ฌํ ์ ๊ทผ๋ฒ์ ์ฌ์ฉํ๋ ๋์์ ์์คํ
์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ ๋
ผ๋ฌธ ์๋ ์์ฝ์ ์ ํ๋์ ํธํฅ์ ํ๊ฐํ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
534๋ ์์ฑ AI ๊ธฐ๋ฐ ๊ณผํ ์ฐ๊ตฌ์ ์ง๋ณด์ ๊ณผ์ ๋ฅผ ๋ค๋ฃจ๋ ์ด์ค๋ก, 3149๊ฐ ์ ๊ณตํ๋ ์ผ๋ฐํ/์์ ํ ๋
ผ์๋ฅผ ๋ฉํ์ ์ผ๋ก ์ฐ๊ฒฐํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
779๋ฒ ๋
ผ๋ฌธ์ ํ์ ์ ์ค๊ณ ํ๊ฐ์์ ์ ์ฌํ ์ฒดํฌ๋ฆฌ์คํธ ๋ฐ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ ์ฉํ์ฌ, 534๋ฒ์ ๋ฐฉ๋ฒ๋ก ์ ์ํฅ๋ ฅ์ ๋ค๋ฅธ ๋๋ฉ์ธ์ผ๋ก ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
534๋ ์ฒดํฌ๋ฆฌ์คํธ ๊ธฐ๋ฐ์ ๋ฐ๋ณต์ ๋ฉํ๋ฆฌ๋ทฐ ์์ฑ์ ๋ค๋ฃจ์ด, 022์ ๊ฐ์ ํตํฉ ํ๋ ์์ํฌ์ ์๋ณด์ ์ผ๋ก ํ์ฉ ๊ฐ๋ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
608 ๋
ผ๋ฌธ์ ํผ์ด๋ฆฌ๋ทฐ์ ๋ฉํฐํดยท์ฅ๋ฌธ ๋ํ ์ฒ๋ฆฌ ์ธก๋ฉด์์, 534์ ๋ฉํ๋ฆฌ๋ทฐ ์๋ ์์ฑ ํ๋ ์์ ์ฅ๊ธฐ ๋ํํ ์์
์ผ๋ก ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
Meta-review generation with checklist-guided iterative introspection ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋ฆฌ๋ทฐ ์๋ํ์ ์ฌ์ธต์ ์๊ธฐ๋ฐ์ ๋ฐ ์ฒดํฌ๋ฆฌ์คํธ ๊ธฐ๋ฐ ํ์ฅ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ์ฌ 665์ ๋ณด์์ ์์ด๋์ด๋ฅผ ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
์ค์ ๋ฉํ๋ฆฌ๋ทฐ ์ด์์ ์์ฑํ๋ ํ๋ก์ธ์ค์ ๋ํด LLM ํ๋กฌํํธ ์ค๊ณ ๋ฐ ์ต์ ์ฒดํฌ๋ฆฌ์คํธ ๋ฐฉ์์ ํ์ฅ์ ์คํ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํฉ๋๋ค.
์์ฉ ์ฌ๋ก
AI๋ฅผ ํ์ฉํ ๋ฆฌ๋ทฐ ํ๋ก์ธ์ค ๊ฐ์ ๋ฐ ์๋ ์ฃผ์ ์์ฑ์ ์๋ํจ์ผ๋ก์จ, 534์ ์ฒดํฌ๋ฆฌ์คํธ ๊ธฐ๋ฐ ๋ฉํ๋ฆฌ๋ทฐ ์์ฑ ๋ฐฉ๋ฒ๋ก ์ด ์ค๋ฌด์ ์ด๋ป๊ฒ ์ ์ฉ๋ ์ ์๋์ง ๋ณด์ฌ์ค๋๋ค.