์ ์: Zheng Chu, Haiming Fan, Jingchang Chen, Qianyu Wang, Mingda Yang, Jiafeng Liang, Zhongjie Wang, Hao Li, Guoan Tang, Ming Liu, Bing Qin | ๋ ์ง: 2025 | DOI: N/A 📄 PDF
Essence
๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ์ง์ ์ ํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, ์๊ธฐ๋นํ ํผ๋๋ฐฑ์ ํตํด ๋ฐ๋ณต์ ์ถ๋ก ๊ณผ์ ์ ์ ๋ํ๋ ์๋ก์ด ๋ค์ค ํ ์ง์์๋ต ๋ฐฉ๋ฒ์ ์ ์ํ๋ค. ๋ชจ๋ธ์ด ์ง๋ฌธ ๋ถํด, ๊ฒ์, ์ถ๋ก , ์๊ธฐํ๊ฐ๋ฅผ ํ์ตํ์ฌ ์ค๊ฐ ๋จ๊ณ์ ์ค๋ฅ๋ฅผ ์ค์ด๊ณ ์ต์ ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ์ ํํ ์ ์๋๋ก ํ๋ค.
Evaluation
์ดํ: ์๊ธฐ๋นํ ํผ๋๋ฐฑ์ ๋ค์ธต์ ์ผ๋ก ํ์ฉํ ๋ฐ๋ณต์ ์ถ๋ก ํ๋ ์์ํฌ๋ ๋ค์ค ํ ์ง์์๋ต์์ ์ค์ง์ ์ฑ๋ฅ ํฅ์์ ๋ฌ์ฑํ์ผ๋ฉฐ, ํนํ ์ค๊ฐ ๋จ๊ณ ์ค๋ฅ ์ ์ด์ ํจ์จ์ ํ์ ์ธก๋ฉด์์ ๊ธฐ์ฌ๋๊ฐ ๋๋ค. ๋ค๋ง critic ๋ชจ๋ธ์ ์ผ๋ฐํ ๋ฅ๋ ฅ๊ณผ ๊ทน๋จ์ ๋ณต์ก์ฑ ์๋๋ฆฌ์ค์์์ ํ์ฅ์ฑ์ ๋ํ ์ถ๊ฐ ๋ถ์์ด ์๊ตฌ๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Selfcheck ๋
ผ๋ฌธ์ LLM์ ์คํ
-๋ฐ์ด-์คํ
๊ฒ์ฆ ๋ฐ ์๊ธฐ ๋ฐ์ฑ ๋ฉ์ปค๋์ฆ์ ๊ฒํ ํ์ฌ, ๋ค์ค ํ ์ง์์๋ต์์์ ์๊ธฐํ๊ฐ ํผ๋๋ฐฑ ๊ธฐ๋ฒ์ ์ด๋ก ์ ๋ฐํ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
743์ ๋ฐ๋ณต์ ์๊ธฐ๋นํ ๊ธฐ๋ฐ ์ง์์๋ต ํ์ดํ๋ผ์ธ์ 746(Self-Refine)์์ ์ ์๋ ์
ํ ํผ๋๋ฐฑ ๋ฐ๋ณต๊ฐ์ ๋ฉ์ปค๋์ฆ์ ์ง์ ์ ์ธ ์ํฅ์ ๋ฐ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ฅ๋ํ์ต ๊ธฐ๋ฐ ์ง๋ฌธ ์์ฑ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์๊ธฐ๋นํ(Self-critique) ๊ธฐ๋ฐ ์ถ๋ก ์ ์ฐจ๋ฅผ ์๊ฐํ๋ฉฐ Wrong-of-Thought์ ๋ค์ค ๊ด์ ๊ฒ์ฆ๊ณผ ํ๋น์ฑ ํ๊ฐ ์ธก๋ฉด์์ ๋ฐฐ๊ฒฝ์ด ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
743์ ์๊ธฐํ๊ฐ ๊ธฐ๋ฐ ๋ฉํฐํ QA ๋ฐฉ๋ฒ๋ก ๊ณผ ๋ฌ๋ฆฌ, 442๋ ์ํธ์์ฉ์ ์ฐ๊ตฌ ์์ด๋์ด ์์คํ
์ผ๋ก LLM์ ํผ๋๋ฐฑ/์ง์๊ตฌ์กฐ๋ฅผ ์ฌํ์ ๋ฐฉ์(ํ์
์ ๋๋ฒ ์ดํธ)์ผ๋ก ๊ตฌํํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ค์ค์คํ
์ง์์๋ต์์ self-critique ๊ธฐ๋ฐ ๋ฐ๋ณต์ reasoning ๊ธฐ๋ฒ์ด policy-as-generation RL๊ณผ ๋๋น๋๋ ํด๋ฒ์์ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Webํ๊ฒฝ ์์ด์ ํธ์ ๊ฐํํ์ต๊ณผ ๋ฌ๋ฆฌ, ๋นํ(Self-critique) ๊ธฐ๋ฐ ๊ฐํํ์ต์ ํตํด ๋ค๋จ๊ณ ์ถ๋ก ์ ๋ค๋ฃจ๋ ๋ฐฉ๋ฒ์ ์ ์ํจ.
๋ค๋ฅธ ์ ๊ทผ
Self-critique ์ค์ฌ์ ๋ฐ๋ณต์ ์ถ๋ก ๊ฐํ ๊ธฐ๋ฒ์ ์ ์ํ๋ฉฐ, ์๊ธฐ๊ฒ์ฆ ๊ธฐ๋ฐ ๊ฐํํ์ต๊ณผ ๋น๊ตํด ๋ณผ ์ ์์ต๋๋ค.
์์ฉ ์ฌ๋ก
๊ธฐ์ด ๋
ผ๋ฆฌ ๊ฒ์ฆ ๋ถ์ผ์์ Generative language modeling์ ํ์ฉํ ์๋ ์ฆ๋ช
๋
ผ๋ฌธ(379)์ self-critique ๊ธฐ๋ฐ ๋ฐ๋ณต์ ์ถ๋ก ์ ์ผ๋ฐํ ๋ฐ ์ํ์ ๋ฌธ์ ํ์ด์ ๋ํ ์ ์ฉ ์ฌ๋ก๋ก ์ฐธ๊ณ ํ ๋งํฉ๋๋ค.