Essence
Figure 1: The pipeline of PIT and prompting methods (Self-Refine). Upper: PIT utilizes inputs and
์ด ๋
ผ๋ฌธ์ LLM์ด ๋ช
์์ ์ธ rubric ์ค๊ณ ์์ด ์ธ๊ฐ ์ ํธ๋ ๋ฐ์ดํฐ๋ก๋ถํฐ ์๋์ผ๋ก ๊ฐ์ ๋ชฉํ๋ฅผ ํ์ตํ ์ ์๋๋ก ํ๋ PIT(ImPlicit Self-ImprovemenT) ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. RLHF์ ํ์ต ๋ชฉํ๋ฅผ ์ฌ๊ตฌ์ฑํ์ฌ ์
๋ ฅ๋ง ์ต๋ํํ๋ ๋์ ์ฐธ์กฐ ์๋ต ์กฐ๊ฑด๋ถ ์๋ต ํ์ง ๊ฐ๊ฒฉ์ ์ต๋ํํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ์ด ๋
ผ๋ฌธ์ ๋ช
์์ rubric ์ค๊ณ์ ๋น์ฉ์ ์ ๊ฑฐํ๋ฉด์๋ LLM์ self-improvement๋ฅผ ๊ฐ๋ฅํ๊ฒ ํ๋ ์ค์ฉ์ ์ด๊ณ ํ์ ์ ์ธ ์ ๊ทผ์ ์ ์ํ๋ค. RLHF ์ฌ๊ตฌ์ฑ์ ๋จ์์ฑ๊ณผ ํจ๊ณผ์ฑ, ๊ทธ๋ฆฌ๊ณ ๋ฐ์ดํฐ ํจ์จ์ฑ ์ธก๋ฉด์์ ๊ฐ์น ์๋ ๊ธฐ์ฌ์ด๋ฉฐ, ICLR ์์ค์ ์ถํ๋ฌผ๋ก ์ ์ ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM์ด ์๋ฌต์ ์ผ๋ก self-improvement๋ฅผ ํ์ตํ๋๋ก ํ๋ ๋ฐฉ๋ฒ์ ์ ์ํด, ์๊ธฐ ๊ฐ์ ๋
ผ๋ฌธ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
314๋ฒ ๋
ผ๋ฌธ์ LLM์ด ์ค์ค๋ก self-improvement๋ฅผ ํตํด ์ฐฝ์์ฑ์ ์งํ์ํค๋ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ๋ฉฐ, 565๋ฒ ์ฐ๊ตฌ์ ๋ชจ๋ธ-๋ถ๋ณ์ ๋ค๊ฐ์ ์๋ฒ ๋ฉ๊ณผ ์ ๋ชฉํ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ด์ง์ ๋ฐ์ดํฐ ๊ฒฐํฉ ์ง์์๋ต์ ๋ค๋ฅธ ์ ๊ทผ ๋ฐฉ์์ ์ ์ฉํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ์๊ธฐ ๊ฐ์ ์ ์ํ ๋ค๋ฅธ ๊ฐํํ์ต ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๊ธฐ ๊ฐ์ ์๋ํ ํ๊ฐ์ ์ฃผ๋ชฉํ์ฌ, LLM์ ์ ๋ต ์ ์ยทํ์ต ๋ฉ์ปค๋์ฆ์ ์กํฐ๋ธ ์์ง ๊ด์ ์์ ๋ณด์์ ์ผ๋ก ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ช
์์ ํผ๋๋ฐฑ ์์ด LLM ์ฑ๋ฅ์ ํฅ์์ํค๋ ๋ค๋ฅธ ์๋ฌต์ ํ์ต ๋ฐฉ๋ฒ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ์๊ธฐ ๊ฐ์ ๋ฅ๋ ฅ์ ์ํ ๋์์ ํ๋กฌํํ
๋ฐ ํ์ต ํ๋ ์์ํฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
447 ๋
ผ๋ฌธ์ LLM์ด self-incentivization ๋ฐ iterative ์๊ธฐ ๊ฐํํ์ต์ ํตํด ์๊ธฐ ๊ฐ์ ์ ๋ฌ์ฑํ๋ ์๋ก์ด ๋ฐฉ์์ ์ ์ํ์ฌ 314์ PIT ๋ฐฉ์๊ณผ ๋๋น๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ๋กฌํํธ ์ต์ ํ์ ์๋ ด ์๋์ ์ผ๋ฐํ ๋ฅ๋ ฅ ๊ฐ์ ์ ์ํ ๋ค๋ฅธ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ์๋ฌต์ ์๊ธฐ๊ฐ์ ํ์ต๋ฅ๋ ฅ์ ๋
ผ์ํ๋ ๋
ผ๋ฌธ์ผ๋ก, ์์ฒด์ ํธ ์๋ฒ ๋ฉ์ ์๊ธฐ-์งํ ๊ตฌ์กฐ ๋ฐ ์๊ณ์ด ์์ธก๋ ฅ ๊ฐ์ ์ ํต์ฐฐ์ ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
314 ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์๊ธฐ๊ฐ์ ํ์ต ์ํฌํ๋ก์ฐ ํ๊ฐ ํ๋ ์์ํฌ๋ก, ์๊ฐ์ ๋ฐ๋ฅธ ํ๊ฐ๋ผ๋ LAFA(3147)์ ํต์ฌ ์ฃผ์ ์ ์คํ์ ์ ๊ทผ์ ์ ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
470 ๋
ผ๋ฌธ์ LLM์ ์๊ธฐ ๊ฐ์ ๋ฅ๋ ฅ(์๊ธฐ ์์ , self-improvement)์ ์ฒด๊ณ์ ์ค์ฆ์ ์ ๊ณตํ์ฌ, 314์ ์ ์๋ PIT(self-improvement ํ๋ ์)์ ํจ๊ณผ๋ฅผ ์คํ์ ์ผ๋ก ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
LLM์ ์๊ธฐ์ฑ์ฅ, ์๊ธฐ๊ฐ์ ๋ฉ์ปค๋์ฆ์ ๋ค๊ฐ๋๋ก ๋ถ์ํด, 314๋ฒ์ PIT ํ๋ ์์ํฌ์ ์คํ์ ํ์ฅ ์ฐ๊ตฌ๋ก ์ฐ๊ฒฐํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
314 ๋
ผ๋ฌธ์ LLM์ self-improvement์ alignment ๊ธฐ์ ์ ๋ ๋ฐ์ ์ํค๋ฉฐ, BiasFilter๊ฐ ์งํฅํ๋ ์ค์๊ฐ ๊ฐ์ ๋งฅ๋ฝ๊ณผ ์ฐ๊ฒฐ๋ฉ๋๋ค.
์์ฉ ์ฌ๋ก
Mind the gap ๋
ผ๋ฌธ์ LLM์ ์๊ธฐ๊ฐ์ ๋ฅ๋ ฅ์ ํ๊ณ ๋ฐ ์ค์ ์๊ธฐ๊ฐ์ ํจ๊ณผ๋ฅผ ์ค์ฆ ๋ถ์, ImPlicit Self-ImprovemenT ํ๋ ์์ํฌ๊ฐ ํ์ค์ ๋ฏธ์น๋ ์ํฅ์ ๊ฒ์ฆํฉ๋๋ค.