Unsupervised pretraining for fact verification by language model distillation
์ ์: Adriรกn Bazaga, Pรญetro Liรณ, Gos Micklem | ๋ ์ง: 2023 | ์์: University of Cambridge 📄 PDF
Essence
๋ณธ ๋
ผ๋ฌธ์ SFAVEL(Self-supervised Fact Verification via Language Model Distillation)์ ์ ์ํ์ฌ, ์ธ๊ฐ์ ์ฃผ์ ์์ด ์ฌ์ ํ์ต๋ ์ธ์ด๋ชจ๋ธ์ ์ง์์ ์ฆ๋ฅ(distillation)ํจ์ผ๋ก์จ ํด๋ ์๊ณผ ๊ทผ๊ฑฐ ๊ฐ์ ์๋ฏธ๋ก ์ ์ ๋ ฌ์ ํ์ตํ๋ ์๊ธฐ์ง๋ํ์ต ๊ธฐ๋ฐ ํฉํธ ๊ฒ์ฆ ํ๋ ์์ํฌ๋ฅผ ์๊ฐํ๋ค. ์ด๋ FB15k-237์์ +5.3% Hits@1, FEVER์์ +8% ์ ํ๋ ๊ฐ์ ์ ๋ฌ์ฑํ๋ค.
Motivation
- Known: ๊ธฐ์กด ํฉํธ ๊ฒ์ฆ ์ฐ๊ตฌ๋ ์ฃผ๋ก NLI(Natural Language Inference) ๋ชจ๋ธ์ด๋ ์ง์๊ทธ๋ํ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ก ์ ์์กดํ๋ฉฐ, ๋๊ท๋ชจ ์ฃผ์ ๋ฐ์ดํฐ์
(FEVER, MultiFC ๋ฑ)์ ํ์๋ก ํ๋ค. ์ฌ์ ํ์ต ์ธ์ด๋ชจ๋ธ์ ๊ฐ๋ ฅํ ์๋ฏธ ์ดํด ๋ฅ๋ ฅ์ ๋ณด์ ํ์ง๋ง ํ ๋ฃจ์๋ค์ด์
(hallucination) ๋ฌธ์ ๋ฅผ ๊ฒช๋๋ค.
- Gap: ๊ธฐ์กด ํฉํธ ๊ฒ์ฆ ๋ฐฉ๋ฒ๋ค์ ๋๋ถ๋ถ ์ง๋ํ์ต์ ์์กดํ๊ณ ์์ผ๋ฉฐ, ์๊ธฐ์ง๋ํ์ต ๊ธฐ๋ฐ์ ํฉํธ ๊ฒ์ฆ ๊ธฐ๋ฒ์ ์ฌ์ ํ ๋ถ์กฑํ๋ค. ๋ํ LaPraDoR ๊ฐ์ ์ผ๋ฐ์ ์ธ ๋๋น ํ์ต ๋ฐฉ๋ฒ์ ์์
๋ณ ํนํ์ฑ์ด ๋ถ์กฑํ์ฌ FEVER์์ ์ง๋ํ์ต SOTA์ ํฐ ์ฑ๋ฅ์ฐจ๋ฅผ ๋ณด์ธ๋ค.
- Why: ๋ฐฉ๋ํ ๋ฏธํ์ง ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ๋ฉด์๋ ์ฃผ์ ๋น์ฉ์ ์ ๊ฑฐํ ์ ์๋ ์๊ธฐ์ง๋ํ์ต ์ ๊ทผ๋ฒ์ด ํ์ํ๋ฉฐ, ํฉํธ ๊ฒ์ฆ ์์
์ ํนํ๋ ๋๋น ์์คํจ์์ ์ค๊ณ๊ฐ ์ค์ํ๋ค.
- Approach: ์ฌ์ ํ์ต๋ ์ธ์ด๋ชจ๋ธ์ ํน์ง์ ์ง์๊ทธ๋ํ ์๋ฒ ๋ฉ ๊ณต๊ฐ์ผ๋ก ์ฆ๋ฅ(distillation)ํ๋ ์๋ก์ด ์๊ธฐ์ง๋ํ์ต ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. ํด๋ ์-์ฌ์ค ์ ๋ ฌ(alignment)์ ์ํ ์์
๋ณ ๋ง์ถคํ ์์คํจ์(distillation loss, scoring loss, intra-sample contrastive loss)๋ฅผ ์ค๊ณํ๋ค.
Achievement
- SOTA ์ฑ๋ฅ ๋ฌ์ฑ: FB15k-237์์ Hits@1 ๊ธฐ์ค +5.3% ๊ฐ์ , FEVER์์ +8% ์ ํ๋ ํฅ์์ผ๋ก ์ ํํ๊ฐ(linear evaluation) ๊ธฐ์ค ์๋ก์ด SOTA ๋ฌ์ฑ
- ์ฃผ์ ๋ถํ์ํ ์๊ธฐ์ง๋ํ์ต: ์ธ๊ฐ์ ๋ ์ด๋ธ ์์ด ์์ ํ ์๊ธฐ์ง๋ํ์ต๋ง์ผ๋ก ์ฐ์ํ ์ฑ๋ฅ ๋ฌ์ฑ, ๋๊ท๋ชจ ๋ฏธํ์ง ๋ฐ์ดํฐ ํ์ฉ ๊ฐ๋ฅ
- ์ธ์ด๋ชจ๋ธ ์ฆ๋ฅ์ ํจ๊ณผ์ฑ: 8๊ฐ ์ฌ์ ํ์ต ์ธ์ด๋ชจ๋ธ์ ์๋ฏธ๋ก ์ ์ง์์ ํจ๊ณผ์ ์ผ๋ก ์ง์๋ชจ๋ธ ๊ณต๊ฐ์ผ๋ก ์ด์ ํ๋ฉฐ, ์์
ํนํ ์ค๊ณ์ ์ค์์ฑ์ ์
์ฆ
How
๋ฐ์ดํฐ ์ฒ๋ฆฌ ํ์ดํ๋ผ์ธ:
- ๋ฏธํ์ง ํด๋ ์ ๋ฐฐ์น x = {xแตข}โแตขโโ๊ณผ ์ง์๊ทธ๋ํ G(ฮต, R) (์ํฐํฐ์ ๊ด๊ณ ํฌํจ) ์ฌ์ฉ
- ์ฌ์ค F๋ (head, relation, tail) ์ผ์คํญ์ผ๋ก ํํ
์ฌ์ ํ์ต ๋ฐฉ๋ฒ๋ก :
- ์ธ์ด๋ชจ๋ธ ์ธ์ฝ๋(Frozen): ์
๋ ฅ ํด๋ ์์ผ๋ก๋ถํฐ X_LM ํน์ง ํ๋ (8๊ฐ SOTA ์ฌ์ ํ์ต ๋ชจ๋ธ ์ค ์ ํ)
- ์ง์๋ชจ๋ธ: ์ง์๊ทธ๋ํ์ ๋ชจ๋ ์ฌ์ค์ ๊ณ ์ฐจ์ ์๋ฒ ๋ฉ X_F๋ก ๋ณํ
- ์ค์ฝ์ด๋ง ๋ชจ๋: ํด๋ ์ ์๋ฒ ๋ฉ์ ์กฐ๊ฑด์ผ๋ก ํ์ฌ ๊ฐ ์ฌ์ค์ ๋ํ ์ ์ S โ [0,1] ์์ฑ
- ์์-K ์ฆ๊ฑฐ ์ ํ: ์ ์๊ฐ ๋์ ์์ K๊ฐ ์ฌ์ค์ ์์ฑ ๋ถ๋ถ๊ทธ๋ํ X_Fโบ๋ก ์ ํ
- ์์ฑ ํ: ์์๋ก ์ํ๋ง๋ ์ฌ์ค๋ค๋ก ์์ฑ ํ ๊ตฌ์ฑ
์ธ ๊ฐ์ง ์์คํจ์ ์กฐํฉ:
- ์ฆ๋ฅ ์์ค(โ_distill): ํด๋ ์๊ณผ ์์ฑ ์ฌ์ค ์๋ฒ ๋ฉ ๊ฐ ๋๋น ์์ค๋ก ์ธ์ด๋ชจ๋ธ ์ง์์ ์ง์๋ชจ๋ธ ๊ณต๊ฐ์ผ๋ก ์ฆ๋ฅ
- ์ค์ฝ์ด๋ง ์์ค(โ_scoring): ์์ฑ ์ฌ์ค์ ๋์ ์ ์, ์์ฑ ์ฌ์ค์ ๋ฎ์ ์ ์๋ฅผ ๋ถ์ฌํ๋๋ก ์ค์ฝ์ด๋ง ๋ชจ๋ ํ์ต
- ๋๋น ์์ค(โ_intra): ๋์ผ ํด๋ ์์ ์์ฑ ์ฌ์ค๋ค ๊ฐ ์๋ฏธ ๊ด๊ณ ๋ณด์กด, ์ฝ์ฌ์ธ ์ ์ฌ๋ ๊ธฐ๋ฐ ๋๋น ํ์ต
์ ํ์ ๋ฏธ์ธ์กฐ์ : ์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ ์ง๋ํ์ต ํฉํธ ๊ฒ์ฆ ๋ถ๋ฅ ์์
์ ๋ฏธ์ธ์กฐ์ ๊ฐ๋ฅ
Originality
- ์์
๋ณ ํนํ ์ค๊ณ: ์ผ๋ฐ์ ์ธ ๋๋น ํ์ต๊ณผ ๋ฌ๋ฆฌ ํฉํธ ๊ฒ์ฆ์ ํด๋ ์-์ฌ์ค ์ ๋ ฌ ๋ฌธ์ ์ ํนํ๋ ์ผ์ค ์์คํจ์ ์ค๊ณ๋ก LaPraDoR ๋ฑ ๊ธฐ์กด ๋ฐฉ๋ฒ์ ์ฑ๋ฅ ๊ฒฉ์ฐจ ํด์
- ๋ค์ค ์ธ์ด๋ชจ๋ธ ์ง์ ํตํฉ: ๋จ์ผ ๋ชจ๋ธ์ด ์๋ 8๊ฐ SOTA ์ฌ์ ํ์ต ๋ชจ๋ธ์ ์๋ฏธ๋ก ์ ์ง์์ ์ฒด๊ณ์ ์ผ๋ก ์ง์๊ทธ๋ํ ์๋ฒ ๋ฉ์ผ๋ก ์ฆ๋ฅํ๋ ํ๋ ์์ํฌ
- ์๋ฏธ ๊ด๊ณ ๋ณด์กด: ๋จ์ ๋๋น ํ์ต์ ๋์ด ์ฝํผ์ค ์ ์ฒด ์๋ฏธ ๊ด๊ณ๋ฅผ ๋ณด์กดํ๋ฉด์ ํด๋ ์-์ฆ๊ฑฐ ์ ๋ ฌ์ ๋ฌ์ฑํ๋ ๋๋น ์์คํจ์ ๊ฐ๋ฐ
- ์๋ํฌ์๋ ์๊ธฐ์ง๋ ํ์ดํ๋ผ์ธ: ์ฃผ์ ์์ด ๋ฏธํ์ง ๋ฐ์ดํฐ๋ง์ผ๋ก ์์ ํ ์ฌ์ ํ์ต ๊ฐ๋ฅํ ์๊ธฐ์ง๋ ํ์ต ํ๋ ์์ํฌ (๊ธฐ์กด์ ๋ฐ์ง๋/์ง๋ํ์ต ๋ฐฉ์๊ณผ ์ฐจ๋ณํ)
Limitation & Further Study
ํ๊ณ:
- ์ง์๊ทธ๋ํ์ ํ์ง๊ณผ ์ปค๋ฒ๋ฆฌ์ง์ ์์กด: ์ง์๋ฒ ์ด์ค์ ์กด์ฌํ์ง ์๋ ์ฌ์ค ๊ฒ์ฆ์๋ ํ๊ณ
- ๊ณ ์ ๋ ์ธ์ด๋ชจ๋ธ ์ฌ์ฉ: ์ง์๋ชจ๋ธ๊ณผ์ ๋์ ์ํธ์์ฉ ๋ถ๊ฐ๋ฅ
- ์์-K ์๊ณ๊ฐ ์ ํ์ ์ํฅ: Figure 3์์ K ๊ฐ์ ๋ฐ๋ฅธ ์ฑ๋ฅ ํธ์ฐจ ์กด์ฌ
- ๊ณ์ฐ ํจ์จ์ฑ: 8๊ฐ ๋ชจ๋ธ ์์๋ธ์ ์ถ๋ก ์๊ฐ ๋ฐ ๋ฉ๋ชจ๋ฆฌ ์ค๋ฒํค๋ ๋ฏธ์์ธ
ํ์ ์ฐ๊ตฌ:
- ๋์ ์ธ์ด๋ชจ๋ธ ๋ฏธ์ธ์กฐ์ ๊ณผ ์ง์๋ชจ๋ธ์ ๊ณต๋ ํ์ต ๋ฉ์ปค๋์ฆ
- ๋ค์ค ์ธ์ด ๋ฐ์ดํฐ์
(MultiFC ๋ฑ)์ผ๋ก์ ํ์ฅ ๋ฐ ์ธ์ด ๊ฐ ์ ์ด ์ฑ๋ฅ ํ๊ฐ
- ํฌ์ ์ง์๊ทธ๋ํ ํ๊ฒฝ์์์ ์ฑ๋ฅ ๊ฐ์ (์: ๊ด๊ณ ์์ธก๊ณผ์ ํตํฉ)
- ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ์ ํ ๋ฃจ์๋ค์ด์
๊ฐ์์ ๋ฏธ์น๋ ์ํฅ ์ ๋ํ
Evaluation
์ดํ: SFAVEL์ ํฉํธ ๊ฒ์ฆ์ ํนํ๋ ์๊ธฐ์ง๋ํ์ต ํ๋ ์์ํฌ๋ก SOTA ์ฑ๋ฅ์ ๋ฌ์ฑํ์ผ๋ฉฐ, ์ฃผ์ ๋ถํ์ํ ํ์ฅ ๊ฐ๋ฅํ ์ ๊ทผ๋ฒ์ ์ ์ํ ์๋ฏธ ์๋ ๊ธฐ์ฌ์ด๋ค. ๋ค๋ง ์ง์๊ทธ๋ํ ์์กด์ฑ๊ณผ ์ค๊ณ ์ ํ์ ์ด๋ก ์ ๊น์ด๊ฐ ๋ณด๊ฐ๋๋ค๋ฉด ๋์ฑ ๊ฐ๋ ฅํ ์ฐ๊ตฌ๊ฐ ๋ ์ ์๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
859๋ ์ธ์ด๋ชจ๋ธ ๊ธฐ๋ฐ์ ์ฌ์ค ๊ฒ์ฆ๊ณผ ๋ด์ฌ์ ์ ๋ขฐ์ฑ์ ๋ค๋ฃจ์ด, RL์ ํ๋ ๋ฐ ๋ณด์ ํ๊ฐ์ ๊ดํ ์ ๋ขฐ์ฑ ๋
ผ์์ ์ด๋ก ์ ํ ๋๋ฅผ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
333์ ํฉํธ์ฒดํน์ ์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ์ถ๋ก ๋ฐฉ์์ ์ ์ฉํ์ฌ, ์ธ์ด๋ชจ๋ธ ์ฆ๋ฅ ๊ธฐ๋ฐ์ 859์ ์ ๊ทผ๋ฒ์ด ์์ดํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ์์ ๊ฒ์ฆ ๋ฐ ์ฌ์ค ๊ฒ์ฆ์์ ์ธ์ด๋ชจ๋ธ์ ๋ถํ์ค์ฑ์ ์ ๊ฒํ๋ ๋ฑ ๋ณธ ๋
ผ๋ฌธ๊ณผ ์๋์ง๊ฐ ๋์ ์ ๊ทผ๋ฒ์ ์ฌ์ฉํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์ธ์ํผ๋ฐ์ด์ฆ๋ ์ฌ์ ํ์ต๊ณผ ์ธ์ด๋ชจ๋ธ์ ํ์ฉํ ์ญ๋ ํ์ฅ, ๊ณผํ์ ํฉํธ ๊ฒ์ฆ ํ์คํฌ ๊ฐ ์ํฅ๋ ฅ์ ๋น๊ตํด ๋ณผ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
๋ณตํฉ์ ๊ณผํ ์ฌ์ค ๊ฒ์ฆ์ ํด์ค ๋ฐ ์ค๋ช
๊ฐ๋ฅํ ๊ทผ๊ฑฐ ์ ์๋ก, SFAVEL ๋ชจ๋ธ์ ์์ฉ๋ ฅ์ ๊ฐํํฉ๋๋ค.
๋ฐ๋ก /๋นํ
441์ ์ฌ์ค ๊ฒ์ฆ์์ ์ ๋ก์ท๊ณผ ํจ์ท ์ผ๋ฐํ์ ํ๊ณ ๋ฐ ๊ฐ์ ์ ๋ค๋ฃจ๋ฉฐ, 859์ ํ๋ ์์ํฌ์ ์ฑ๋ฅ ํด์์ ์์ฌ์ ์ ์ค๋๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์