์ ์: Lynn Chua, Badih Ghazi, Yangsibo Huang, Pritish Kamath, Ravi Kumar, Pasin Manurangsi, Amer Sinha, Chulin Xie, Chiyuan Zhang | ๋ ์ง: 2024 | DOI: arXiv:2406.16135 📄 PDF
Essence
๊ทธ๋ฆผ 1: ๋ค๊ตญ์ด LLM์ ๊ธฐ๊ณ๋ฒ์ญ๊ณผ ๊ฐ์ ๋ช
์์ ์์
์์๋ ๊ฐํ ๊ต์ฐจ์ธ์ด ๋ฅ๋ ฅ์ ๋ณด์ด๋, ๋ชจ๋ธ ๊ฐ์ค์น์ ์๋ฌต์ ์ผ๋ก ์ ์ฅ๋ ์ง์์ ํ์ฉํ๋ ์ง์ ์ง์ฝ์ ์์
์์๋ ์ธ์ด ๊ฐ ๊ฒฉ์ฐจ๋ฅผ ํด์ํ์ง ๋ชปํจ์ ๋ณด์ฌ์ค.
๋ณธ ๋
ผ๋ฌธ์ ๋ค๊ตญ์ด ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ด ๋ช
์์ ๊ต์ฐจ์ธ์ด ์์
(๊ธฐ๊ณ๋ฒ์ญ)์์๋ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ด๋, ๋งค๊ฐ๋ณ์ ์ง์์ ์๋ฌต์ ๊ต์ฐจ์ธ์ด ํ์ฉ์์๋ ์ฌ๊ฐํ ์ฑ๋ฅ ์ ํ๋ฅผ ๊ฒฝํํ๋ '๊ต์ฐจ์ธ์ด ์ง์ ์ฅ๋ฒฝ(crosslingual knowledge barrier)'์ ์ฒ์์ผ๋ก ์ฒด๊ณ์ ์ผ๋ก ๊ท๋ช
ํ๋ ์ฐ๊ตฌ์ด๋ค.
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ๋ค๊ตญ์ด LLM์ด ํ๋ฉด์ ๊ต์ฐจ์ธ์ด ๋ฅ๋ ฅ์ ๊ฐ์ถ์์ผ๋ ๊น์ด ์๋ ์ง์ ํ์ฉ์์๋ ํ์ ํ ์ฅ๋ฒฝ์ ๊ฒฝํํ๋ค๋ ์ค์ํ ๋ฐ๊ฒฌ์ ์ฒด๊ณ์ ์ผ๋ก ์
์ฆํ๋ฉฐ, ํผํฉ์ธ์ด ๋ฏธ์ธ์กฐ์ ์ ํตํ ์ค์ง์ ์ํ ๋ฐฉ์์ ์ ์ํ ์๋ฏธ ์๋ ์ฐ๊ตฌ์ด๋ค. ๋ค๋ง ์ ์์ ์ธ์ด ํ๋์ ์ ๊ฒฝ๋ง ์์ค์ ํด์ ๋ถ์์ด ํ์ ๊ณผ์ ๋ก ๋จ์์๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
858 ๋
ผ๋ฌธ์ ๋๊ท๋ชจ ๋น์ง๋ ๊ต์ฐจ์ธ์ด ํํ ํ์ต๊ธฐ๋ฒ์ ๊ณ ์ฐฐํ์ฌ, 245์์ ๋ฌธ์ ์ํ๋ crosslingual knowledge barrier์ ๊ทผ๋ณธ ์์ธ ํด์์ ๋์์ ์ค ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ต์ฐจ์ธ์ด ์ง์ ํ์ฉ ๋ฅ๋ ฅ ํฅ์์ ์ํ ๋์์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ ๋ค ์ธ์ด ๋๋ ํํ์ ์ ์ด์ ๋ณ๋ ฌ ์ฒ๋ฆฌ, ํ๋ผ๋ฏธํฐ ํจ์จ์ฑ์ ์ง์คํ์ง๋ง ์ธ๋ถ ๋ฉ์ปค๋์ฆ์ด ๋ค๋ฆ
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
A smack of all neighbouring languages ๋
ผ๋ฌธ์ LLM์ ๋ค๊ตญ์ด ๋ฅ๋ ฅ์ ์ค์ ๋ฐ์ดํฐ๋ก ํ๊ฐํ์ฌ, crosslingual knowledge barrier ๋
ผ๋ฌธ์ด ์ ์ํ ์ฅ๋ฒฝ ๋ฌธ์ ์ ๋น๊ตํ ๋งํ ์ค์ฆ์ ๊ทผ๊ฑฐ๋ฅผ ์ ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
245๋ฒ ๋
ผ๋ฌธ์ ๋ค๊ตญ์ด ํ๊ฒฝ์์ ์ง์ ์ฅ๋ฒฝ๊ณผ ๊ต์ฐจ์ธ์ด ๋ฅ๋ ฅ์ ์ฌ์ธต ๋ถ์ํ์ฌ, 858๋ฒ์ XLM-RoBERTa ๊ธฐ๋ฐ ๊ต์ฐจ์ธ์ด ํํ ์ฐ๊ตฌ์ ์ํฅ์ ๋ฐฉ๋ฒ๋ก ์ ์ผ๋ก ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
190 ๋
ผ๋ฌธ์ ์ธ๊ณผ ๊ด๊ณ ์ค์ฌ์ ํ์ ๋ฌธ์ ์์ฑ์์ crosslingual ๋ฌธ์ ๊ฐ ๋ฏธ์น๋ ์ํฅ์ ์คํ์ ์ผ๋ก ๋ถ์ํ์ฌ, 245์ ๊ต์ฐจ์ธ์ด ์ฅ๋ฒฝ ๋ถ์์ ์ค์ ํ์ฉ ์ฌ๋ก๋ก ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
๋ค๊ตญ์ด LLM์ ์ง์ ์ฅ๋ฒฝ๊ณผ crosslingual ํ๊ฐ๋ฅผ ๋ค๋ฃจ๋ 245๋ฒ ๋
ผ๋ฌธ์ด 690์ ๊ด์ฐฐ์ ๋ณด๋ค ๊ด๋ฒ์ํ ์ธ์ด ์ง์ ๋ฌธ์ ๋ก ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
245 ๋
ผ๋ฌธ์ ๋ค๊ตญ์ด LLM์ ๊ต์ฐจ์ธ์ด ์ง์์ฅ๋ฒฝ์ ์ฌ์ธต์ ์ผ๋ก ์ง๋จํ๋ฉฐ, 119์ AUTOCAP ํ๋ ์์ํฌ ๊ฐ๋ฐ ๋๊ธฐ๋ฅผ ๋ฌธ์ ๋ถ์ ์ฐจ์์์ ํ์ฅํ๋ค.
์์ฉ ์ฌ๋ก
119๋ฒ AUTOCAP ํ๋ ์์ํฌ๊ฐ 245์์ ์ธ๊ธํ ์๋ฌต์ ๊ต์ฐจ์ธ์ด ์ง์ ์ฅ๋ฒฝ ๊ทน๋ณต์ ์คํ์ ์ผ๋ก ์๋ํ๋ฏ๋ก, ์ฐ๊ตฌ์ ๊ด๊ณ๊ฐ ๋ช
ํํฉ๋๋ค.