์ ์: Marah Abdin, Jyoti Aneja, Harkirat Behl, Sรฉbastien Bubeck, Ronen Eldan, Suriya Gunasekar, Michael R. Harrison, Russell J. Hewett, Mojan Javaheripi, Piero Kauffmann, James R. Lee, Yin Tat Lee, Yuanzhi Li, Weishung Liu, Caio Cรฉsar Teodorio Mendes, Anh Nguyen, Eric Price, Gustavo de Rosa, Olli Saarikivi, Adil Salim | ๋ ์ง: 2024 | DOI: arXiv:2412.08905 📄 PDF
Figure 1: 2024๋ 11์ AMC-10/12 ์ํ์์ ๋ค์ํ ๋ชจ๋ธ์ ํ๊ท ์ฑ๋ฅ ๋น๊ต
Phi-4๋ 140์ต ๊ฐ ํ๋ผ๋ฏธํฐ์ ์ธ์ด ๋ชจ๋ธ๋ก, ๊ณ ํ์ง ํฉ์ฑ ๋ฐ์ดํฐ ์ค์ฌ์ ํ์ต ๋ ์ํผ๋ฅผ ํตํด ๊ฐ๋ฐ๋์์ผ๋ฉฐ, ๊ต์ฌ ๋ชจ๋ธ์ธ GPT-4o๋ฅผ STEM ๊ธฐ๋ฐ ์ง์์๋ต ๋ฒค์น๋งํฌ์์ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค. ํนํ ์ถ๋ก ๊ด๋ จ ์์ ์์ ํจ์ฌ ํฐ ๋ชจ๋ธ๋ค๊ณผ ๋น์ทํ๊ฑฐ๋ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ธ๋ค.
Figure 1: Phi-4์ ๊ฒฝ์ ์ํ ๋ฌธ์ (AMC-10/12) ์ฑ๋ฅ ๋น๊ต
์ดํ: Phi-4๋ ๊ณ ํ์ง ํฉ์ฑ ๋ฐ์ดํฐ ์ค์ฌ์ ์ ๋ต์ ํ์ต ์ค๊ณ๋ฅผ ํตํด ์๊ท๋ชจ ๋ชจ๋ธ์ ์ฑ๋ฅ ํ๊ณ๋ฅผ ํ๊ธฐ์ ์ผ๋ก ๊ทน๋ณตํ ์ฐ์ํ ์ฌ๋ก์ด๋ค. ํนํ ์ ์ ํ ๊ฒฝ์๋ํ ๋ฐ์ดํฐ์์์ ๊ฒ์ฆ๊ณผ ๊ต์ฌ ๋ชจ๋ธ ๋ฅ๊ฐ์ ๊ฒฐ๊ณผ๋ ๋ฐ์ดํฐ ํ์ง์ ์ค์์ฑ์ ๋ช ํํ ๋ณด์ฌ์ฃผ๋ฉฐ, ํฅํ ํจ์จ์ ์ธ ์ธ์ด ๋ชจ๋ธ ๊ฐ๋ฐ์ ์ค์ํ ๋ฐฉํฅ์ฑ์ ์ ์ํ๋ค. ๋ค๋ง ์์ฑ ๋ฐฉ๋ฒ๋ก ์ ์์ ํ ์๋ํ, ๋ค์ํ ๋๋ฉ์ธ์ผ๋ก์ ํ๋ ์ ์ฉ, ๊ทธ๋ฆฌ๊ณ ์ด๋ก ์ ๊ธฐ์ด์ ๋ํ ์ฌํ ์ฐ๊ตฌ๊ฐ ํ์ ๊ณผ์ ๋ก ๋จ์ ์๋ค.