์ ์: Peter Belcak, Greg Heinrich, Shizhe Diao, Yonggan Fu, Xin Dong, Saurav Muralidharan, Yingyan Celine Lin, Pavlo Molchanov | ๋ ์ง: 2025-06-02 | DOI: 10.48550/arXiv.2506.02153 📄 PDF
ํ์ฌ ์์ด์ ํธ AI ์์คํ ์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ์์กดํ๊ณ ์์ผ๋, ๋ณธ ๋ ผ๋ฌธ์ ์๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(SLM)์ด ์์ด์ ํธ์ ๋ฐ๋ณต์ ์ด๊ณ ์ ๋ฌธํ๋ ์์ ์ ๋ ์ ํฉํ๋ฉฐ ๊ฒฝ์ ์ ์ด๋ฏ๋ก ์์ด์ ํธ AI์ ๋ฏธ๋๋ฅผ ์ฃผ๋ํ ๊ฒ์ด๋ผ๋ ์ ์ฅ์ ์ ์ํ๋ค.
์์ด์ ํธ ์์คํ ์ ๋ ๊ฐ์ง ์ด์ ๋ฐฉ์: ์ข์ธก์ ์ธ์ด๋ชจ๋ธ์ด ์ธํฐํ์ด์ค์ ๋๊ตฌ ํธ์ถ์ ๋ชจ๋ ์กฐ์จํ๋ ๋ฐฉ์, ์ฐ์ธก์ ์ฝ๋ ๊ธฐ๋ฐ ์ปจํธ๋กค๋ฌ๊ฐ ์ํธ์์ฉ์ ์กฐ์จํ๋ ๋ฐฉ์
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ํ์ฌ LLM ์ค์ฌ์ ์์ด์ ํธ AI ์ฐ์ ์ ๋ํ ๊ฒฝ์ ์ ยท๊ธฐ์ ์ ยทํ๊ฒฝ์ ๋นํ์ ์ ๊ธฐํ๊ณ SLM ๊ธฐ๋ฐ ์์ด์ ํธ ์์คํ ์ผ๋ก์ ์ ํ์ ์ฃผ์ฅํ๋ ์ค์ํ ์ ์ฅ ๋ ผ๋ฌธ์ด๋ค. NVIDIA ์ฐ๊ตฌ์ง์ ์ฒด๊ณ์ ์ธ ์ฃผ์ฅ๊ณผ ๋ค์ํ ์ต์ SLM ๋ชจ๋ธ๋ค์ ์ฑ๋ฅ ์ฌ๋ก๋ฅผ ํตํด ๊ธฐ์ ์ ํ๋น์ฑ์ ์ ์ฆํ๋ฉฐ, ์๋ฐฑ์ต ๋ฌ๋ฌ ๊ท๋ชจ์ ์ธํ๋ผ ํฌ์ ๋ถ์ผ์น ๋ฌธ์ ๋ฅผ ๋ ์นด๋กญ๊ฒ ์ง์ ํ๋ค. ๋ค๋ง ๋๊ท๋ชจ ์ค์ฆ ๋ฐ์ดํฐ์ ํ๋ก๋์ ํ๊ฒฝ์ ๊ฒ์ฆ, ๊ทธ๋ฆฌ๊ณ ์ฒด๊ณ์ ์ธ ๋๋ฉ์ธ๋ณ ๊ฒฝ๊ณ ์กฐ๊ฑด ๋ถ์์ด ์ถ๊ฐ๋๋ฉด ๋์ฑ ๊ฐ๋ ฅํ ์ฃผ์ฅ์ด ๋ ์ ์๋ค. ์์ด์ ํธ AI์ ๋น ๋ฅธ ์ฑ์ฅ๊ณผ AI ๋น์ฉ ํจ์จ์ฑ์ ๋ํ ์ ๊ณ ๊ด์ฌ์ ๊ณ ๋ คํ ๋, ์ปค๋ฎค๋ํฐ ๋ ผ์๋ฅผ ์ด๋ฐํ ๋งํ ๊ฐ์น ์๋ ๊ธฐ์ฌ๋ค.