Essence
BigCode ์ปค๋ฎค๋ํฐ๊ฐ ๊ฐ๋ฐํ StarCoder๋ 155์ต ํ๋ผ๋ฏธํฐ ๊ท๋ชจ์ ์คํ ์์ค ์ฝ๋ ์์ฑ ๋ํ์ธ์ด๋ชจ๋ธ(Code LLM)๋ก, ์ฑ
์๊ฐ ์๋ AI ๊ฐ๋ฐ์ ์ํด ์ ์๊ถ, ๊ฐ์ธ์ ๋ณด, ํฌ๋ช
์ฑ์ ๊ณ ๋ คํ์ฌ ์ค๊ณ๋์์ผ๋ฉฐ, ๊ธฐ์กด ๋ชจ๋ ์คํ ์ฝ๋ LLM์ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 5/5 Significance: 5/5 Clarity: 4/5 Overall: 4.5/5
์ดํ: StarCoder๋ ๊ณ ์ฑ๋ฅ ์คํ ์ฝ๋ LLM์ ํ์์ฑ์ ์ถฉ์กฑ์ํค๊ณ ์ฑ
์๊ฐ ์๋ AI ๊ฐ๋ฐ์ ์ค์ง์ ๋ชจ๋ธ์ ์ ์ํ์ผ๋, ๋ฒ์ ยท์ค๋ฆฌ์ ์์ ์ ์์ ํ ํด๊ฒฐ๋ณด๋ค๋ ํฌ๋ช
์ฑ๊ณผ ๊ฐ์ ๋๊ตฌ๋ฅผ ์ ๊ณตํ๋ ์์ค์ผ๋ก, ์ฐ์
๋ฐ ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ์ ๊ธฐ์ฌ๋ฅผ ํฌ๊ฒ ๋์์ผ๋ ์ ์ฌ์ ๋ฒ์ ์ํ์ ์ฌ์ ํ ์กด์ฌํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๋ค๋ฅธ ์ ๊ทผ
StarCoder์ ์ ์ฌํ ์คํ์์ค ์ฝ๋ LLM(Code Llama) ๋ชจ๋ธ๋ก, ์ฝ๋ ์์ฑ ๋ฐ ์ฑ
์์ฑ ์๋ ์คํ LLM ์ ๋ต์ ๋ค๋ฅธ ํ๋ซํผ ๊ด์ ์์ ์ ๊ณตํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
StarCoder๋ Codex ์ดํ ์คํ์์ค ์ฝ๋ LLM์ ๋ฐ์ ์ ๋ํํ๋ฉฐ, HumanEval ๋ฒค์น๋งํฌ ๊ธฐ๋ฐ ํ๊ฐ ์ฒด๊ณ๊ฐ ์ด๋ป๊ฒ ๋ฐ์ ํ๋์ง ๋ณด์ฌ์ค๋ค.
ํ์ ์ฐ๊ตฌ
StarCoder2๋ StarCoder์ ์ง์ ์ ์ธ ํ์ ์ฐ๊ตฌ๋ก, ๋ ๋ฐ์ ๋ ์ํคํ
์ฒ์ ๋ฐ์ดํฐ๋ก ์คํ์์ค ์ฝ๋ LLM์ ์งํ๋ฅผ ๋ณด์ฌ์ค๋ค.
์์ฉ ์ฌ๋ก
๋๊ท๋ชจ ์ฝ๋ ํ์ต LLM์ ์ ์ฉ์ฑ๊ณผ ์ค์ ๊ณผํ ์๋ํ ์์ญ์์์ ์ฑ๋ฅ ๋ฒค์น๋งํน์ ํตํด StarCoder์ utility๋ฅผ ์
์ฆํฉ๋๋ค.
์์ฉ ์ฌ๋ก
SciCode ๋ฒค์น๋งํฌ๋ฅผ ํตํด StarCoder์ ๊ฐ์ ์คํ์์ค ์ฝ๋ LLM์ด ๊ณผํ ์ฐ๊ตฌ ์ฝ๋ฉ์์ ์ด๋ค ๋ฅ๋ ฅ์ ๋ฐํํ๋์ง ํ๊ฐํ ์ ์๋ค.
๋ฐ๋ก /๋นํ
SWE-bench๋ StarCoder์ ๊ฐ์ ์ฝ๋ LLM์ด ์ค์ GitHub ์ด์ ํด๊ฒฐ์์ ๋งค์ฐ ๋ฎ์ ์ฑ๋ฅ์ ๋ณด์์ ๋ณด์ฌ์ฃผ์ด, ์ฝ๋ LLM์ ํ์ค์ ํ๊ณ๋ฅผ ๋๋ฌ๋ธ๋ค.