์ ์: Baptiste Roziรจre, Jonas Gehring, Fabian Gloeckle, Sten Sootla, Itai Gat, Xiaoqing Tan, Yossi Adi, Jingyu Liu, Tal Remez, J. Rapin, Artyom Kozhevnikov, I. Evtimov, Joanna Bitton, Manish P Bhatt, Cristian Canton Ferrer, Aaron Grattafiori, Wenhan Xiong, Alexandre D'efossez, Jade Copet, Faisal Azhar | ๋ ์ง: 2023 | DOI: - 📄 PDF
Essence
Code Llama๋ Llama 2 ๊ธฐ๋ฐ์ ์คํ์์ค ์ฝ๋ ์์ฑ ๋๊ท๋ชจ์ธ์ด๋ชจ๋ธ(Large Language Model, LLM) ๊ณ์ด๋ก, ์ฝ๋ ์ธํ๋ง(infilling), ์ฅ๋ฌธ๋งฅ ์ฒ๋ฆฌ, ๋ช
๋ น์ด ์ถ์ข
๋ฅ๋ ฅ์ ๊ฐ์ถ ์ฐจ์ธ๋ ์ฝ๋ ์์ฑ ๋ชจ๋ธ์ด๋ค. 7B๋ถํฐ 70B ํ๋ผ๋ฏธํฐ๊น์ง 4๊ฐ์ง ํฌ๊ธฐ์ ๋ชจ๋ธ๊ณผ 3๊ฐ์ง ๋ณํ(๊ธฐ๋ณธ, Python ํนํ, Instruct)์ ์ ๊ณตํ๋ฉฐ, ๊ณต๊ฐ ๋ชจ๋ธ ์ค ์ต๊ณ ์์ค์ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค.
Evaluation
์ดํ: Code Llama๋ ์ฒด๊ณ์ ์ธ ๋ค๋จ๊ณ ํนํ ์ ๋ต์ผ๋ก ๊ณต๊ฐ ์ฝ๋ ์์ฑ LLM์ ์ค์ฉ์ฑ๊ณผ ์ฑ๋ฅ์ ๋์์ ๋ฌ์ฑํ ๊ฒฌ๊ณ ํ ์ฐ๊ตฌ์ด๋ค. ํนํ ์ธํ๋ง๊ณผ ์ฅ๋ฌธ๋งฅ ์ง์, ๋ค์ํ ๋ชจ๋ธ ๊ฐ์กฑ์ผ๋ก ์ค์ ๊ฐ๋ฐ ํ๊ฒฝ์ ์๊ตฌ์ฌํญ์ ๋ถ์ํ๋ ์ ์ด ํต์ฌ ๊ฐ์ ์ด๋ฉฐ, ์์
์ฉ ๋ผ์ด์ ์ค ๊ณต๊ฐ๋ฅผ ํตํด ์ฐ์
ํ์ฉ๋ ๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Evaluating large language models trained on code (Codex)๋ ์ฝ๋ ์์ฑ ํนํ LLM ๋ฐ์ ์ ์ด์์ ์ ๊ณตํ๋ฉฐ, Code Llama ๋ฐ ํ์ ์คํ์์ค ํ๊ฐ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Code llama ๋
ผ๋ฌธ์ ์ฝ๋ ์์ฑยทAPI ํ์ฉ ์คํ์์ค LLM์ ํต์ฌ ๊ธฐ๋ฐ์ ์ ๊ณตํ์ฌ ToolLLM์ ๊ธฐ๋ณธ ํ ๋๋ฅผ ์ด๋ฃน๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Code Llama ๋
ผ๋ฌธ์ StarCoder2์ ๋น์ทํ ๋ชฉ์ ์ ์คํ์์ค ์ฝ๋ ์์ฑ LLM ๊ฐ๋ฐ์ ์ ๊ตฌ์ ์ฌ๋ก๋ก, ์ฃผ์ ๋น๊ต ๋์์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Code llama(230)๋ LLM์ ์ฝ๋ฉ ๋ฐ ํ๋ก๊ทธ๋๋ฐ ์ญ๋์ ๊ธฐ๋ฐ์ด ๋๋ฉฐ, ์๋ ์ฆ๋ช
๋ฐ์ดํฐ ํฉ์ฑ ๋ฐ ํ์ฉ๊ณผ ์ฐ๊ณ ์ฐ๊ตฌ์ ๋ฐํ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Code Llama๋ ๋๊ท๋ชจ ์ฝ๋ ๋ฐ์ดํฐ๋ก ์ฌ์ ํ๋ จ๋ ๋ชจ๋ธ๋ก, LLM์ ํตํ ์ฐ๊ตฌ์ฝ๋ ์๋ ์์ฑ ๋ฒค์น๋งํฌ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Code Llama(230)์ ๋ํํ๋ ์ฝ๋ ์ธ์ด๋ชจ๋ธ์ด seed-coder์ ํ๋ จ ๋ฐ ํ๊ฐ์ ์ค์ง์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
230์ Code llama ํ๋ก์ ํธ๋ LLM ๊ธฐ๋ฐ ์ฝ๋ ์์ฑยท์คํ์ ๋ํ์ ๋ฐฉ๋ฒ๋ก ์ผ๋ก, 3160์ ์ฝ๋ํผ์คํธ LLM ์์ด์ ํธ๊ฐ ์งํฅํ๋ ๊ธฐ์ ์ ๋ฐฐ๊ฒฝ์
๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
230์ ์คํ์์ค ์ฝ๋ ๋ผ๋ง(LLM ๊ธฐ์ด ๋ชจ๋ธ)๋ฅผ ์๊ฐํด, 3288์ LLM+ํธ๋ฆฌ์์น ๊ธฐ๋ฐ ์ํํธ์จ์ด ์์ฑ AI์ ๊ธฐ์ ์ ยท๋ฐ์ดํฐ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ฝ๋ ํนํ ์ธ์ด ๋ชจ๋ธ ๊ฐ๋ฐ์์ ์ ์ฌํ ๋ฌธ์ ๋ฅผ ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ก ์ผ๋ก ํด๊ฒฐํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
StarCoder์ ์ ์ฌํ ์คํ์์ค ์ฝ๋ LLM(Code Llama) ๋ชจ๋ธ๋ก, ์ฝ๋ ์์ฑ ๋ฐ ์ฑ
์์ฑ ์๋ ์คํ LLM ์ ๋ต์ ๋ค๋ฅธ ํ๋ซํผ ๊ด์ ์์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Code llama ๋
ผ๋ฌธ์ ์ฝ๋ ์์ฑ์ ์ํ ์คํ LLM ์ฐ๊ตฌ๋ก, Codegen์ ๋ฉํฐํด ํ๋ก๊ทธ๋จ ํฉ์ฑ๊ณผ ์ฐจ๋ณ์ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
Deepseek-coder ์ญ์ ์คํ์์ค ์ฝ๋ LLM์ผ๋ก, ๋ค์ํ ๊ท๋ชจ์ ๋๋ฉ์ธ์์์ ์ฝ๋ ์์ฑ ๋ฅ๋ ฅ์ ๋น๊ต ์ฐ๊ตฌํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Code Llama ๋
ผ๋ฌธ์ Llama ๊ณ์ด์ ์ฝ๋ ํนํ ๋ชจ๋ธ๋ก, Llama 3์ ๋ฒ์ฉ์ ํน์ง๊ณผ ๋น๊ตํ๋ฉฐ ์ฝ์ผ๋ฉด LLM ํ์ฅ์ ๋ค์ํ ๋ฐฉํฅ์ ํ์
ํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
230๋ฒ ๋
ผ๋ฌธ์ ์ฝ๋์งํฅ LLM์ ์คํ๋ชจ๋ธ ๊ตฌ์ถ์ ๊ดํ ์ต์ ์ฌ๋ก๋ก, 544๋ฒ์ ์ค์ง์ ๋๋ฒ๊น
๋ฅ๋ ฅ ํ๊ฐ์ ์ฐ๊ณํด ์ฝ๊ธฐ์ ์ ํฉํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ฐจํธ-์ฝ๋ ๋ณํ์ ์ํ ๋ฉํฐ๋ชจ๋ฌ LLM ํ์ต ๋ฐ์ดํฐ์
๊ตฌ์ถ์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
Code Llama ๋ฑ ์ฝ๋ ์์ฑ/์ดํด์ ํนํ๋ LLM์ ๊ณผํ์ ๋ถ์๋ฅ๋ ฅ ํ๊ฐ์ DrugPlayGround์ ๋ฒค์น๋งํฌ(์ฝ๋ฌผ ๋ฐ๊ฒฌ ์์
LLM ์ฑ๋ฅ)๊ฐ ๋น๊ต๋ task ํน์ด์ฑ๊ณผ LLM ๋ฒ์ฉ์ฑ์ ์ฐจ์ด๋ฅผ ๋๋ฌ๋
๋๋ค.
ํ์ ์ฐ๊ตฌ
Code Llama ๋ฑ ๊ณต๊ฐ ์์ค ์ฝ๋ ๊ธฐ๋ฐ LLM๋ค๊ณผ Codex๋ฅผ ์์คํ
๋ฐ ์ฑ๋ฅ ์ธก๋ฉด์์ ๋น๊ตํ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
StarCoder 2๋ ์ฝ๋ ์์ฑ์ ํนํ๋ ์ต์ ์คํ์์ค LLM์ ๋ฐ์ ์์ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
Code Llama ๋
ผ๋ฌธ์ SWE-bench ํ๊ฐ์ ์ฐธ์ฌํ ์ต์ ์คํ์์ค ์ฝ๋ ์ธ์ด๋ชจ๋ธ๋ก, ์คํ ํ๊ณ์ ์ฑ๋ฅ ๋น๊ต๊ฐ ๊ฐ๋ฅํ๋ค.
์์ฉ ์ฌ๋ก
SWE-bench๋ Code Llama ๊ฐ์ ์คํ์์ค ์ฝ๋ ์์ฑ LLM์ ์ค์ ์ํํธ์จ์ด ์์ง๋์ด๋ง ์ด์ ํด๊ฒฐ๋ฅ๋ ฅ ํ๊ณ๋ฅผ ์คํ์ ์ผ๋ก ํ๊ฐํ๋ค.