The Llama 3 Herd of Models

์ €์ž: Grattafiori, Aaron, Dubey, Abhimanyu, Jauhri, Abhinav ์™ธ ๋‹ค์ˆ˜ (Meta AI) | ๋‚ ์งœ: 2024.07.23 | DOI: arXiv:2407.21783 📄 PDF


Essence

Meta๊ฐ€ ๋ฐœํ‘œํ•œ Llama 3๋Š” 8B, 70B, 405B ํŒŒ๋ผ๋ฏธํ„ฐ ๊ทœ๋ชจ์˜ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ ๊ณ„์—ด๋กœ, 15T ๋‹ค๊ตญ์–ด ํ† ํฐ์œผ๋กœ ์‚ฌ์ „ํ•™์Šต๋˜์—ˆ์œผ๋ฉฐ 128K ํ† ํฐ ์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ๋ฅผ ์ง€์›ํ•˜๋Š” ๊ณ ์„ฑ๋Šฅ ๊ธฐ๋ฐ˜๋ชจ๋ธ(foundation model)์ด๋‹ค. GPT-4 ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๋ฉด์„œ ๋‹ค๊ตญ์–ด, ์ฝ”๋”ฉ, ์ถ”๋ก , ๋„๊ตฌ ์‚ฌ์šฉ ๋Šฅ๋ ฅ์„ ๊ธฐ๋ณธ์ ์œผ๋กœ ์ง€์›ํ•œ๋‹ค.

Motivation

Achievement

  1. ์ตœ๊ณ  ์„ฑ๋Šฅ ๋‹ฌ์„ฑ:
    • 405B ๋ชจ๋ธ์ด MMLU(87.3), HumanEval(89.0), GSM8K(96.8), ARC Challenge(96.9)์—์„œ GPT-4 ๋Œ€๋น„ ๋™๋“ฑ ์ด์ƒ์˜ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ
    • 8B, 70B ์†Œํ˜• ๋ชจ๋ธ๋„ ๋™๊ธ‰ ํŒŒ๋ผ๋ฏธํ„ฐ ๋ชจ๋ธ ์ค‘ ์ตœ๊ณ  ์„ฑ๋Šฅ(8B: MMLU 69.4, HumanEval 72.6)
  2. ๋‹ค๊ตญ์–ด ๋ฐ ์žฅ๋ฌธ๋งฅ ์ง€์›:
    • 8๊ฐœ ์ด์ƒ ์–ธ์–ด ์ง€์› (MGSM 91.6)
    • 128K ํ† ํฐ ์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ (ZeroSCROLLS/QuALITY 95.2)
  3. ๋„๊ตฌ ์‚ฌ์šฉ ๋Šฅ๋ ฅ: BFCL์—์„œ 88.5 ๋‹ฌ์„ฑํ•˜์—ฌ ์ œ๋กœ์ƒท ํ•จ์ˆ˜ ํ˜ธ์ถœ ๋Šฅ๋ ฅ ํ™•๋ณด
  4. ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ™•์žฅ: ์ด๋ฏธ์ง€, ๋น„๋””์˜ค, ์Œ์„ฑ ์ธ์‹ ๋Šฅ๋ ฅ์„ ์–ด๋Œ‘ํ„ฐ ๊ธฐ๋ฐ˜ ๋ฐฉ์‹์œผ๋กœ ํ†ตํ•ฉ (์•„์ง ๊ฐœ๋ฐœ ์ค‘)
  5. ์•ˆ์ „์„ฑ ๊ฐ•ํ™”: Llama Guard 3๋ฅผ ํ†ตํ•œ ์ž…์ถœ๋ ฅ ์•ˆ์ „ ํ•„ํ„ฐ๋ง ๋ฐ DPO ๊ธฐ๋ฐ˜์˜ ์ธ๊ฐ„ ํ”ผ๋“œ๋ฐฑ ์ •๋ ฌ

How

Figure 1: Llama 3์˜ ์ „์ฒด ์•„ํ‚คํ…์ฒ˜ ๋ฐ ํ›ˆ๋ จ ํŒŒ์ดํ”„๋ผ์ธ

์‚ฌ์ „ํ•™์Šต (Pre-training)

์‚ฌํ›„ํ•™์Šต (Post-training)

๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ™•์žฅ (๋ฏธ์ถœ์‹œ)

Originality

Limitation & Further Study

Evaluation

Novelty: 3.5/5 Technical Soundness: 4.5/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: Llama 3๋Š” ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ ๊ฐœ์„ ๊ณผ ๋Œ€๊ทœ๋ชจ ํˆฌ์ž๋ฅผ ํ†ตํ•ด GPT-4 ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•œ ์ค‘์š”ํ•œ ์˜คํ”ˆ์†Œ์Šค ๊ธฐ๋ฐ˜๋ชจ๋ธ์ด์ง€๋งŒ, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ†ตํ•ฉ์˜ ๋ฏธํกํ•จ๊ณผ ๊ธฐ์ˆ ์  ์„ธ๋ถ€์‚ฌํ•ญ์˜ ์ œํ•œ๋œ ๊ณต๊ฐœ๋Š” ์™„์ „ํžˆ ์ƒˆ๋กœ์šด ๋ฐฉ๋ฒ•๋ก ๋ณด๋‹ค๋Š” ๊ธฐ์กด ๊ธฐ๋ฒ•์˜ ์ •๊ตํ•œ ์กฐํ•ฉ๊ณผ ๊ทœ๋ชจํ™”์˜ ์ธก๋ฉด์—์„œ ๊ฐ€์น˜๋ฅผ ๊ฐ–๋Š”๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
467์€ ๋Œ€ํ˜• ์–ธ์–ด๋ชจ๋ธ์˜ ์•„ํ‚คํ…์ฒ˜์™€ ์„ฑ๋Šฅ ๋ฒ”์œ„๋ฅผ ์ด๋ง๋ผํ•˜์—ฌ 801์˜ Llama 3 ๊ณ„์—ด ์ถœ์‹œ์™€ ์ง์ ‘์ ์œผ๋กœ ์—ฐ๋™ํ•ด ์ฝ์„๋งŒํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Llama 3์™€ ๋น„๊ต ๊ฐ€๋Šฅํ•œ GPT-4 ๋ชจ๋ธ์˜ ๊ธฐ์ˆ  ์„ธ๋ถ€์‚ฌํ•ญ๊ณผ ์„ฑ๋Šฅ ํ‰๊ฐ€๋ฅผ ์ œ๊ณตํ•˜์—ฌ, ์„ฑ๋Šฅ ๋น„๊ต ๋ฐ ์ฐจ๋ณ„์„ฑ ๋…ผ์˜์— ๊ธฐ์ดˆ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Llama 3 ๋“ฑ ๊ฒฝ์ œ์  ์†Œํ˜• ์–ธ์–ด๋ชจ๋ธ์˜ ์—์ด์ „ํŠธ ์ ํ•ฉ์„ฑ์„ ์‹ค์ฆ์ ์œผ๋กœ ๊ฒ€ํ† ํ•˜๋Š” ๊ธฐ๋ณธ ๋…ผ๋ฌธ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Code Llama ๋…ผ๋ฌธ์€ Llama ๊ณ„์—ด์˜ ์ฝ”๋“œ ํŠนํ™” ๋ชจ๋ธ๋กœ, Llama 3์˜ ๋ฒ”์šฉ์  ํŠน์ง•๊ณผ ๋น„๊ตํ•˜๋ฉฐ ์ฝ์œผ๋ฉด LLM ํ™•์žฅ์˜ ๋‹ค์–‘ํ•œ ๋ฐฉํ–ฅ์„ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Gemini ๋…ผ๋ฌธ์€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ ๋‹ค์–‘ํ•œ ์ถ”๋ก  ํƒœ์Šคํฌ์— ๊ฐ•์ ์„ ๋ณด์ด๋Š” ๋Œ€ํ˜•๋ชจ๋ธ๋กœ์„œ, Llama 3์™€ ๋ชจ๋ธ ์„ฑ๋Šฅ, ์‚ฌ์ „ํ•™์Šต ๋ฐ์ดํ„ฐ, ์‘์šฉ๋ฒ”์œ„๋ฅผ ๋น„๊ตํ•˜๊ธฐ์— ์ข‹๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
770๋ฒˆ ๋…ผ๋ฌธ์€ StarCoder2๋ผ๋Š” ๋Œ€์•ˆ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ ๊ณ„์—ด์˜ ์„ค๊ณ„์™€ ์„ฑ๋Šฅ์„ ์ œ์‹œํ•˜์—ฌ Llama 3์˜ ์œ„์น˜๋ฅผ ๋น„๊ตํ•ด ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
The Llama 3 Herd of Models๋Š” ๋‹ค์–‘ํ•œ LLM์„ ํ™œ์šฉํ•œ ์ˆ˜๋ฆฌ ๋ฌธ์ œ ํ•ด๊ฒฐ์„ ๋‹ค๋ฃจ๋ฉฐ, ๋ฌผ๋ฆฌ ๋ฌธ์ œ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ ์—ฐ๊ตฌ์™€ ์ ‘๊ทผ ๋ฐฉ์‹์ด ์ƒ์ดํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Llama3 ๊ธฐ๋ฐ˜ ๋‹ค์–‘ํ•œ LLM ์—์ด์ „ํŠธ ๋ชจ๋ธ๊ตฐ์˜ ์‹ค์ œ ์‚ฌ์šฉ์ž ํ™œ์šฉ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„์„ํ•ด Perplexity ์‚ฌ๋ก€์™€ ๋Œ€์กฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
801๋ฒˆ ๋…ผ๋ฌธ์€ Llama 3 ๋“ฑ ์ƒˆ๋กœ์šด LLM ํŒจ๋ฐ€๋ฆฌ์˜ ๊ธฐ์ˆ  ์‚ฌ์–‘๊ณผ ์„ฑ๋Šฅ, GPT-4์™€์˜ ๋น„๊ต๊นŒ์ง€ ์ƒ์„ธํžˆ ๋‹ค๋ฃจ๋ฉฐ, 387๋ฒˆ์˜ ๋ชจ๋ธ ์„ฑ๋Šฅ ํ‰๊ฐ€๋ฅผ ๋ฏธ๋ž˜ํ˜• LLM์œผ๋กœ ํ™•์žฅํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
PIORS ๋…ผ๋ฌธ์€ LLM์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ํ™˜์ž ๋งž์ถคํ˜• ์™ธ๋ž˜์ ‘์ˆ˜ ์‹œ์Šคํ…œ์„ ๊ตฌํ˜„ํ•˜์—ฌ, Llama 3์™€ ๊ฐ™์€ ๊ณ ์„ฑ๋Šฅ LLM์˜ ์‹ค์ œ ํ™œ์šฉ ์‚ฌ๋ก€๋กœ ์ฝ์–ด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
The Llama 3 Herd of Models ๋…ผ๋ฌธ์€ ์‹ค์ œ ๋Œ€๊ทœ๋ชจ LMM ๋น„๊ต ์‹คํ—˜์„ ํ†ตํ•ด ์ธ๊ฐ„ ํ”ผ๋“œ๋ฐฑ-์ค‘์‹ฌ ์ƒํ˜ธ์ž‘์šฉ์˜ ์‹ค์ œ์  ํšจ์šฉ์„ ๊ฒ€์ฆํ•ฉ๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
801 ๋…ผ๋ฌธ์€ ๋‹ค์–‘ํ•œ LLM ๊ธฐ๋ฐ˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ ๋ฐ ํ•œ๊ณ„์ ์„ ๋” ํญ๋„“๊ฒŒ ๋น„๊ตยทํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •