GPT-4o System Card

์ €์ž: OpenAI Aaron Hurst, Adam Lerer, Adam P. Goucher, Adam Perelman, Aditya Ramesh | ๋‚ ์งœ: 2024 | DOI: [ํ•ด๋‹น ์—†์Œ] 📄 PDF


Essence

GPT-4o๋Š” ํ…์ŠคํŠธ, ์˜ค๋””์˜ค, ์ด๋ฏธ์ง€, ๋น„๋””์˜ค๋ฅผ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›์•„ ํ…์ŠคํŠธ, ์˜ค๋””์˜ค, ์ด๋ฏธ์ง€๋ฅผ ์ถœ๋ ฅํ•  ์ˆ˜ ์žˆ๋Š” ์—”๋“œ-ํˆฌ-์—”๋“œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์ด๋ฉฐ, ํŠนํžˆ ์Œ์„ฑ-์Œ์„ฑ(speech-to-speech) ๋Œ€ํ™” ๋Šฅ๋ ฅ์—์„œ ์ธ๊ฐ„ ์ˆ˜์ค€์˜ ์‘๋‹ต ์†๋„(232-320ms)๋ฅผ ๋‹ฌ์„ฑํ–ˆ๋‹ค. ๋ณธ System Card๋Š” GPT-4o์˜ ์•ˆ์ „์„ฑ ํ‰๊ฐ€, ์œ„ํ—˜ ์‹๋ณ„, ์™„ํ™” ์กฐ์น˜๋ฅผ ์ข…ํ•ฉ์ ์œผ๋กœ ๋ฌธ์„œํ™”ํ•œ ํˆฌ๋ช…์„ฑ ๋ณด๊ณ ์„œ์ด๋‹ค.

Motivation

Achievement

Figure 1: Quantum physics experiment red teamer example

์–‘์ž๋ฌผ๋ฆฌํ•™ ์‹คํ—˜ ๊ด€๋ จ ์ ์ƒ‰ํŒ€ ํ…Œ์ŠคํŠธ ์‚ฌ๋ก€

Figure 2: Multi-panel figure interpretation red teamer example

๋‹ค์ค‘ ํŒจ๋„ ์ด๋ฏธ์ง€ ํ•ด์„ ์ ์ƒ‰ํŒ€ ํ…Œ์ŠคํŠธ ์‚ฌ๋ก€

  1. ํฌ๊ด„์  ์™ธ๋ถ€ ์ ์ƒ‰ํŒ€ ์šด์˜: 4๋‹จ๊ณ„(3์›”~6์›”)์— ๊ฑธ์ณ ์ดˆ๊ธฐ ๊ฐœ๋ฐœ ๋‹จ๊ณ„๋ถ€ํ„ฐ ์ตœ์ข… iOS ์•ฑ ์‹ค์ œ ์‚ฌ์šฉ ํ™˜๊ฒฝ๊นŒ์ง€ 100๋ช… ์ด์ƒ์˜ ๋‹ค๊ตญ์–ด ์ „๋ฌธ๊ฐ€(์ธ์ง€๊ณผํ•™, ์‚ฌ์ด๋ฒ„๋ณด์•ˆ, ํŽธํ–ฅ์„ฑ, ์•„๋™์•ˆ์ „, ๋ฒ•๋ฅ  ๋“ฑ 28๊ฐœ ๋„๋ฉ”์ธ)์™€ ํ˜‘๋ ฅํ•˜์—ฌ 2,600+ ์œ„ํ—˜ ์นดํ…Œ๊ณ ๋ฆฌ ์‹๋ณ„
  2. ์Œ์„ฑ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ ํŠนํ™” ์œ„ํ—˜ ์‹๋ณ„ ๋ฐ ์™„ํ™”: (1) ๋ฌด๋‹จ ์Œ์„ฑ ์ƒ์„ฑ - ์‚ฌ์ „ ์„ ํƒ๋œ ์Œ์„ฑ๋งŒ ์‚ฌ์šฉ + ์ถœ๋ ฅ ๋ถ„๋ฅ˜๊ธฐ, (2) ํ™”์ž ์‹๋ณ„ - ๊ฑฐ๋ถ€ ๊ต์œก, (3) ์ €์ž‘๊ถŒ ์ฝ˜ํ…์ธ  - ์Œ์„ฑ ํŠนํ™” ํ•„ํ„ฐ, (4) ๊ทผ๊ฑฐ ์—†๋Š” ์ถ”๋ก  - ๋ฏผ๊ฐํ•œ ํŠน์„ฑ ์†์„ฑ ์‹œ ์™„ํ™”๋œ ์‘๋‹ต ์ œ๊ณต
  3. ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก  ํ˜์‹ : ๊ธฐ์กด ํ…์ŠคํŠธ ๊ธฐ๋ฐ˜ ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ์…‹์„ Voice Engine์„ ํ†ตํ•ด ์˜ค๋””์˜ค๋กœ ๋ณ€ํ™˜ํ•˜์—ฌ ์žฌ์‚ฌ์šฉ, ์ง€์—ญ ๋ฐฉ์–ธ์— ๋”ฐ๋ฅธ ๊ฒฌ๊ณ ์„ฑ ํ‰๊ฐ€ ํฌํ•จ
  4. ์•ˆ์ „ ์™„ํ™”์˜ ๋‹ค์ธต ๋ฐฉ์–ด: ํ•™์Šต ๋ฐ์ดํ„ฐ ํ•„ํ„ฐ๋ง(CSAM, ํ˜์˜ค ์ฝ˜ํ…์ธ , CBRN ์ œ๊ฑฐ), ํ›„ํ•™์Šต ์ •๋ ฌ(post-training alignment), ์ถœ๋ ฅ ๋ถ„๋ฅ˜๊ธฐ, ์ •์ฑ… ์ˆ˜์ค€ ๊ฐ์‹œ(monitoring) ๋ฐ ์ง‘ํ–‰์„ ํ†ตํ•œ ํฌ๊ด„์  ์ ‘๊ทผ

How

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 4/5 Significance: 5/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ๋ณธ System Card๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์Œ์„ฑ ์ƒ์„ฑ ๋ชจ๋ธ์˜ ๊ณ ์œ ํ•œ ์œ„ํ—˜์„ ์ฒด๊ณ„์ ์œผ๋กœ ์‹๋ณ„ํ•˜๊ณ  ๋‹ค์ธต ๋ฐฉ์–ด ์ „๋žต์œผ๋กœ ์™„ํ™”ํ•˜๋Š” ์‹ค์งˆ์  ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•จ์œผ๋กœ์จ, ๊ฑฐ๋Œ€์–ธ์–ด๋ชจ๋ธ์˜ ํˆฌ๋ช…์„ฑ๊ณผ ์ฑ…์ž„์„ฑ ๋ณด๊ณ  ๊ธฐ์ค€์„ ์ •๋ฆฝํ•˜๋Š” ๋ฐ ์ค‘์š”ํ•œ ๊ธฐ์—ฌ๋ฅผ ํ–ˆ๋‹ค. ๋‹ค๋งŒ TTS ๊ธฐ๋ฐ˜ ํ‰๊ฐ€์˜ ๋ฐฉ๋ฒ•๋ก ์  ํ•œ๊ณ„์™€ ์‹ค์ œ ์‚ฌ์šฉ ํ™˜๊ฒฝ์˜ ์Œ์„ฑ ๋‹ค์–‘์„ฑ ์‚ฌ์ด์˜ ๊ฐ„๊ทน ํ•ด๊ฒฐ์ด ํ–ฅํ›„ ๊ณผ์ œ๋กœ ๋‚จ์•„์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
GPT-4 Technical Report๋Š” ์ด์ „ ์„ธ๋Œ€ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ, ํ‰๊ฐ€, ์•ˆ์ „ ์ฒด๊ณ„ ์„ค๋ช…์„ ํ†ตํ•ด GPT-4o System Card์˜ ๋งฅ๋ฝ๊ณผ ๊ฐœ์„ ์ ์„ ์ดํ•ดํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
TrustLLM ๋…ผ๋ฌธ์€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์˜ ์‹ ๋ขฐ์„ฑ๊ณผ ์•ˆ์ „์„ฑ ํ‰๊ฐ€/๊ฐ•ํ™”์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜๊ณผ ์ตœ์‹  ๋ฐฉ๋ฒ•์„ ์ •๋ฆฌํ•ด GPT-4o ํ‰๊ฐ€์˜ ์ด๋ก ์  ๊ทผ๊ฑฐ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
GPT-4o System Card๋Š” OpenAI o1 ๋ชจ๋ธ์˜ ์ฃผ์š” ์ „์‹  ๋ชจ๋ธ๋กœ ์•ˆ์ „์„ฑ ๊ฐ•ํ™”์˜ ๊ธฐ์ดˆ๊ฐ€ ๋˜๋Š” ์›๋ฆฌ์™€ ๋ฐœ์ „๊ฒฝ๋กœ๋ฅผ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Gemini ๋…ผ๋ฌธ ์—ญ์‹œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ๊ณผ ์•ˆ์ „์„ฑ ํ‰๊ฐ€๋ฅผ ์ƒ์„ธํžˆ ๋‹ค๋ฃจ๋ฏ€๋กœ, GPT-4o System Card์™€ ๋ชจ๋ธ ์•ˆ์ „์„ฑ ๋ฐ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋Œ€ํ™” ๊ตฌ์กฐ๋ฅผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ตœ์‹  LLM์˜ ๋ณต์žกํ•œ ์ถ”๋ก  ์ž‘์—… ์ˆ˜ํ–‰ ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
388๋ฒˆ ๋…ผ๋ฌธ์€ GPT-4o์˜ ์‹œ์Šคํ…œ ์นด๋“œ๋กœ์„œ 387๋ฒˆ GPT-4์™€ ์—ฐ๊ณ„๋œ ์ตœ์‹  ์„ฑ๋Šฅ/๋ณด์•ˆ/์ฑ…์ž„์„ฑ ๊ฐœ์„  ํŠธ๋ Œ๋“œ๋ฅผ ์ œ์‹œํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Openai o1 system card ๋…ผ๋ฌธ์€ GPT-4o์™€ ์œ ์‚ฌํ•œ ์‹œ์Šคํ…œ์˜ ์•ˆ์ „์„ฑยท์œ„ํ—˜ ํ‰๊ฐ€ ์ฒด๊ณ„๋ฅผ ์ƒ์„ธํžˆ ์„ค๋ช…ํ•˜์—ฌ, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์˜ ์•ˆ์ „์„ฑ ํ‰๊ฐ€ ํŠธ๋ Œ๋“œ๋ฅผ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Gemini 1.5์™€ ๋™์‹œ๋Œ€ ์ตœ์ฒจ๋‹จ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM(GPT-4o)์˜ ๊ฐ•์  ๋ฐ ์ปจํ…์ŠคํŠธ ์ด์šฉ ๋ฐฉ์‹์˜ ์ฐจ์ด๋ฅผ ๋น„๊ต ๋ถ„์„ํ•  ์ˆ˜ ์žˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •