Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context

์ €์ž: Machel Reid, N. Savinov, Denis Teplyashin, Dmitry Lepikhin, T. Lillicrap, Jean-Baptiste Alayrac, Radu Soricut, Angeliki Lazaridou, Orhan Firat, Julian Schrittwieser, Ioannis Antonoglou, Rohan Anil, Sebastian Borgeaud, Andrew M. Dai, Katie Millican, Ethan Dyer, Mia Glaese, Thibault Sottiaux, Benjamin Lee, Fabio Viola | ๋‚ ์งœ: 2024 | DOI: arXiv:2403.05530v5 📄 PDF


Essence

Figure 1

Gemini 1.5 Pro๋Š” ๋ชจ๋“  ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ(ํ…์ŠคํŠธ, ๋น„๋””์˜ค, ์˜ค๋””์˜ค)์—์„œ 1M ํ† ํฐ๊นŒ์ง€ 99.7% ์ด์ƒ์˜ "needle" recall์„ ๋‹ฌ์„ฑํ•˜๋ฉฐ, ํ…์ŠคํŠธ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ์—์„œ๋Š” 10M ํ† ํฐ๊นŒ์ง€ ์„ฑ๋Šฅ์„ ์œ ์ง€ํ•จ

Gemini 1.5๋Š” ์ตœ๋Œ€ 1,000๋งŒ ํ† ํฐ์˜ ์ปจํ…์ŠคํŠธ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ๋กœ, ๊ธฐ์กด ๋ชจ๋ธ๋“ค(Claude 3.0์˜ 20๋งŒ ํ† ํฐ, GPT-4 Turbo์˜ 12.8๋งŒ ํ† ํฐ)๋ณด๋‹ค ํš๊ธฐ์ ์œผ๋กœ ํ™•์žฅ๋œ ์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ๋ฅผ ๊ตฌํ˜„ํ–ˆ๋‹ค. Gemini 1.5 Pro์™€ Flash ๋‘ ๊ฐ€์ง€ ๋ณ€ํ˜•์€ ๊ธด ๋ฌธ์„œ, ์˜์ƒ, ์˜ค๋””์˜ค์— ๋Œ€ํ•œ ๊ฒ€์ƒ‰ ๋ฐ ์ถ”๋ก  ๋Šฅ๋ ฅ์—์„œ ์ตœ์ฒจ๋‹จ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๋ฉด์„œ๋„ ๊ณ„์‚ฐ ํšจ์œจ์„ฑ์„ ์œ ์ง€ํ•œ๋‹ค.

Motivation

Achievement

Figure 2

Gemini 1.5 Pro (May 2024)๋Š” MATH (58.5% โ†’ 67.7%), GPQA (41.5% โ†’ 46.2%), MathVista (54.7% โ†’ 63.9%), EgoSchema (65.1% โ†’ 72.2%) ๋“ฑ ๋‹ค์–‘ํ•œ ๋ฒค์น˜๋งˆํฌ์—์„œ February ๋ฒ„์ „ ๋Œ€๋น„ ์ผ๊ด€๋œ ๊ฐœ์„ ์„ ๋ณด์ž„

  1. ์ดˆ์žฅ๋ฌธ๋งฅ ์ฒ˜๋ฆฌ: Gemini 1.5 Pro๋Š” ํ…์ŠคํŠธ์—์„œ 1,000๋งŒ ํ† ํฐ(์•ฝ 700๋งŒ ๋‹จ์–ด), ์˜ค๋””์˜ค์—์„œ 970๋งŒ ํ† ํฐ(์ตœ๋Œ€ 107์‹œ๊ฐ„), ๋น„๋””์˜ค์—์„œ 990๋งŒ ํ† ํฐ(์ตœ๋Œ€ 10.5์‹œ๊ฐ„)๊นŒ์ง€ ์ฒ˜๋ฆฌ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ๋ชจ๋“  ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ์—์„œ 99% ์ด์ƒ์˜ "needle" recall ๋‹ฌ์„ฑ.
  2. ํ•ต์‹ฌ ๋Šฅ๋ ฅ ๊ฐ•ํ™”: Gemini 1.5 Pro๋Š” Gemini 1.0 Ultra์™€ ๋น„๊ตํ•˜์—ฌ ์ข…ํ•ฉ ๋ฒค์น˜๋งˆํฌ์˜ 77.8% (35/45), ํ…์ŠคํŠธ์˜ 84.2% (16/19), ๋น„์ „์˜ 85.7% (18/21)์—์„œ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๋ฉด์„œ๋„, ํ•™์Šต ๊ณ„์‚ฐ๋Ÿ‰์€ ํ›จ์”ฌ ์ ์Œ. ์ˆ˜ํ•™(+49.6%), ๊ณผํ•™ ๋ฐ ์ถ”๋ก (+30.8%), ๋‹ค๊ตญ์–ด์„ฑ(+21.4%), ์ฝ”๋“œ(+21.5%) ๋“ฑ์—์„œ ๋Œ€ํญ ๊ฐœ์„ .
  3. ํ˜์‹ ์  in-context learning: 200๋ช… ๋ฏธ๋งŒ์˜ ํ™”์ž๋ฅผ ๊ฐ€์ง„ ํŒŒํ‘ธ์•„ ์–ธ์–ด "Kalamang"์˜ 500์ชฝ ๋ฌธ๋ฒ• ์ž๋ฃŒ๋ฅผ ์ปจํ…์ŠคํŠธ์— ์ œ๊ณตํ•˜๋ฉด, ๊ฐ™์€ ์ž๋ฃŒ๋กœ ํ•™์Šตํ•œ ์ธ๊ฐ„๊ณผ ์œ ์‚ฌํ•œ ์ˆ˜์ค€์˜ ๋ฒˆ์—ญ ๋Šฅ๋ ฅ์„ ํš๋“. ์ฒ˜์Œ์œผ๋กœ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ž๋ฃŒ(ํ…์ŠคํŠธ + ์Œ์„ฑ)๋กœ๋ถ€ํ„ฐ ์ƒˆ๋กœ์šด ์–ธ์–ด์˜ ์Œ์„ฑ ์ธ์‹๋„ ํ•™์Šต ๊ฐ€๋Šฅ.
  4. ์‹ค๋ฌด ์ƒ์‚ฐ์„ฑ ํ–ฅ์ƒ: 10๊ฐœ ์ง์ข…์—์„œ ์ „๋ฌธ๊ฐ€์™€์˜ ํ˜‘์—…์„ ํ†ตํ•ด 26~75%์˜ ์ž‘์—… ์‹œ๊ฐ„ ๋‹จ์ถ• ๋‹ฌ์„ฑ.

How

Figure 4

Kalamang ์–ธ์–ด: 500์ชฝ ๋ฌธ๋ฒ• ์ฐธ๊ณ ์„œ์™€ ์‚ฌ์ „์„ ์ปจํ…์ŠคํŠธ์— ์ œ๊ณตํ•˜์—ฌ ์˜์–ด-Kalamang ๋ฒˆ์—ญ์„ ํ•™์Šต

Originality

Limitation & Further Study

Evaluation

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Gemini 1.5 ๊ฐœ๋ฐœ์— ์•ž์„œ ๋ฐœํ‘œ๋œ Gemini ์‹œ๋ฆฌ์ฆˆ ๊ธฐ์ˆ ๋ณด๊ณ ์„œ๋กœ, ๋ชจ๋ธ ๊ตฌ์กฐ์™€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ฒ˜๋ฆฌ ๊ธฐ๋ฒ•์˜ ์—ฐ์†์  ์ง„ํ™” ๋งฅ๋ฝ์„ ์งš์–ด์ค€๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
387 ๋…ผ๋ฌธ์€ GPT-4 ๊ธฐ์ˆ  ๋ฆฌํฌํŠธ๋กœ, 368 ๋…ผ๋ฌธ์˜ Gemini 1.5์™€ ์ฃผ์š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์˜ ๊ตฌ์กฐ ๋ฐ ์„ฑ๋Šฅ์„ ๋น„๊ตยท๋ถ„์„ํ•  ๋•Œ ๊ธฐ์ดˆ ์ž๋ฃŒ๋กœ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
368์€ Gemini 1.5์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์„ฑ๋Šฅ๊ณผ ์•„ํ‚คํ…์ฒ˜๋ฅผ ํญ๋„“๊ฒŒ ์„ค๋ช…ํ•˜์—ฌ, 879์˜ ์‹คํ—˜ ๋ถ„์„์˜ ๊ธฐ๋ณธ ๋ชจ๋ธ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
368์€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์˜ ๊ณผํ•™ ์ด๋ฏธ์ง€ ์ดํ•ด ํ•œ๊ณ„๋ฅผ ์ข…ํ•ฉ์ ์œผ๋กœ ์ง„๋‹จํ•˜๋ฉฐ, 727์˜ ํ‰๊ฐ€ ๋ฒค์น˜๋งˆํฌ ์„ค๊ณ„์— ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
552์—์„œ ์ œ์‹œํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๊ณผํ•™ ๋ฐ์ดํ„ฐ ์ดํ•ด ๊ณผ์ œ๋ฅผ, 368์˜ Gemini 1.5 ์„œ๋ฒ ์ด๋ฅผ ํ†ตํ•ด ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM ์„ฑ๋Šฅ์˜ ์ „๋ฐ˜์  ํ˜„ํ™ฉ ๋ฐ ํ•œ๊ณ„์™€ ํ•จ๊ป˜ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Gemini 1.5์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ดํ•ด ๋ฐ ์˜๋ฃŒ ๋ถ„์•ผ ๋ฒค์น˜๋งˆํ‚น์ด ๋ณธ ๋…ผ๋ฌธ Med-Gemini์˜ ๊ฐœ๋ฐœ๊ณผ ํ‰๊ฐ€์— ํ•ต์‹ฌ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Gemini 1.5 ๋…ผ๋ฌธ์€ ์ดˆ๋Œ€๊ทœ๋ชจ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์˜ ์›น-๋น„์ „ ์—ฐํ•ฉ ์ถ”๋ก  ์„ฑ๋Šฅ๊ณผ WebWatcher์˜ VL ์—์ด์ „ํŠธ ๊ตฌ์กฐ์— ์ง์ ‘์  ์ฐธ๊ณ ๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
368์˜ Gemini 1.5์™€ ๊ฐ™์€ ๋Œ€์šฉ๋Ÿ‰ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์€ 670์˜ ์ž๋™ ์ฝ”๋“œํ™” ์‹œ์Šคํ…œ์— ํ•„์š”ํ•œ ๋Œ€๊ทœ๋ชจ ๋งฅ๋ฝ ์ดํ•ด์™€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ฒ˜๋ฆฌ๋ฅผ ๊ธฐ์ˆ ์ ์œผ๋กœ ๋’ท๋ฐ›์นจํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Gemini 1.5 ๋…ผ๋ฌธ์€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ดํ•ด์˜ ํ™•์žฅ์„ฑ๊ณผ ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ๋Šฅ๋ ฅ์„ ์ถ”๊ฐ€์ ์œผ๋กœ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ธด ์ปจํ…์ŠคํŠธ ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ˜ ๋‹ค๋ฅธ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์„ ์ œ์‹œํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์˜ ๋‹ค๋ฅธ ์•„ํ‚คํ…์ฒ˜ ๋ฐ ์„ฑ๋Šฅ์„ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋Œ€๊ทœ๋ชจ ์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ๋ฅผ ํ™œ์šฉํ•˜๋Š” LLM์˜ ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
649์˜ Qwen2.5์™€ 368์˜ Gemini 1.5๋Š” ์ดˆ๋Œ€์šฉ๋Ÿ‰ ์ปจํ…์ŠคํŠธ ๋ฐ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM ๋ฐœ์ „์„ ๋Œ€ํ‘œํ•˜๋ฉฐ, ๋ชจ๋ธ ๊ตฌ์กฐ์™€ ํšจ์šฉ ๋ฉด์—์„œ ์„œ๋กœ ๋Œ€์กฐ์ ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Gemini ๊ณ„์—ด ๋ชจ๋ธ๊ณผ ๋น„๊ต๋˜๋Š” ๋‹ค๋ฅธ ๋Œ€๊ทœ๋ชจ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ดํ•ด ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ˜ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์„ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์˜ ๊ณต๊ฐ„ ์ถ”๋ก  ๋˜๋Š” ์‹œ๊ฐ์  ์ดํ•ด ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ์œ ์‚ฌํ•œ ๋ฒค์น˜๋งˆํฌ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ํ…Œ์ด๋ธ”-ํ…์ŠคํŠธ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ QA์˜ ํŠน์ • ์ธก๋ฉด์„ ํ™•์žฅํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Gemini 1.5์™€ ๋™์‹œ๋Œ€ ์ตœ์ฒจ๋‹จ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM(GPT-4o)์˜ ๊ฐ•์  ๋ฐ ์ปจํ…์ŠคํŠธ ์ด์šฉ ๋ฐฉ์‹์˜ ์ฐจ์ด๋ฅผ ๋น„๊ต ๋ถ„์„ํ•  ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Gemini 1.5์˜ ์žฅ๋Œ€ ํ† ํฐ ์œˆ๋„์šฐ ๋ฐ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ดํ•ด ๋Šฅ๋ ฅ์€ ๋Œ€๊ทœ๋ชจ LLM์˜ ํšจ์œจ์  ํ•™์Šตยท์ถ”๋ก  ์‘์šฉ ์‚ฌ๋ก€๋กœ ์ง์ ‘ ์ด์–ด์ง‘๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
368๊ณผ ๊ฐ™์€ ์žฅ๋ฌธยท๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ดํ•ด๋ ฅ์€ 773์—์„œ ๋…ผ๋ฌธ์„ ๋™์˜์ƒ ๋ฐ ์‹œ๊ฐ ์ฝ˜ํ…์ธ ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ์ž‘์—…์„ ์‹ค์ œ ๊ตฌํ˜„ํ•˜๋Š” ๋ฐ ํ•„์š”ํ•œ ๊ธฐ๋ฐ˜ ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Gemini 1.5 ๊ฐ™์€ ์ดˆ์žฅ๋ฌธ๋งฅ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์ด ํ–ฅํ›„ ๋น„๋””์˜ค ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์„ค๋ช… ๋ฐ ํ‰๊ฐ€ ์—์ด์ „ํŠธ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ ํ™•์žฅ์— ์ ์šฉ ๊ฐ€๋Šฅํ•จ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •