MMSCI: A dataset for graduate-level multi-discipline multimodal scientific understanding

์ €์ž: Zekun Li, Xianjun Yang, Kyuri Choi, Wanrong Zhu, Ryan Hsieh, HyeonJung Kim, Jin Hyuk Lim, Sungyoung Ji, Byungju Lee, Xifeng Yan, Linda Ruth Petzold, Stephen D. Wilson, Woosang Lim, William Yang Wang | ๋‚ ์งœ: 2024 | DOI: N/A 📄 PDF


Essence

Figure 1

๊ทธ๋ฆผ 1: MMSCI ๋ฐ์ดํ„ฐ์…‹์˜ ์ƒ์œ„ 20๊ฐœ ๊ณผํ•™ ๋ถ„์•ผ๋ณ„ ๋…ผ๋ฌธ ์ˆ˜์™€ ์ด๋ฏธ์ง€ ์ˆ˜

๋ณธ ๋…ผ๋ฌธ์€ Nature Communications์˜ ๋™๋ฃŒํ‰๊ฐ€ ๋…ผ๋ฌธ 131,393๊ฐœ๋กœ๋ถ€ํ„ฐ 742,273๊ฐœ์˜ ์ด๋ฏธ์ง€๋ฅผ ์ˆ˜์ง‘ํ•˜์—ฌ, 72๊ฐœ ํ•™๋ฌธ ๋ถ„์•ผ์˜ ๋Œ€ํ•™์› ์ˆ˜์ค€ ๋ณต์žกํ•œ ๊ณผํ•™ ์‹œ๊ฐํ™”๋ฅผ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•œ ๋Œ€๊ทœ๋ชจ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ์ดํ„ฐ์…‹(MMSCI)์„ ์ œ์‹œํ•œ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด 19๊ฐœ ์–ธ์–ด๋น„์ „๋ชจ๋ธ(Large Vision Language Models, LVLMs)์„ ํ‰๊ฐ€ํ•˜๋ฉฐ, ๋ฏธ์„ธ ์กฐ์ • ๋ฐ ์‚ฌ์ „ ํ•™์Šต์„ ํ†ตํ•ด ๋ชจ๋ธ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ค€๋‹ค.

Motivation

Achievement

Figure 2

๊ทธ๋ฆผ 2: MMSCI์˜ 7๊ฐ€์ง€ ์ด์งˆ์  ๊ณผํ•™ ์ด๋ฏธ์ง€ ์œ ํ˜• ์˜ˆ์‹œ (์ •๋Ÿ‰์  ๋ฐ์ดํ„ฐ ์‹œ๊ฐํ™” 53.5%, ๊ฐœ๋žต๋„ 13.2%, ํ˜„๋ฏธ๊ฒฝ ์‚ฌ์ง„ 14.7% ๋“ฑ)

  1. ํฌ๊ด„์  ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•: 72๊ฐœ ๊ณผํ•™ ๋ถ„์•ผ, 131,393๊ฐœ ๋…ผ๋ฌธ, 742,273๊ฐœ ์ด๋ฏธ์ง€๋กœ ๊ตฌ์„ฑ๋œ ๋Œ€๊ทœ๋ชจ ๊ณ ํ’ˆ์งˆ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•. ๊ธฐ์กด ๋ฐ์ดํ„ฐ์…‹(์ฃผ๋กœ CS ๋ถ„์•ผ)๊ณผ ๋‹ฌ๋ฆฌ ์ž์—ฐ๊ณผํ•™ ์ „๋ฐ˜์„ ํญ๋„“๊ฒŒ ์ปค๋ฒ„ํ•˜๋ฉฐ ๋‹ค์–‘ํ•œ ์‹œ๊ฐํ™” ์œ ํ˜• ํฌํ•จ
  2. ์–ด๋ ค์šด ๋ฒค์น˜๋งˆํฌ ๊ณผ์ œ ๊ฐœ๋ฐœ: ๋„ํ˜• ์„ค๋ช…๊ณผ ๋‹ค์ง€์„ ๋‹คํ˜• ์งˆ๋ฌธ ๊ณผ์ œ ์„ค๊ณ„๋กœ, ๋‹ค์ˆ˜์˜ ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ์ด ๋ฌด์ž‘์œ„ ์ถ”์ธก ์ˆ˜์ค€ ์ดํ•˜์˜ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” ๋“ฑ ๊ณผ์ œ์˜ ๋‚œ์ด๋„์™€ ํ˜„์žฌ ๋ชจ๋ธ์˜ ํ•œ๊ณ„๋ฅผ ๋ช…ํ™•ํžˆ ๋“œ๋Ÿฌ๋ƒ„
  3. LVLM ์„ฑ๋Šฅ ํ‰๊ฐ€ ๋ฐ ๊ธฐ์ค€์„  ์ œ์‹œ: GPT-4o์™€ Claude-3.5-Sonnet์ด ์ตœ๊ณ  ์„ฑ๋Šฅ ๋ชจ๋ธ์ด๋ฉฐ, ์ผ๋ถ€ ๊ฒฝ์šฐ ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€๋ฅผ ์ดˆ๊ณผํ•˜๋Š” ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•จ์„ ํ™•์ธ. ๋ฏธ์„ธ ์กฐ์ •๋œ Qwen2-VL-7B์ด ๋‹ค์ง€์„ ๋‹คํ˜• ๋ฌธ์ œ์—์„œ GPT-4o ์„ฑ๋Šฅ์„ ์ƒํšŒ
  4. ํ›ˆ๋ จ ์ž์›์œผ๋กœ์„œ์˜ ๊ฐ€์น˜ ์ž…์ฆ: ๊ณผ์ œ ํŠนํ™” ๋ฐ์ดํ„ฐ๋กœ ๋ฏธ์„ธ ์กฐ์ • ์‹œ ์„ฑ๋Šฅ ํ–ฅ์ƒ ๋‹ฌ์„ฑ, ๊ทธ๋ฆฌ๊ณ  ๊ธฐ์‚ฌ์™€ ์ด๋ฏธ์ง€์˜ ์ธํ„ฐ๋ฆฌ๋ธŒ(interleaved) ๋ฐ์ดํ„ฐ๋กœ ์‚ฌ์ „ ํ•™์Šต ์‹œ ์žฌ๋ฃŒ๊ณผํ•™ ๋“ฑ ํ•˜์œ„ ๊ณผ์ œ์—์„œ ์„ฑ๋Šฅ ๊ฐœ์„  ํ™•์ธ

How

Figure 3

๊ทธ๋ฆผ 3: ๋ถ€-๋„ํ˜• ์บก์…˜ ์ถ”์ถœ์˜ ์˜ˆ์‹œ์™€ ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ ๊ตฌ์„ฑ

Originality

Limitation & Further Study

ํ›„์† ์—ฐ๊ตฌ ๋ฐฉํ–ฅ:

Evaluation

์ดํ‰: MMSCI๋Š” ๊ณผํ•™ ๋ถ„์•ผ์˜ ๋ณต์žกํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ดํ•ด๋ฅผ ๋‹ค๋ฃจ๋Š” ๋Œ€๊ทœ๋ชจ ๊ณ ํ’ˆ์งˆ ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ, ๊ธฐ์กด ์ฐจํŠธ ์ค‘์‹ฌ ๋ฒค์น˜๋งˆํฌ์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ณ  ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ์˜ graduate-level ์‹œ๊ฐํ™” ํ•ด์„์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•œ๋‹ค. ์‹ค์ œ ๋ฏธ์„ธ ์กฐ์ •๊ณผ ์‚ฌ์ „ ํ•™์Šต์„ ํ†ตํ•œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์ž…์ฆํ•จ์œผ๋กœ์จ ๊ณผํ•™ AI ์–ด์‹œ์Šคํ„ดํŠธ ๊ฐœ๋ฐœ์˜ ์ค‘์š”ํ•œ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋ฉฐ, ํŠนํžˆ ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€ ์ˆ˜์ค€์˜ ๋ชจ๋ธ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ์€ ์‹ค๋ฌด์  ๊ฐ€์น˜๋ฅผ ์ž…์ฆํ•œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
337(Figgen)์€ ๊ณผํ•™์  ํ…์ŠคํŠธ๋ฅผ ์ž๋™์œผ๋กœ ์‹œ๊ฐ ์ž๋ฃŒ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ธฐ์ˆ ์„ ํƒ์ƒ‰ํ•ด, 552์˜ ์ด๋ฏธ์ง€์™€ ํ…์ŠคํŠธ ํ†ตํ•ฉ ๋ฐ์ดํ„ฐ ๊ฐœ๋ฐœ ๋…ผ์˜์— ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ chain-of-thought reasoning ๋ฒค์น˜๋งˆํฌ๋Š” MMSCI๊ฐ€ ์ง€ํ–ฅํ•˜๋Š” ๋Œ€ํ•™์› ์ˆ˜์ค€ ๋ณตํ•ฉ ์‹œ๊ฐํ™” ์ดํ•ด ํ‰๊ฐ€์— ์ด๋ก ์  ๋ฐ‘๋ฐ”ํƒ•์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ํ…์ŠคํŠธ-์ด๋ฏธ์ง€ ์ƒ์„ฑ ๋˜๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์˜ ๊ธฐ๋ฐ˜ ๊ธฐ์ˆ ์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
552์—์„œ ์ œ์‹œํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๊ณผํ•™ ๋ฐ์ดํ„ฐ ์ดํ•ด ๊ณผ์ œ๋ฅผ, 368์˜ Gemini 1.5 ์„œ๋ฒ ์ด๋ฅผ ํ†ตํ•ด ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM ์„ฑ๋Šฅ์˜ ์ „๋ฐ˜์  ํ˜„ํ™ฉ ๋ฐ ํ•œ๊ณ„์™€ ํ•จ๊ป˜ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
737์˜ Sciverse ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM ๋ฒค์น˜๋งˆํฌ ๊ตฌ์ถ•์€ 552์˜ MMSCI ๋Œ€๊ทœ๋ชจ ๊ณผํ•™์ด๋ฏธ์ง€-ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ์…‹์— ๊ทธ ๊ทผ๊ฐ„์„ ๋‘๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ฐจํŠธ ์ดํ•ด๋ฅผ ์œ„ํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ ํ•™์Šต ๋ฐฉ๋ฒ•๋ก ์„ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™์  ์ด๋ฏธ์ง€ ๋ถ„์„์„ ์œ„ํ•œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด/์‹œ๊ฐ ๋ชจ๋ธ ํ™œ์šฉ์„ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์œผ๋กœ ์ ‘๊ทผํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์˜๋ฃŒ AI ์‹œ์Šคํ…œ์˜ ๋‹ค์–‘ํ•œ ์ž„์ƒ ์‘์šฉ์„ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ์ ‘๊ทผํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ธด ์ปจํ…์ŠคํŠธ ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ˜ ๋‹ค๋ฅธ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์„ ์ œ์‹œํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
MMSCI์™€ ๋น„์Šทํ•˜๊ฒŒ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ฐจํŠธยท๋น„์ฃผ์–ผ ๋ฐ์ดํ„ฐ์…‹์„ ํ™œ์šฉํ•˜์—ฌ ์–ธ์–ด๋น„์ „๋ชจ๋ธ์˜ ๊ณผํ•™ ์‹œ๊ฐํ™” ์ดํ•ด๋„๋ฅผ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
552(MMSCI)๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๊ณผํ•™ ์ด๋ฏธ์ง€์™€ ์–ธ์–ด ๋ฐ์ดํ„ฐ์…‹ ํ™•๋ฆฝ์œผ๋กœ, 566์˜ ์ฐจํŠธ-ํ…์ŠคํŠธ ํ†ตํ•ฉํ˜• ๋ฆฌํฌํŠธ ์ƒ์„ฑ ๋ฐ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๊ณผ ๋ฌธ์ œ์˜์‹์„ ๊ณต์œ ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹ค์ค‘๋ชจ๋‹ฌ ๋ฐ ๋ฉ€ํ‹ฐ๋„๋ฉ”์ธ ๊ณผํ•™ ๋ฐ์ดํ„ฐ์…‹์„ ํ†ตํ•œ LLM ํ‰๊ฐ€๋กœ ๋‹ค์–‘ํ•œ ๊ณผํ•™์  ๋งฅ๋ฝ์—์„œ ์„ฑ๋Šฅ ์ฒ™๋„์˜ ์ผ์น˜์ ์ด ์žˆ์Œ.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ฐจํŠธ ์‹œ๊ฐ์  ๋ถ„์„์„ ์œ„ํ•œ ๋‹ค๋ฅธ ๊ณ„์‚ฐ ๋ชจ๋ธ์„ ์ œ์•ˆํ•˜๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
308์ด ์–‘์žํ™”ํ•™ ์›Œํฌํ”Œ๋กœ์šฐ ์ž๋™ํ™”์— ์ดˆ์ ์„ ๋‘”๋‹ค๋ฉด, MMSCI(552)๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ•™์ œ๊ฐ„ ๊ณผํ•™ ๋ฌธ์ œ์—์„œ LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ์˜ ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹ค์ค‘ ๋ชจ๋‹ฌ ๊ณผํ•™์  ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋ฐ์ดํ„ฐ์…‹๊ณผ ๋ฒค์น˜๋งˆํฌ๋ฅผ ์ œ๊ณตํ•˜์—ฌ ์ด ๋…ผ๋ฌธ์˜ ์ฃผ์žฅ์„ ์‹ค์ฆ์ ์œผ๋กœ ํ…Œ์ŠคํŠธํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ถ„๋ฅ˜ ์ž‘์—…์—์„œ ์ž๋™ํ™”๋œ ๋จธ์‹ ๋Ÿฌ๋‹ ์ ‘๊ทผ๋ฒ•์˜ ํšจ์œจ์„ฑ์„ ํ‰๊ฐ€ํ•˜๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์˜๋ฃŒ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์˜ ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•œ ๋Œ€์•ˆ์  ๋ฒค์น˜๋งˆํฌ ๋˜๋Š” ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ฒฐ์ • ๊ตฌ์กฐ ํŠน์„ฑ ์˜ˆ์ธก์„ ์œ„ํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ ํšจ์œจ์ ์ธ ๋Œ€์•ˆ์  ๋ชจ๋ธ์„ ์ œ์‹œํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
MMSCI๋Š” ๋Œ€ํ•™์› ์ˆ˜์ค€์˜ ๊ณผํ•™ ๋ฐ ์ˆ˜๋ฆฌ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฌธ์ œ๋กœ ๊ตฌ์„ฑ๋œ ๋ฒค์น˜๋งˆํฌ๋กœ, SciBench์˜ ๋‚œ์ด๋„ยท์ŠคํŽ™ํŠธ๋Ÿผ ํ™•์žฅ์„ ์‹คํ˜„ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ChartGemma๋Š” ์ฐจํŠธ ๋ฆฌ์ฆˆ๋‹ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI ์„ฑ๋Šฅ์„ MMSCI ๋ฐ์ดํ„ฐ์…‹ ๋งฅ๋ฝ์—์„œ ๋”์šฑ ์‹ฌ์ธต์ ์œผ๋กœ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
MMSCI์˜ ๋™๋ฃŒํ‰๊ฐ€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๊ณผํ•™ ์‹œ๊ฐํ™” ์ดํ•ด ๋ฐ์ดํ„ฐ์…‹์—์„œ ํ‰๊ฐ€๋œ 19๊ฐœ LVLM์˜ ์„ฑ๋Šฅ์„, Scimage์—์„œ ์ถ”๊ฐ€์ ์œผ๋กœ ์‹ฌํ™” ๋ถ„์„ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
552์˜ ๋Œ€ํ•™์› ์ˆ˜์ค€ ๊ณผํ•™ ์‹œ๊ฐํ™” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ์ดํ„ฐ์…‹(MMSCI)์„, 737์—์„œ ๋‹ค์–‘ํ•œ LMM/LLM ๋ฒค์น˜๋งˆํฌ์™€ ์—ฐ๊ณ„ํ•˜์—ฌ ์‹ค์ œ ํ‰๊ฐ€ ์‚ฌ๋ก€๋กœ ๋ฐœ์ „์‹œํ‚ต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๊ณผํ•™์  ๊ทธ๋ฆผยท์ฐจํŠธ์— ๋Œ€ํ•œ ์บก์…˜ ์ƒ์„ฑ ์‹คํ—˜ ์‚ฌ๋ก€๋กœ MMSCI ๋ฐ์ดํ„ฐ๋ฅผ ์‹ค์ œ๋กœ ํ™œ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
MMSCI๋Š” ๋‹คํ•™์ œ์  ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ƒ์˜ํ•™ ์ž‘์—…์— ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ๊ณตํ•˜์—ฌ, BioProBench์˜ ํ”„๋กœํ† ์ฝœ ์ดํ•ด ๋ฐ ์ ˆ์ฐจ์  ์ถ”๋ก  ์‹œํ—˜ ๋ฌธ์ œ์™€ ์ง์ ‘์ ์ธ ์‘์šฉ ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
MMSCI ๋…ผ๋ฌธ์€ ์ƒ์ฒด ์‹ ํ˜ธ ๋ฐ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์˜ํ•™ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ํŠธ๋žœ์Šคํฌ๋จธ๋ฅ˜ ์•„ํ‚คํ…์ฒ˜๋“ค์˜ ์‘์šฉ ์‹คํ—˜์„ ๋‹ค๋ฃจ์–ด WaveFormer ์„ฑ๋Šฅ ์ ์šฉ ์‚ฌ๋ก€ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •