์ ์: Renqiu Xia, Bo Zhang, Hancheng Ye, Xiangchao Yan, Qi Liu, Hongbin Zhou, Zijun Chen, Min Dou, Botian Shi, Junchi Yan, Yu Qiao | ๋ ์ง: 2024 | DOI: N/A 📄 PDF
Figure 1: ChartX ํ๊ฐ ๋ฐ์ดํฐ์ ๊ณผ ChartVLM ๋ชจ๋ธ์ ๊ฐ์. ChartX๋ 22๊ฐ ๋ถ์ผ, 18๊ฐ ์ฐจํธ ์ ํ, 7๊ฐ ์์ ์ ํฌํจํ๋ฉฐ, ChartVLM์ instruction adapter๋ฅผ ํตํด ์์ ์ ๋์ ์ผ๋ก ์ ํํ๊ณ ์ธ์ ์์ ๊ฒฐ๊ณผ๋ฅผ ์ถ๋ก ์์ ์ ํตํฉํ์ฌ ํด์๊ฐ๋ฅ์ฑ์ ํฅ์์ํจ๋ค.
๋ณธ ๋ ผ๋ฌธ์ ๋ค์ค๋ชจ๋ฌ ๋ํ์ธ์ด๋ชจ๋ธ(MLLM)์ ์ฐจํธ ์ดํด ๋ฅ๋ ฅ์ ์ข ํฉ์ ์ผ๋ก ํ๊ฐํ๊ธฐ ์ํด ChartX ๋ฒค์น๋งํฌ์ ChartVLM ๊ธฐ์ด๋ชจ๋ธ์ ์ ์ํ๋ค. ํนํ ์ฐจํธ ๋ฐ์ดํฐ ์ถ์ถ๊ณผ ๋ณต์กํ ์ถ๋ก ์ ํฌํจํ๋ ๋ค๋จ๊ณ ์์ ์์ ๋ชจ๋ธ์ ํด์๊ฐ๋ฅ์ฑ์ ๊ฐํํ๋ ์๋ก์ด ์ ๊ทผ๋ฐฉ์์ ์ ์ํ๋ค.
Figure 4: ChartVLM์ ์ํคํ ์ฒ. ๊ธฐ๋ณธ ๋์ฝ๋๋ ์ ๋ชฉ/์ ํ/๊ตฌ์กฐ ์ถ์ถ(SE)์ ๋ด๋นํ๊ณ , ๋ณด์กฐ ๋์ฝ๋๋ instruction adapter๋ฅผ ํตํด ๋์ ์ผ๋ก QA, ์ค๋ช , ์์ฝ, ์ฝ๋ ์ฌ์์ฑ ๋ฑ์ ์์ ์ ์ ํ ์คํํ๋ค.
Figure 3: ์ฐจํธ ๋ฐ์ดํฐ ์์ง ๋ฐ ํ์ง ๊ฒ์ฆ ํ์ดํ๋ผ์ธ
์ดํ: ChartX & ChartVLM์ ์ฐจํธ ์ดํด ๋ฒค์น๋งํน๊ณผ ๋ชจ๋ธ ๊ฐ๋ฐ์ ์์ด ์ค์ํ ์ด์ ํ๋ฅผ ์ ์ํ๋ค. ํนํ ํด์๊ฐ๋ฅ์ฑ์ ๊ฐ์กฐํ๋ ์ค๊ณ ์ฒ ํ๊ณผ ๊ณต๊ฐ ๋ฐ์ดํฐ์ ์ ๊ท๋ชจ๋ ํด๋น ๋ถ์ผ์ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ์ ํ์ฑํ ๊ฐ๋ฅ์ฑ์ด ๋๋ค. ๋ค๋ง ์ค์ ์์ฐ ์ฐจํธ ๋ฐ์ดํฐ ํตํฉ๊ณผ ๋ชจ๋ธ ์ค์ผ์ผ๋ง ์ธก๋ฉด์์ ์ถ๊ฐ ๊ฐ์ ์ด ํ์ํ๋ค.