์ ์: Gen Luo, Ganlin Yang, Ziyang Gong, Guanzhou Chen, Haonan Duan, Erfei Cui, Ronglei Tong, Zhi Hou, Tianyi Zhang, Zhe Chen, Shenglong Ye, Lewei Lu, Jingbo Wang, Wenhai Wang, Jifeng Dai, Yu Qiao, Rongrong Ji, Xizhou Zhu | ๋ ์ง: 2025-05-30 | URL: https://arxiv.org/abs/2506.00123 📄 PDF
Figure 1: Overview of VeBrain and VeBrain-600k. Compared to existing MLLMs, VeBrain achieves
VeBrain์ ๋ฉํฐ๋ชจ๋ฌ ๋ํ ์ธ์ด ๋ชจ๋ธ(MLLM)์ ์ง๊ฐ, ์ถ๋ก , ์ ์ด ๊ธฐ๋ฅ์ผ๋ก ํตํฉํ๋ ํ๋ ์์ํฌ์ด๋ฉฐ, ๋ก๋ด ์ ์ด ์์ ์ 2D ์๊ฐ ๊ณต๊ฐ์ ํ ์คํธ ๊ธฐ๋ฐ MLLM ์์ ์ผ๋ก ์ฌ๊ตฌ์ฑํฉ๋๋ค.
Figure 1: Overview of VeBrain and VeBrain-600k. Compared to existing MLLMs, VeBrain achieves
Figure 2: Illustration of VeBrain architecture and robotic adapter. In VeBrain, the MLLM is capable
์ดํ: VeBrain์ ๋ฉํฐ๋ชจ๋ฌ ์ดํด์ ๋ก๋ด ์ ์ด๋ฅผ 2D ์๊ฐ ๊ณต๊ฐ์ ๊ณตํต MLLM ์์ ์ผ๋ก ํตํฉํ๋ ํ์ ์ ์ธ ์ ๊ทผ์ผ๋ก, ๊ด๋ฒ์ํ ๋ฒค์น๋งํฌ์ ๋ก๋ด ์คํ์์ ์ฐ์ํ ์ฑ๋ฅ์ ์ ์ฆํ๋ฉฐ ๊ตฌ์ฒดํ๋ AI์ ์ค์ํ ์ง์ ์ ๋ํ๋ ๋๋ค.