์ ์: Yuheng Ji, Huajie Tan, Jiayu Shi, Xiaoshuai Hao, Yuan Zhang, Hengyuan Zhang, Pengwei Wang, Mengdi Zhao, Yao Mu, Pengju An, Xinda Xue, Qinghang Su, Huaihai Lyu, Xiaolong Zheng, Jiaming Liu, Zhongyuan Wang, Shanghang Zhang | ๋ ์ง: 2025-02-28 | URL: https://arxiv.org/abs/2502.21257 📄 PDF
Figure 1. Overview of RoboBrain. RoboBrain consists of three key robotic capabilities: planning capability, affordance p
RoboBrain์ ๋ก๋ด ์กฐ์์ ์ํด Planning Capability, Affordance Perception, Trajectory Prediction์ ์ธ ๊ฐ์ง ํต์ฌ ๋ฅ๋ ฅ์ ๊ฐ์ถ ํตํฉ MLLM ๋ชจ๋ธ์ด๋ฉฐ, ์ด๋ฅผ ํ์ตํ๊ธฐ ์ํด ShareRobot์ด๋ผ๋ ๋๊ท๋ชจ ๊ณ ํ์ง ์ด์ง ๋ฐ์ดํฐ์ ์ ์ ์ํ๋ค.
Figure 5. The performance of our model RoboBrain on the OpenEQA, ShareRobot, and RoboVQA benchmarks. RoboBrain surpassed
Figure 2. The generation procession of our ShareRobot dataset. Our dataset labels multi-dimensional information, includi
์ดํ: RoboBrain์ ๋ก๋ด ์กฐ์์ ์ํ ์ธ ๊ฐ์ง ํต์ฌ ๋ฅ๋ ฅ์ ์ฒด๊ณ์ ์ผ๋ก ์ ์ํ๊ณ ์ด๋ฅผ ํตํฉํ MLLM๊ณผ ๊ณ ํ์ง ๋ฐ์ดํฐ์ ์ ํจ๊ป ์ ์ํ์ฌ, ๋ก๋ด AI์ ๊ตฌ์ฒด์ ์คํ ๋ฅ๋ ฅ ํฅ์์ ์๋ฏธ ์๋ ๊ธฐ์ฌ๋ฅผ ํ๋ค.