์ ์: Jinrui Han, Weiji Xie, Jiakun Zheng, Jiyuan Shi, Weinan Zhang, Ting Xiao, Chenjia Bai | ๋ ์ง: 2025-09-20 | DOI: 10.48550/arXiv.2509.16638 📄 PDF
Fig. 2: Framework of VMS. The large-scale motion capture dataset is first retargeted to the humanoid skeleton using an I
VMS๋ Orthogonal Mixture-of-Experts (OMoE) ์ํคํ ์ฒ์ ํ์ด๋ธ๋ฆฌ๋ ์ถ์ ๋ชฉํ๋ฅผ ๊ฒฐํฉํ์ฌ ๋จ์ผ ์ ์ฑ ์ผ๋ก ๋ค์ํ ๋์์ ์ํํ๋ ํด๋จธ๋ ธ์ด๋ ๋ก๋ด ์ ์ด๊ธฐ๋ฅผ ์ ์ํ๋ค. ์ฅ์๊ฐ ์ํ์ค์์ ์์ ์ ์ธ ์ฑ๋ฅ๊ณผ ๋์ ๋์ ์ถฉ์ค๋๋ฅผ ๋ฌ์ฑํ๋ค.
Fig. 1: Humanoid learning versatile motion skills. We deploy VMS on the Unitree G1 humanoid robot, demonstrating its cap
Fig. 2: Framework of VMS. The large-scale motion capture dataset is first retargeted to the humanoid skeleton using an I
์ดํ: VMS๋ OMoE ์ํคํ ์ฒ์ ํ์ด๋ธ๋ฆฌ๋ ์ถ์ ๋ชฉํ์ ์กฐํฉ์ผ๋ก ์ค์ฉ์ ํด๋จธ๋ ธ์ด๋ ์ ์ด์ ์ฃผ์ ๊ณผ์ ๋ค์ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ๋ฉฐ, ๋๊ท๋ชจ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ ์ฒด๊ณ์ ๋ฐฉ๋ฒ๋ก ๊ณผ ์ค๋ก๋ด ๊ฒ์ฆ์ ํตํด ๋ฒ์ฉ ํด๋จธ๋ ธ์ด๋ ์ ์ด์ ๊ธฐ์ด ํ๋ซํผ์ผ๋ก์ ๋์ ๊ฐ์น๋ฅผ ๋ณด์ฌ์ค๋ค.