์ ์: Yusen Feng, Xiang Wang, Heyuan Yao, Zixi Kang, Xinyu Huo, Boyang Yu, Pengyun Qiu, Ruijie Zhao, Baoquan Chen, Libin Liu | ๋ ์ง: 2026 | DOI: 10.48550/ARXIV.2605.24592 📄 PDF
Fig. 2: System overview 1) Motion Skill Embedding: states and reference motions are encoded into continuous representati
MuGen์ VQ-VAE์ model-based reinforcement learning์ ๊ฒฐํฉํ์ฌ ์ธ๊ฐ์ ๋ชจ์ ๋ฐ์ดํฐ๋ก๋ถํฐ ์ธํํ ๋ก๋ด์ ๋ค์ค ๊ธฐ์ ๋ณดํ ์ ์ด๊ธฐ๋ฅผ ํ์ตํ๋ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ํ๋ ์์ํฌ์ด๋ค. Teacher-student learning๊ณผ ์๋ก์ด policy distillation ์ ๋ต์ ํตํด ์๋ฎฌ๋ ์ด์ ์์ ํ์ตํ ๋ชจ์ ์ ์ค์ ๋ก๋ด์ ๋ฐฐํฌํ ์ ์๊ฒ ํ๋ค.
Fig. 1: MuGen enables multi-skill humanoid locomotion by learning a generative controller. (a-d): A simulated humanoid t
Fig. 2: System overview 1) Motion Skill Embedding: states and reference motions are encoded into continuous representati
์ดํ: MuGen์ VQ-VAE, model-based RL, teacher-student learning์ ํตํฉํ์ฌ ์ธํํ ๋ก๋ด์ ๋ค์ค ๊ธฐ์ ๋ณดํ์ ํ์ตํ๊ณ ๋ฐฐํฌํ๋ ์ฒด๊ณ์ ์ด๊ณ ๊ธฐ์ ์ ์ผ๋ก ๊ฑด์ ํ ์ ๊ทผ์ ์ ์ํ๋ค. ์ค์ Unitree G1 ๋ก๋ด์์์ ๊ฒ์ฆ๊ณผ ๋ฏธํ์ต ๋ชจ์ ์ ๋ํ ๊ฐ๊ฑดํ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ๋ณด์ฌ์ฃผ์์ผ๋, sim-to-real gap์ ์์ ํ ํด๊ฒฐ, ๋ฐ์ดํฐ์ ๊ท๋ชจ/๋ค์์ฑ์ ์์ธ ๋ถ์, ๊ณ์ฐ ๋ณต์ก๋ ํ๊ฐ ๋ฑ์์ ๊ฐ์ ์ด ํ์ํ๋ค. ์ ๋ฐ์ ์ผ๋ก ์ธํํ ๋ก๋ด ์ ์ด ๋ถ์ผ์ ์๋ฏธ ์๋ ๊ธฐ์ฌ๋ฅผ ํ ๊ฒฌ์คํ ์ฐ๊ตฌ์ด๋ค.