์ ์: Xinru Cui, Linxi Feng, Yixuan Zhou, Haoqi Han, Zhe Liu, Hesheng Wang | ๋ ์ง: 2026-01-24 | DOI: 10.48550/arXiv.2601.17440 📄 PDF
Fig. 1. Method overview of PILOT. We propose a unified single-stage reinforcement learning framework that seamlessly int
PILOT๋ humanoid robot์ loco-manipulation์ ์ํ ํตํฉ ๋จ๊ณ RL ํ๋ ์์ํฌ๋ก, ์ง๊ฐ ๊ธฐ๋ฐ locomotion๊ณผ ์ ์ ์ ์ด๋ฅผ ๋จ์ผ policy๋ก ํตํฉํ์ฌ ๋น์ ํ ์งํ์์ ์์ ์ ์ธ ์์ ์คํ์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
Fig. 3. Real-world Experiments. PILOT successfully executes object transport tasks across challenging terrains. The robo
Fig. 2. Visualization of expert activation across six motion modes. The
์ดํ: PILOT๋ humanoid loco-manipulation ๋ฌธ์ ์ ๋ํ ํตํฉ์ ์ด๊ณ ์ค์ฉ์ ์ธ ํด๊ฒฐ์ฑ ์ ์ ์ํ๋ฉฐ, cross-modal perception๊ณผ MoE ๊ตฌ์กฐ๋ฅผ ํตํด ๊ธฐ์ ์ ๊ธฐ์ฌ์ ์ค์ ๋ก๋ด ๊ตฌํ์ ์ฑ๊ณต์ ์ฌ๋ก๋ฅผ ๋ณด์ฌ์ค๋ค.