์ ์: Tianhu Peng, Lingfan Bao, Chengxu Zhou | ๋ ์ง: 2025-05-27 | URL: https://arxiv.org/abs/2505.20619 📄 PDF
Fig. 1: Human-like multi-gait locomotion on the Unitree G1
์ธ๊ฐ์๊ฒ์ ์๊ฐ์ ์ป์ ๋ณด์ ํ์ฑ๊ณผ gait-conditioned reward routing์ ํตํด ๋จ์ผ recurrent policy์์ ์์๊ธฐ, ๊ฑท๊ธฐ, ๋ฌ๋ฆฌ๊ธฐ ๋ฐ ์ ํ์ ํ์ตํ๋ ํตํฉ reference-free RL ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค.
Fig. 1: Human-like multi-gait locomotion on the Unitree G1
์ดํ: ์ด ๋ ผ๋ฌธ์ gait-conditioned reward routing๊ณผ ์๋ฌผ์ญํ ๊ธฐ๋ฐ ๋ณด์ ์ค๊ณ๋ฅผ ํตํด MoCap ์์ด ์์ฐ์ค๋ฌ์ด ๋ค์ค gait ํ์ต์ ๊ฐ๋ฅํ๊ฒ ํ๋ ์ฐ์ํ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, ์ค์ ์ธ๊ฐํ ๋ก๋ด์์์ ๊ฒ์ฆ์ผ๋ก ์ค์ฉ์ฑ์ ์ ์ฆํ๋ค.