์ ์: Shaoting Zhu, Ziwen Zhuang, Mengjie Zhao, Kun-Ying Lee, Hang Zhao | ๋ ์ง: 2026-01-12 | DOI: 10.48550/arXiv.2601.07718 📄 PDF
Fig. 2: System overview. Our framework trains an end-to-end policy using simulated depth and proprioception. To ensure
์ด ๋ ผ๋ฌธ์ ๊น์ด ์นด๋ฉ๋ผ์ proprioception์ ์ง์ joint actions์ผ๋ก ๋ณํํ๋ end-to-end RL ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ, ์ธ๋ถ ์ํ ์ถ์ ์์ด humanoid ๋ก๋ด์ด ๋ณต์กํ ๋น์ ํ ์งํ์์ ์ต๋ 2.5 m/s์ ์๋๋ก ์์ ํ๊ฒ ์ด๋ํ ์ ์๊ฒ ํ๋ค.
Fig. 1: Hiking in the Wild. Our framework enables a humanoid robot to traverse diverse terrains in both indoor and outdo
Fig. 2: System overview. Our framework trains an end-to-end policy using simulated depth and proprioception. To ensure
์ดํ: ์ด ๋ ผ๋ฌธ์ humanoid ๋ก๋ด์ ์ผ์ธ ์ฃผํ์ ์ํ ์ค์ฉ์ ์ด๊ณ ํ์ฅ ๊ฐ๋ฅํ end-to-end RL ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, Terrain Edge Detection, Foot Volume Points, Flat Patch Sampling ๋ฑ novel ๋ฉ์ปค๋์ฆ์ผ๋ก safety์ reward hacking ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ๋ค. Open-source ๋ฐฐํฌ์ ์ค์ ๋ก๋ด ๊ฒ์ฆ์ ํตํด ๋์ ์ฌํ์ฑ๊ณผ ์ค์ฉ์ฑ์ ์ ์ฆํ ์ฐ์ํ ์ฐ๊ตฌ์ด๋ค.