์ ์: Rohan P. Singh, Mitsuharu Morisawa, Mehdi Benallegue, Zhaoming Xie, Fumio Kanehiro | ๋ ์ง: 2025-04-18 | URL: https://arxiv.org/abs/2504.13619 📄 PDF
Fig. 1: HRP-5P humanoid bipedal locomotion (clockwise) on flat rigid
Deep RL์ ์ด์ฉํ์ฌ humanoid robot HRP-5P๊ฐ ์๋ฎฌ๋ ์ด์ ์์ terrain randomization์ผ๋ก ํ์ตํ ์ ์ฑ ์ ์ค์ ํ๊ฒฝ์ compliantํ๊ณ unevenํ terrain์์๋ robustํ๊ฒ ๋ณดํํ๋๋ก ํ๋ ์ฐ๊ตฌ์ด๋ค.
Fig. 1: HRP-5P humanoid bipedal locomotion (clockwise) on flat rigid
Fig. 2: Overview of our training framework. (L) We propose to train a feedforward RL agent while exposing it to randomiz
์ดํ: Life-sized humanoid์ challenging terrain ๋ณดํ์ ์ํ deep RL ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ ์ค์ ๊ตฌํ์ ์ฑ๊ณต์ ์ผ๋ก ์ ์ฆํ์ผ๋ฉฐ, sim-to-real transfer์ adaptive gait control์ ํจ๊ณผ๋ฅผ ๋ช ํํ ๋ณด์ฌ์ค ์๋ฏธ ์๋ ์ฐ๊ตฌ์ด๋ค. ๋ค๋ง clock control ์ ์ฑ ์ ์ค์ ์ ์ฉ ํจ๊ณผ ๊ฒ์ฆ๊ณผ failure case ๋ถ์์ด ๋ณด๊ฐ๋๋ฉด ๋์ฑ ์์ฑ๋ ๋์ ์์ ์ด ๋ ์ ์๋ค.