์ ์: Ziwen Zhuang, Shenzhe Yao, Hang Zhao | ๋ ์ง: 2024-06-15 | URL: https://arxiv.org/abs/2406.10759 📄 PDF
Figure 1: We present a single vision-based end-to-end whole-body-control parkour policy for humanoid robots
๋ณธ ๋ ผ๋ฌธ์ ์ธ๊ฐํ ๋ก๋ด์ด motion prior ์์ด end-to-end vision-based ์ ์ฑ ์ผ๋ก ๋ค์ํ parkour ๊ธฐ์ ์ ํ์ตํ ์ ์๋ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. Fractal noise๋ฅผ ํ์ฉํ terrain randomization๊ณผ DAgger๋ฅผ ํตํ vision policy ์ฆ๋ฅ๋ก sim-to-real transfer๋ฅผ ๋ฌ์ฑํ๋ฉฐ, ์ค์ ๋ก๋ด์์ 0.42m ์ ํ, 0.8m gap ํต๊ณผ, 1.8m/s ์ฃผํ ๋ฑ์ ์ฑ๊ณตํ๋ค.
Figure 2: We design 10 different types of terrain with controllable difficulty. By training on all these
Figure 2: We design 10 different types of terrain with controllable difficulty. By training on all these
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ์ธ๊ฐํ ๋ก๋ด์ parkour learning์์ motion prior ์ ๊ฑฐ์ fractal noise ๊ธฐ๋ฐ ์๋ foot-raising ์ ๋๋ผ๋ ์ค์ํ ๊ธฐ์ฌ๋ฅผ ์ ์ํ๋ค. 3๋จ๊ณ ํ๋ จ ํ์ดํ๋ผ์ธ๊ณผ DAgger ์ฆ๋ฅ๋ฅผ ํตํ sim-to-real transfer๋ ๊ธฐ์ ์ ์ผ๋ก ๊ฒฌ๊ณ ํ๋ฉฐ, ์ค์ ๋ก๋ด์์์ ๋ค์ํ ์ฑ๊ณต ์ฌ๋ก๋ ์ค์ฉ์ ๊ฐ์น๊ฐ ๋๋ค. ๋ค๋ง ์ง์ track ์ ์ฝ, ์ ๋์ ํ๊ฐ ๋ถ์กฑ, ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ ๊ฒ์ฆ ๋ฏธํก์ด ํ๊ณ์ด๋, ์ธ๊ฐํ ๋ก๋ด์ agile locomotion ๋ถ์ผ์ ์๋นํ ์ง์ ์ ์ด๋ฃจ์๋ค.