์ ์: Jingkai Sun, Gang Han, Pihai Sun, Wen Zhao, Jiahang Cao, Jiaxu Wang, Yijie Guo, Qiang Zhang | ๋ ์ง: 2025-10-08 | URL: https://arxiv.org/abs/2510.07152 📄 PDF
Fig. 1: Overview of the proposed teacherโstudent distillation framework for humanoid perceptive locomotion. (A) The stud
ํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ ๊น์ด ์ด๋ฏธ์ง๋ง์ ์ฌ์ฉํ ์งํ ์ธ์ ๋ณดํ์ ์ํด, ํ์ค์ ์ธ ๊น์ด ํฉ์ฑ๊ณผ cross-attention transformer๋ฅผ ๊ฒฐํฉํ์ฌ ์ฌ์ ํ์ต๋ blind policy๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํจ์จ์ ์ธ ์ ์ฑ ํ์ต์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
Fig. 2: Ablation study of the proposed framework across four challenging terrains:
Fig. 3: The figure illustrates our physically grounded noise pipeline applied to synthetic
์ดํ: ์ด ๋ ผ๋ฌธ์ humanoid ๋ก๋ด์ ๊น์ด ๊ธฐ๋ฐ ๋ณดํ์์ sim-to-real gap๊ณผ ํจ์จ์ฑ ๋ฌธ์ ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ํด๊ฒฐํ๋ ํตํฉ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, self-occlusion-aware ๊น์ด ํฉ์ฑ, cross-modal transformer, end-to-end fine-tuning์ ์กฐํฉ์ผ๋ก ๋์ ๋ ์ฐฝ์ฑ๊ณผ ์ค์ฉ์ฑ์ ๋ฌ์ฑํ๋ค. ์ค์ ๋ก๋ด ๊ฒ์ฆ๊ณผ ๋ช ํํ ๊ธฐ์ ๊ธฐ์ฌ๊ฐ ๋๋ณด์ด๋ ์ฐ์ํ ์ฐ๊ตฌ์ด๋ค.