์ ์: Yunfeng Lin, Minghuan Liu, Yufei Xue, Ming Zhou, Yong Yu, Jiangmiao Pang, Weinan Zhang | ๋ ์ง: 2025-11-30 | URL: https://arxiv.org/abs/2512.00971 📄 PDF
Fig. 2: Method overview. a) The policy is pretrained by learning on a diverse set of humanoid embodiments through
H-Zero๋ ๋ค์ํ ํด๋จธ๋ ธ์ด๋ ๋ก๋ด embodiment์์ ์ฌ์ ํ์ต๋ ์ผ๋ฐํ๋ ์ด๋ ์ ์ฑ ์ ํ์ตํ์ฌ ๋ฏธ์ง์ ๋ก๋ด์ผ๋ก์ ์ ๋ก์ท ๋ฐ ์์์ท ์ ์ด๋ฅผ ๊ฐ๋ฅํ๊ฒ ํ๋ ํ์ดํ๋ผ์ธ์ด๋ค.
Fig. 1: Left: We propose a locomotion pretraining pipeline for humanoids by mixing multiple randomized embodiments
Fig. 2: Method overview. a) The policy is pretrained by learning on a diverse set of humanoid embodiments through
์ดํ: H-Zero๋ unified control semantics๋ฅผ ํตํด ์ค์ฉ์ ์ด๊ณ ํ์ฅ ๊ฐ๋ฅํ cross-embodiment ์ด๋ ์ ์ด ์๋ฃจ์ ์ ์ ์ํ๋ฉฐ, 30๋ถ์ ๋ฏธ์ธ์กฐ์ ์ผ๋ก ์ ๊ท ๋ก๋ด์ ์ ์ํ ์ ์๋ ์ ์์ ํ์ค ๋ฐฐํฌ ๊ด์ ์์ ํฐ ์์๊ฐ ์๋ค. ๋ค๋ง embodiment ์ ํ์ ์ฒด๊ณํ์ ๋ ๋ค์ํ ํํ์ ๋ก๋ด์ผ๋ก์ ์ผ๋ฐํ ๋ฅ๋ ฅ ๊ฒ์ฆ์ด ํ์ํ๋ค.