์ ์: Chenhui Dong, Haozhe Xu, Wenhao Feng, Zhipeng Wang, Yanmin Zhou, Yifei Zhao, Bin He | ๋ ์ง: 2026-01-29 | DOI: 10.48550/arXiv.2511.20275 📄 PDF
Fig 1: Overview of the HAFO model. (a) Policy Training. A dual-agent strategy with
HAFO๋ dual-agent RL ํ๋ ์์ํฌ๋ฅผ ํตํด humanoid robot์ ํ์ฒด ๋ณดํ๊ณผ ์์ฒด ์กฐ์์ ๋์์ ์ต์ ํํ์ฌ ๊ฐํ ์ธ๋ ฅ ์ํธ์์ฉ ํ๊ฒฝ์์ ์์ ์ ์ด๊ณ ์ ๋ฐํ ์ ์ด๋ฅผ ๋ฌ์ฑํ๋ค.
Fig 3: Unitree G1 Humanoid robot sim2sim results. We evaluate the modelโs performance
Fig 2: Spring-damper model and performance analysis. (a) Spring-damper model schematic
์ดํ: HAFO๋ spring-damper ๋ชจ๋ธ๊ณผ dual-agent RL์ ๊ฒฐํฉ์ผ๋ก humanoid robot์ ๊ฐํ ์ธ๋ ฅ ์ ์ ์ ์ด์์ ์๋ก์ด ๊ธฐ์ค์ ์ ์ํ๋ฉฐ, ํนํ ๋กํ ํ์๋ผ๋ novel ์์ฉ์์ ์์ ์ ์ ์ด๋ฅผ ์ต์ด ๋ฌ์ฑํ ์๋ฏธ ์๋ ์ฐ๊ตฌ๋ค.