์ ์: Minku Kim, Kuan-Chia Chen, Aayam Shrestha, Li Fuxin, Stefan Lee, Alan Fern | ๋ ์ง: 2026-02-23 | DOI: 10.48550/arXiv.2602.13850 📄 PDF
Fig. 2: Independently trained high-level skills generate task-level commands that are executed through a shared, task-ag
ํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ ์ฅ๊ธฐ ๋ฐ์ค ์ฌ๋ฐฐ์ด ์์ ์ ์ํด ๊ณต์ ๋ task-agnostic WBC๋ฅผ ํตํด ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ ์คํฌ๋ค์ ์กฐํฉํ๋ skill-based framework๋ฅผ ์ ์ํ๊ณ , ๋ถํฌ ์ด๋์ผ๋ก ์ธํ ๊ฐ๊ฑด์ฑ ์ ํ๋ฅผ ๋ฐ์ดํฐ ์ง๊ณ๋ฅผ ํตํด ํด๊ฒฐํ๋ค.
Fig. 4: Cumulative task success rates for the Humanoid Hanoi benchmark. Each move consists of four skills: GoTo, Pickup,
Fig. 2: Independently trained high-level skills generate task-level commands that are executed through a shared, task-ag
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ๊ณต์ WBC๋ฅผ ํตํ ๋ชจ๋์ ์คํฌ ์กฐํฉ ์ํคํ ์ฒ์ systematic exploration๊ณผ ๋ฐ์ดํฐ ์ง๊ณ ๊ธฐ๋ฐ robustness ๊ฐ์ ์ด๋ผ๋ ์ค์ฉ์ ๊ธฐ์ฌ๋ฅผ ์ ์ํ๋ฉฐ, Humanoid Hanoi ๋ฒค์น๋งํฌ๋ฅผ ํตํด long-horizon ์ฅ๊ธฐ ์์จ ์คํ์ ๊ฐ๋ฅ์ฑ์ ์ ์ฆํ๋ค. ๋ค๋ง high-level planning, ๊ณ์ฐ scalability, sim-to-real gap์ ๋ํ ์ฌํ ๋ถ์์ ๋ถ์กฑํ๋ค.