HuB: Learning Extreme Humanoid Balance
์ ์: Tong Zhang, Boyuan Zheng, Ruiqian Nai, Yingdong Hu, Yen-Jen Wang, Geng Chen, Fanqi Lin, Jiongye Li, Chuye Hong, Koushil Sreenath, Yang Gao | ๋ ์ง: 2025-05-12 | URL: https://arxiv.org/abs/2505.07294 📄 PDF
Essence
Figure 1: Extreme Balance Tasks. HuB enables humanoids to perform extreme quasi-static balance tasks
๋ณธ ๋
ผ๋ฌธ์ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ด ๊ทน๋จ์ ์ธ ๊ท ํ ์ก๊ธฐ ํ์คํฌ(Swallow Balance, Bruce Lee's Kick ๋ฑ)๋ฅผ ์ํํ๋๋ก ํ๊ธฐ ์ํด ์ธ ๊ฐ์ง ํต์ฌ ๋ฌธ์ (์ฐธ์กฐ ๋์ ์ค๋ฅ, ํํํ์ ๋ถ์ผ์น, sim-to-real ๊ฐญ)๋ฅผ ๊ฐ๊ฐ ํด๊ฒฐํ๋ ํตํฉ ํ๋ ์์ํฌ HuB๋ฅผ ์ ์ํ๋ค. ์ด๋ฅผ ํตํด Unitree G1 ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์์ ๊ฐํ ์ธ๋ถ ์ถฉ๊ฒฉ์๋ ์์ ์ ์ผ๋ก ๊ท ํ์ ์ ์งํ๋ ์ ์ฑ
์ ํ์ตํ ์ ์์์ ์
์ฆํ๋ค.
Motivation
- Known: ํด๋จธ๋
ธ์ด๋ ์ ์ด์์ ๊ฐํํ์ต์ ํ์ฉํ ํ์ต ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ค์ด ๋ค์ํ ๋์(๋ณดํ, ๋ฐ๊ธฐ, ์ถค์ถ๊ธฐ ๋ฑ)์์ ์ฑ๊ณต์ ๊ฑฐ๋์์ผ๋, ๊ทน๋จ์ ์ธ ์ค์ ์ ๊ท ํ ์ ์ง ๊ฐ์ ์ ๋ฐํ ๊ท ํ ์ ์ด ์์
์๋ ๋ฏธ์ ์ฉ๋์๋ค. ๊ธฐ์กด ์ถ์ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ค์ ์ฐธ์กฐ ๋์์ ๋ถ์ ํ์ฑ, morphological mismatch, ์ผ์ ๋
ธ์ด์ฆ ๋ฑ์ผ๋ก ์ธํด ๋ณต์กํ ๊ท ํ ํ์คํฌ์์ ์คํจํ๋ค.
- Gap: ๊ธฐ์กด tracking-based ํด๋จธ๋
ธ์ด๋ ์ ์ด ์ฐ๊ตฌ๋ ์ฐธ์กฐ ๋์ ์ค๋ฅ(video-based motion capture์ ๋ถ์ ํ์ฑ, retargeting ์ต์ ํ ์คํจ), ์ ์ฑ
ํ์ต์ ์ด๋ ค์(์ธ๊ฐ๊ณผ ํด๋จธ๋
ธ์ด๋์ ๋ฌด๊ฒ์ค์ฌ ๋ถ์ผ์น๋ก ์ธํ ์์ ์ฑ ๋ฌธ์ ), sim-to-real ๊ฐญ(์ผ์ ๋
ธ์ด์ฆ, ์ ์ด ๋ชจ๋ธ๋ง ์ค๋ฅ)์ ๋์์ ํด๊ฒฐํ์ง ๋ชปํ๋ค. ํนํ ๊ทน๋จ์ ์ธ ์ค์ ์ ๊ท ํ ์ ์ง์ ํนํ๋ ํตํฉ ์๋ฃจ์
์ด ๋ถ์ฌํ๋ค.
- Why: ํด๋จธ๋
ธ์ด๋์ ๊ทน๋จ์ ๊ท ํ ๋ฅ๋ ฅ์ ์ ์ ํ์กฐ, ์ ๋ฐํ ๋ฌด๊ฒ์ค์ฌ ์ ์ด, ์ธ๋ถ ๊ต๋ ๊ฐ๊ฑด์ฑ์ ๋ชจ๋ ์๊ตฌํ๋ฉฐ, ์ด๋ ๋ก๋ด ์ ์ด์ ํต์ฌ ์ด๋ ค์์ ๋ํํ๋ค. ์ค์ ํ๋์จ์ด์์ ์ด๋ฅผ ๋ฌ์ฑํ๋ ๊ฒ์ ๋ก๋ด ๊ณตํ์ ์ค์ํ ๊ณผ์ ์ด๋ฉฐ, ๋ณธ ๋
ผ๋ฌธ์ ํตํฉ ์ ๊ทผ๋ฒ์ ์ฐ์
์์ฉ(๊ท ํ ์ ์ง๊ฐ ํ์ํ ์์
)๊ณผ ๊ธฐ๋ณธ ์ฐ๊ตฌ(ํด๋จธ๋
ธ์ด๋ ์ ์ด ๋ฉ์ปค๋์ฆ ์ดํด)์ ๊ธฐ์ฌํ ์ ์๋ค.
- Approach: ์ธ ๊ฐ์ง ๊ตฌ์ฑ ์์๋ก ์ด๋ฃจ์ด์ง ํตํฉ ํ๋ ์์ํฌ: (1) Reference Motion Refinement: SMPL ์ด๊ธฐํ๋ฅผ ํ์ฉํ retargeting ์๋ ด ๊ฐ์ํ ๋ฐ ๋ฐ ๋ฏธ๋๋ฌ์ง ์ ๊ฑฐ, ์ ์ด ์์ ํ๋ฅผ ์ํ ํ์ฒ๋ฆฌ; (2) Balance-Aware Policy Learning: ์ถ์ ๋ชฉํ ์ํ, ๋ฌด๊ฒ์ค์ฌ ๋ณด์, ๋ฐ ์ ์ด ๋ถ์ผ์น ํ๋ํฐ ๋ฑ์ shaping reward ๋์
; (3) Sim-to-Real Robustness Training: ๊ตญ์ํ๋ ์ฐธ์กฐ ์ถ์ ์ผ๋ก VIO ์์กด์ฑ ์ ๊ฑฐ, IMU ์ค์ฌ ๊ด์ฐฐ perturbation์ผ๋ก ์ผ์ ๋
ธ์ด์ฆ ๋ชจ๋ธ๋ง, ๊ณ ์ฃผํ ์ธ๋ถ ํธ์๋ก ์ค์ jitter ๊ทผ์ฌ.
Achievement
Figure 2: HuB Overview. To tackle the challenges of extreme balance tasks on humanoids, HuB integrates
๊ทน๋จ์ ๊ท ํ ํ์คํฌ ๋ฌ์ฑ: Unitree G1 ๋ก๋ด์ด Swallow Balance(์์ฒด ์ํ ํ์ฅ), Bruce Lee's Kick(๋ค๋ฆฌ 1.5m ์ด์ ๋์ด ์ฌ๋ฆฌ๊ธฐ), Ne Zha Pose ๋ฑ์ ์ฑ๊ณต์ ์ผ๋ก ์ํ; ๊ฐ๊ฑด์ฑ ์
์ฆ: ๊ฐํ ์ถ๊ตฌ ํฅ ๊ฐ์ ๋ฌผ๋ฆฌ์ ๊ต๋์์๋ ์์ ์ฑ ์ ์ง, ๊ธฐ์ ์ ๋ฐฉ๋ฒ๋ค์ ๊ท ํ ์์ค ๋๋ ์คํจ; ์ฐ์ ์ฑ๊ณต: 10ํ ์ฐ์ ์คํ ๋ฌ์ฑ (๋ฆฌ์
์์); Ablation ๊ฒ์ฆ: ๊ฐ ๊ตฌ์ฑ ์์์ ํ์์ฑ ์
์ฆ.
How
Figure 2: HuB Overview. To tackle the challenges of extreme balance tasks on humanoids, HuB integrates
- Reference Motion Refinement: SMPL ์ ์ฒด ๋ชจ๋ธ์ retargeting ์ด๊ธฐํ๋ก ์ฌ์ฉํ์ฌ ์๋ ด ์๋ ํฅ์, ๋ฐ ์ ์ด ๊ฐ์ง๋ฅผ ํตํ ๋ฐ ๋ฏธ๋๋ฌ์ง ์์ , ๋ฌด๊ฒ์ค์ฌ ํํฐ๋ง์ผ๋ก ์ ์ด ์์ ํ
- Balance-Aware Policy Learning: ์ ํํ ์ถ์ ๋์ ์ฐธ์กฐ ๊ถค์ ๊ทผ์ฒ์์ ํ์ ํ์ฉ, ๋ฌด๊ฒ์ค์ฌ ์์น ๋ณด์, ๋ฐ ์ ์ด ๋ถ์ผ์น ๋ฐ ๋ฐ ๊ฐ๊ฒฉ์ ๋ํ ํ๋ํฐ ์ถ๊ฐ
- Sim-to-Real Training: IMU ๊ธฐ๋ฐ ๊ด์ฐฐ perturbation, ๊ณ ์ฃผํ ์ธ๋ถ ํธ์ ์ ์ฉ, ๊ตญ์ ์ฐธ์กฐ ์ถ์ ๋์
Originality
- ํตํฉ์ ์๋ฃจ์
: ๊ธฐ์กด ์ฐ๊ตฌ์์ ๋ณ๋๋ก ๋ค๋ฃจ์ด์ง ์ฐธ์กฐ ๋์ ์ ์ , ์ ์ฑ
ํ์ต, sim-to-real ์ ์ด๋ฅผ ํ๋์ ์ผ๊ด๋ ํ๋ ์์ํฌ๋ก ํตํฉ
- ๊ท ํ ์ค์ฌ ์ค๊ณ: ๊ธฐ์กด ๋์ ์ถ์ ๊ธฐ๋ฐ ์ ์ด์ ๋ฌ๋ฆฌ, ์ค์ ์ ๊ท ํ ์ ์ง์ ํนํ๋ reward shaping ๋ฐ ์ ์ฑ
ํ์ต ์ ๋ต ๊ฐ๋ฐ
- ์ค์ ํ๋์จ์ด ๊ฒ์ฆ: ์ค์ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด(Unitree G1)์์ ๊ทน๋จ์ ๊ท ํ ํ์คํฌ ์ฑ๊ณต ์
์ฆ, ๊ธฐ์กด ๋ฐฉ๋ฒ์ ์คํจ์ ๋์กฐ
Limitation & Further Study
- ๋ฐ์ดํฐ์
์์กด์ฑ: ๊ณ ํ์ง ์ฐธ์กฐ ๋์ ํ๋์ด ์ด๋ ค์ด ์ ๊ท ๊ทน๋จ์ ํ์คํฌ์ ๊ฒฝ์ฐ, ์ด๊ธฐ retargeting ํ์ง์ ๊ฐํ๊ฒ ์์กดํ ์ ์์
- ๋ก๋ด ํน์ด์ฑ: Unitree G1์์๋ง ๊ฒ์ฆ๋์์ผ๋ฉฐ, ๋ค๋ฅธ ํํ์ ํด๋จธ๋
ธ์ด๋(์: ๋ค๋ฆฌ ๊ธธ์ด, ๋ฌด๊ฒ์ค์ฌ ์์น ์์ด)์ ๋ํ ์ผ๋ฐํ ์ ๋ ๋ฏธ๋ช
ํ
- ๊ณ์ฐ ๋น์ฉ: ์ธ ๊ฐ์ง ํ์ต ๋จ๊ณ(์ฐธ์กฐ ์ ์ , ์ ์ฑ
ํ์ต, robustness ํ์ต)๊ฐ ์์ฐจ์ ์ผ๋ก ํ์ํ์ฌ ์ ์ฒด ํ์ต ์๊ฐ ๋ฐ ๊ณ์ฐ ์์ ์๊ตฌ๋ ๋ฏธ์์ธ
- ํ์ ์ฐ๊ตฌ: ๋ ๋์ ์ธ ๊ท ํ ์์ง์(์: ๊ท ํ ํ๋ณต ์ค ๋น ๋ฅธ ์คํ
)์ด๋ ๋ถ๊ท์นํ ์งํ์์์ ์ฑ๋ฅ ํ๊ฐ ํ์
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ํด๋จธ๋
ธ์ด๋์ ๊ทน๋จ์ ๊ท ํ ์ ์ด๋ผ๋ ๋์ ์ ์ธ ๋ฌธ์ ์ ๋ํด ์ ๋๊ธฐ๋ถ์ฌ๋๊ณ ์ฒด๊ณ์ ์ผ๋ก ์ค๊ณ๋ ์๋ฃจ์
์ ์ ์ํ๋ค. ์ธ ๊ฐ์ง ํต์ฌ ์ฅ์ ๋ฌผ(์ฐธ์กฐ ์ค๋ฅ, morphological mismatch, sim-to-real ๊ฐญ)์ ๊ฐ๊ฐ ๊ฒจ๋ฅํ ๋ชจ๋์ ์ ๊ทผ๋ฒ๊ณผ ์ค์ ํ๋์จ์ด์์์ ๊ฐ๋ ฅํ ์คํ ๊ฒ์ฆ์ด ๊ฐ์ ์ด๋ค. ๋ค๋ง ๋ค๋ฅธ ํด๋จธ๋
ธ์ด๋ ํ๋ซํผ์ผ๋ก์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ๊ณผ ํ์ต ํจ์จ์ฑ ์ธก๋ฉด์์ ์ถ๊ฐ ๋
ผ์๊ฐ ํ์ํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์