HuB: Learning Extreme Humanoid Balance
์ ์: Tong Zhang, Boyuan Zheng, Ruiqian Nai, Yingdong Hu, Yen-Jen Wang, Geng Chen, Fanqi Lin, Jiongye Li, Chuye Hong, Koushil Sreenath, Yang Gao | ๋ ์ง: 2025-05-12 | URL: https://arxiv.org/abs/2505.07294 📄 PDF
Essence
Figure 2: HuB Overview. To tackle the challenges of extreme balance tasks on humanoids, HuB integrates
HuB๋ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ด ์ ํ๋ ํ ๋ฐ๋ก ์๊ธฐ๋ ๋์ ํฅ๊ณผ ๊ฐ์ ๊ทน๋์ ์ค์ ์ ๊ท ํ ์์
์ ์ํํ ์ ์๋๋ก ํ๋ ํตํฉ ํ๋ ์์ํฌ์ด๋ฉฐ, ์ฐธ์กฐ ๋์ ์ ์ , ๊ท ํ ์ธ์ ์ ์ฑ
ํ์ต, sim-to-real ๊ฐ๊ฑด์ฑ ํ๋ จ์ ์ธ ๊ฐ์ง ๊ตฌ์ฑ ์์๋ก ์ด๋ฃจ์ด์ ธ ์๋ค.
Motivation
- Known: ์ต๊ทผ ํด๋จธ๋
ธ์ด๋ ์ ์ด ์ฐ๊ตฌ๋ RL์ ์ด์ฉํ์ฌ ์ธ๊ฐ์ ๋์์ ์ถ์ ํ๋ ๋ฐฉ์์ผ๋ก ๊ธฐ์ ์ต๋์ ์ถ์งํ๊ณ ์์ผ๋ฉฐ, ์ผ๋ฐ์ ์ธ ํ์ดํ๋ผ์ธ์ ๋ชจ์
์บก์ฒ ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ ์ด๋ฅผ ํด๋จธ๋
ธ์ด๋์ฉ์ผ๋ก ์ฌํ๊ฒํ
ํ ํ ์ ์ฑ
์ ํ๋ จํ๊ณ ๋ฐฐํฌํ๋ค.
- Gap: ๊ท ํ ์ค์ฌ์ ๊ทน๋์ ์์
์ ๋ํด ๊ธฐ์กด ์ถ์ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ค์ ์ฐธ์กฐ ๋์ ์ค๋ฅ๋ก ์ธํ ๋ถ์์ ์ฑ, ํํํ์ ๋ถ์ผ์น๋ก ์ธํ ํ์ต ์ด๋ ค์, ์ผ์ ๋
ธ์ด์ฆ์ ๋ชจ๋ธ๋ง ์ค๋ฅ๋ก ์ธํ sim-to-real ๊ฐญ ๋ฑ ์ธ ๊ฐ์ง ํต์ฌ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ์ง ๋ชปํ๊ณ ์๋ค.
- Why: ๊ท ํ ์ ์ง๋ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ด ๋ณต์กํ๊ณ ๋น๊ตฌ์กฐ์ ์ธ ํ๊ฒฝ์์ ์ด๋ ๋ฅ๋ ฅ์ ๋ฐํํ๊ธฐ ์ํ ํ์ ๊ธฐ๋ฅ์ด๋ฉฐ, ์ค์ ์ ๊ทนํ ๊ท ํ ์์
์ ์ ์ ์กฐ์ , ๋ฌด๊ฒ ์ค์ฌ์ ์ ๋ฐ ์ ์ด, ์ธ๋ถ ๊ต๋์ ๋ํ ๊ฐ๊ฑด์ฑ์ ๋์์ ์๊ตฌํ๋ ๋์ ์ ์ธ ๋ฌธ์ ์ด๋ค.
- Approach: HuB๋ ์ฐธ์กฐ ๋์์ ํ์ง ํฅ์์ ์ํด SMPL ๊ธฐ๋ฐ ์ด๊ธฐํ์ ํ์ฒ๋ฆฌ ๊ธฐ๋ฒ์ ์ ์ฉํ๊ณ , ๊ท ํ ์ธ์ ์ ์ฑ
ํ์ต์ ์ํด ์ถ์ ๋ชฉํ๋ฅผ ์ํํ๋ฉฐ ๊ท ํ ํ์ฑ ๋ณด์์ ๋์
ํ๊ณ , sim-to-real ๊ฐ๊ฑด์ฑ์ ์ํด IMU ์ค์ฌ ์ญ๋, ๊ตญ์ํ๋ ์ฐธ์กฐ ์ถ์ , ๊ณ ์ฃผํ ์ธ๋ถ ์ถฉ๊ฒฉ์ ํ์ฉํ๋ค.
Achievement
Figure 1: Extreme Balance Tasks. HuB enables humanoids to perform extreme quasi-static balance tasks
- ๊ทนํ ๊ท ํ ์์
์คํ: Swallow Balance(์ํ ํ์ฅ ์์ธ), Bruce Lee's Kick(1.5m ์ด์์ ๋์ ๋ฐ์ฐจ๊ธฐ), Ne Zha Pose ๋ฑ ์ค์ ์ ๊ทนํ ์์ธ๋ค์ Unitree G1 ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์์ ์์ ์ ์ผ๋ก ์ํ", '๊ฐ๊ฑดํ ์ธ๋ถ ๊ต๋ ๋ด์ฑ: ๊ฐ๋ ฅํ ์ถ๊ตฌ๊ณต ์ถฉ๊ฒฉ ๋ฑ์ ๋ฌผ๋ฆฌ์ ๊ต๋์๋ ์ ์ฑ
์ด ์์ ์ ์ผ๋ก ์ ์ง๋๋ฉฐ 10๋ฒ์ ์ฐ์ ์ํ์ ๋จ์ผ ๋กค์์ ๋ด์์ ์ฑ๊ณต
- ๊ธฐ์ค์ ๋๋น ์ฐ์ํ ์ฑ๋ฅ: ์ถ์ ๊ธฐ๋ฐ baseline ๋ฐฉ๋ฒ๋ค์ด ๊ท ํ ์์ค๋ก ๋ํํ๊ฑฐ๋ ํ ๋ฐ ๋์์ ํฌ๊ธฐํ๋ ๋ฐ๋ฉด, HuB๋ ์ด๋ฌํ ๊ทนํ ์์
๋ค์ ์์
How
Figure 2: HuB Overview. To tackle the challenges of extreme balance tasks on humanoids, HuB integrates
- ์ฐธ์กฐ ๋์ ์ ์ : SMPL ์ ์ฒด ๋ชจ๋ธ ๊ธฐ๋ฐ ์ด๊ธฐํ๋ฅผ ํตํ ์๋ ด ๊ฐ์ํ, ๋ฐ ์ฌ๋ผ์ด๋ฉ ์ ๊ฑฐ๋ฅผ ์ํ ์ฐฉ์ง ๋ฐ ๋ณด์ , ๋ฌด๊ฒ ์ค์ฌ ํํฐ๋ง ๋ฐ ์ ํ ์์ ํ๋ก ๋ฌผ๋ฆฌ์ ํ๋น์ฑ ํฅ์
- ๊ท ํ ์ธ์ ์ ์ฑ
ํ์ต: ์๋ฒฝํ ์ถ์ ๋์ ์ฐธ์กฐ ๊ถค์ ๊ทผ์ฒ์์์ ํ์์ ํ์ฉํ๋ ์ํ๋ ์ถ์ , ๋ฌด๊ฒ ์ค์ฌ ์์น, ๋ฐ ์ ์ด ๋ถ์ผ์น, ๋ฐ ๊ทผ์ ๋ ๋ฑ์ ๋ํ ํ์ฑ ๋ณด์ ๋์
- Sim-to-real ๊ฐ๊ฑด์ฑ ํ๋ จ: IMU๋ฅผ ์ค์ฌ์ผ๋ก ํ ๊ด์ธก ์ญ๋์ผ๋ก ํ์ค์ ์ผ์ ๋
ธ์ด์ฆ ๋ชจ๋ธ๋ง, VIO ์์กด์ฑ ์ ๊ฑฐ๋ฅผ ์ํ ๊ตญ์ํ๋ ์ฐธ์กฐ ์ถ์ , ํ์ค ์ธ๊ณ์ ์ง๋ ํจ๊ณผ๋ฅผ ๊ทผ์ฌํ๋ ๊ณ ์ฃผํ ์ธ๋ถ ์ถฉ๊ฒฉ ์ ์ฉ
- MDP ๊ธฐ๋ฐ formulation: ์ํ-ํ๋-์ ์ด-๋ณด์-ํ ์ธ์จ๋ก ๊ตฌ์ฑ๋ Markov Decision Process๋ก ๋ฌธ์ ๋ชจ๋ธํ ๋ฐ RL ํ๋ ์์ํฌ ์ ์ฉ
Originality
- ๊ทนํ ์ค์ ์ ๊ท ํ ์์
์ ์ํ ํตํฉ ํ๋ ์์ํฌ๋ก, ๊ธฐ์กด ๋์ ์์ ํ ์ค์ฌ ์ฐ๊ตฌ์ ๋ฌ๋ฆฌ ์ง์์ ์ธ ๊ทนํ ๊ท ํ ์ ์ง์ ์ด์
- ํํํ์ ๋ถ์ผ์น๋ฅผ ๊ณ ๋ คํ ์ํ๋ ์ถ์ ๋ชฉํ์ ๊ท ํ ์ค์ฌ ํ์ฑ ๋ณด์์ ์กฐํฉ์ผ๋ก ์ ์ฑ
ํ์ต ๊ฐ์
- ์ผ์ ๋
ธ์ด์ฆ, ์ ์ด ๋ชจ๋ธ๋ง, ์ง๋ ํจ๊ณผ๋ฅผ ๊ตฌ์ฒด์ ์ผ๋ก ๋ชจ๋ธ๋งํ๋ ๊ท ํ ์์
ํนํ์ sim-to-real ์ ์ด ์ ๋ต
- SMPL ๊ธฐ๋ฐ ์ด๊ธฐํ์ ๋ค๋จ๊ณ ํ์ฒ๋ฆฌ๋ฅผ ํตํ ์ฒด๊ณ์ ์ธ ์ฐธ์กฐ ๋์ ์ ์ ํ์ดํ๋ผ์ธ
Limitation & Further Study
- Unitree G1 ๋จ์ผ ํ๋ซํผ์์๋ง ๊ฒ์ฆ๋์ด ๋ค์ํ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ๋ํ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ ๋ฏธํ์ธ
- ๊ทนํ ๊ท ํ ์์
์ผ๋ก ์ ํ๋์ด ๋์ ๋ก๋ด ์ด๋(์: ๋ฌ๋ฆฌ๊ธฐ, ์ ํ)๊ณผ์ ํตํฉ ๊ฐ๋ฅ์ฑ ๋ฏธํ์
- ์ฐธ์กฐ ๋์์ ํ์ง์ด ์ฌ์ ํ ์ค์ํ ์์์ด๋ฏ๋ก ์ ํ์ง ๋ชจ์
์บก์ฒ์ ๋ํ ๊ฐ๊ฑด์ฑ ํ๊ณ
- ์ฅ๊ธฐ ์ฐ์ ์ด๋์ด๋ ๋ณตํฉ ์์
์ํ์ค์ ๋ํ ์ฑ๋ฅ ํ๊ฐ ๋ถ์ฌ
- ํ์ ์ฐ๊ตฌ๋ก ๋ค์ค ํด๋จธ๋
ธ์ด๋ ํ๋ซํผ ์ ์ฉ, ๋์ ์์
๊ณผ์ ๊ฒฐํฉ, ์ ํ์ง ์
๋ ฅ ๋ฐ์ดํฐ์ ๋ํ ๊ฐ๊ฑด์ฑ ๊ฐํ ํ์
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: HuB๋ ํด๋จธ๋
ธ์ด๋์ ๊ทนํ ๊ท ํ ์ ์ด๋ผ๋ ๋์ ์ ๋ฌธ์ ์ ๋ํด ์ฐธ์กฐ ์ ์ , ์ ์ฑ
ํ์ต, sim-to-real ์ ์ด์ ์ธ ๊ฐ์ง ํต์ฌ ์์๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ํตํฉํ ํฌ๊ด์ ์๋ฃจ์
์ ์ ์ํ๋ฉฐ, ์ค์ ํ๋์จ์ด์์ ์ธ์์ ์ธ ์ฑ๋ฅ์ ๋ฌ์ฑํ์ฌ ๋ก๋ด ์ ์ด ๋ถ์ผ์ ์๋ฏธ ์๋ ๊ธฐ์ฌ๋ฅผ ํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์