A Unified and General Humanoid Whole-Body Controller for Versatile Locomotion
์ ์: Yufei Xue, Wentao Dong, Minghuan Liu, Weinan Zhang, Jiangmiao Pang | ๋ ์ง: 2025-02-05 | URL: https://arxiv.org/abs/2502.03206 📄 PDF
Essence
HugWBC๋ ์๋ฎฌ๋ ์ด์
์์ ํ์ตํ ํต์ผ๋ ๊ฐํํ์ต ๊ธฐ๋ฐ ์ ์ฑ
์ผ๋ก ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ด ๊ฑท๊ธฐ, ๋ฐ๊ธฐ, ์๊ธฐ, ๊นก์ถฉ๋ฐ๊ธฐ ๋ฑ ๋ค์ํ ๋ณดํ ํ๋์ ์์ ๋กญ๊ฒ ์กฐ์ ๊ฐ๋ฅํ๋๋ก ํ๋ฉฐ, ์๋ฐ์ ์ธ๋ถ ์ ์ด ๊ฐ์
๋ ์ง์ํ๋ ์ ์ ์ปจํธ๋กค๋ฌ์ด๋ค.
Motivation
- Known: ๊ธฐ์กด ํด๋จธ๋
ธ์ด๋ ๋ก๋ด ์ปจํธ๋กค๋ฌ๋ ๋จ์ํ๊ณ ์ ํ๋ ๋ณดํ๋ง ์ง์ํ๋ฉฐ, ๋ชจ๋ธ ๊ธฐ๋ฐ ๋ฐฉ์์ ๊ณ์ฐ ๋ณต์ก๋๊ฐ ๋๊ณ ํ์ต ๊ธฐ๋ฐ ๋ฐฉ์์ ํน์ ๊ณผ์ ๋ ๋ชจ์
์ถ์ ์๋ง ์ง์คํ๊ณ ์๋ค.
- Gap: ๊ธฐ์กด ์ฐ๊ตฌ๋ ๋ค์ํ ๋ณดํ ์คํ์ผ(๊ฐ์๋, ๋ฐ ๋์ด, ๋น๋ ๋ฑ)์ ํตํฉ๋ ์ ์ฑ
์ผ๋ก ์ ์ดํ์ง ๋ชปํ๊ณ , ์๋ฐ์ ์ธ๋ถ ๊ฐ์
๊ณผ ํ๋ฐ์ ๋ณดํ ์ ์ด๋ฅผ ํจ๊ป ์ํํ๋ robustํ ์ ์ ์ปจํธ๋กค๋ฌ๊ฐ ๋ถ์ฌํ๋ค.
- Why: ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ด ํ์ค ํ๊ฒฝ์์ ๋ค์ํ ์์
(๋ก์ฝ-์กฐ์, ํ
๋ ์์
๋ฑ)์ ์ํํ๋ ค๋ฉด ์ ์ฐํ๊ณ ์ ์์ฑ ๋์ ๋ณดํ ์ ์ด๊ฐ ํ์์ด๋ฉฐ, ์ธ๊ฐ ์์ค์ ์ด๋ ๋ฅ๋ ฅ ๊ตฌํ์ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ์ค์ฉ์ฑ์ ํฌ๊ฒ ํฅ์์ํจ๋ค.
- Approach: ์ผ๋ฐํ๋ ๋ช
๋ น ๊ณต๊ฐ(์ ํ/๊ฐ์๋, ๋ฐ ๋์ด, ์ฃผํ์, ์์ธ ๋ฑ)์ ์ค๊ณํ๊ณ , symmetrical loss์ intervention training ๊ธฐ๋ฒ์ ํ์ฉํ์ฌ RL ๊ธฐ๋ฐ ์ ์ฑ
์ ์๋ฎฌ๋ ์ด์
์์ ํ์ตํ ํ ์ค์ ๋ก๋ด์ผ๋ก ์ง์ ์ ์ดํ๋ค.
Achievement
Fig. 1: Humanoid capabilities supported by HUGWBC. First row: HUGWBC allows four standard gaits - walking, jumping, stan
- ํตํฉ ์ ์ฑ
: 4๊ฐ ๋ณดํ ํ๋ ์ค 3๊ฐ๋ฅผ ํ๋์ ์ ์ฑ
์ผ๋ก ์ ์ด ๊ฐ๋ฅํ๋ฉฐ 8๊ฐ์ง ๋ช
๋ น์ ๋ํด ๋์ ์ถ์ ์ ํ๋ ๋ฌ์ฑ
- ๋ช
๋ น ๊ณต๊ฐ ํ์ฅ: ์๋, ๋ฐ ๋์ด, ์ฃผํ์, ์์ธ(๋์ด, ํ๋ฆฌ ํ์ , ์์ฒด ํผ์น) ๋ฑ ๊ธฐ์กด ์ฐ๊ตฌ๋ฅผ ์ด๊ณผํ๋ ํฌ๊ด์ ์ ์ด ์ธํฐํ์ด์ค ์ ๊ณต
- ๋ก์ฝ-์กฐ์ ์ง์: ์๋ฐ์ ์ธ๋ถ ์ ์ด๊ธฐ(ํ
๋ ์์
, IK ๋ฑ)์ ์ค์๊ฐ ๊ฐ์
์ ๊ฒฌ๋ ์ ์๋ robust ์ ์ ์ปจํธ๋กค๋ฌ๋ก ๋ค์ํ ์กฐ์ ์์
๊ฐ๋ฅ
- ์ค์ ๋ก๋ด ๊ฒ์ฆ: Unitree H1 ๋ก๋ด์์ ๊ด๋ฒ์ํ ์คํ์ ํตํด ๋์ ์์ ์ฑ๊ณผ ๊ฐ๊ฑด์ฑ์ ์
์ฆ
How
- ๊ฐํํ์ต ์ ์ฑ
ํ์ต: proprioceptive observation, ๋ช
๋ น, intervention indicator๋ฅผ ์
๋ ฅ๋ฐ์ ์ ์ ๊ด์ ์ ์ถ๋ ฅํ๋ ์ ๊ฒฝ๋ง ์ ์ฑ
์ค๊ณ
- Symmetrical loss: ์ข์ฐ ๋์นญ ๋ณดํ ๊ตฌ์กฐ๋ฅผ ํ์ฉํ์ฌ ํ์ต ํจ์จ์ฑ ๋ฐ ์์ ์ฑ ํฅ์
- Intervention training: ์๋ฐ์ ์ธ๋ถ ์ ์ด ์ ํธ๋ฅผ ๋
ธ์ด์ฆ๋ก ์๋ฎฌ๋ ์ด์
ํ๋ curriculum learning์ผ๋ก robustํ๊ฒ ํ์ต
- Phase-based gait control: phase variable๊ณผ clock function์ ํตํด ๋ค์ํ ์ฃผํ์์ ๋ฐ ๋์ด ์กฐ์ ๊ตฌํ
- Sim-to-real transfer: ์๋ฎฌ๋ ์ด์
์์ ํ์ตํ ์ ์ฑ
์ ์ค์ ๋ก๋ด์ ์ง์ ๋ฐฐํฌ
Originality
- ๊ธฐ์กด ์ ํ ์ฐ๊ตฌ(๋ฐ ๋์ด, ์ฃผํ์ ์ ์ด)๋ฅผ ๋์ด ์์ธ ์ ์ด(ํ๋ฆฌ ํ์ , ์์ฒด ํผ์น, ์ ์ฒด ๋์ด)๊น์ง ํตํฉํ ํ์ฅ๋ ๋ช
๋ น ๊ณต๊ฐ ์ ์
- Intervention training ๊ธฐ๋ฒ์ผ๋ก ์๋ฐ์ ์ธ๋ถ ์ ์ด์ ํ๋ฐ์ ๋ณดํ ์ ์ด์ ๋์ ์์ ํ๋ผ๋ ์๋ก์ด ๋ฌธ์ ํด๊ฒฐ
- 4๊ฐ ๋ณดํ ํ๋ ์ค 3๊ฐ๋ฅผ ๋จ์ผ ์ ์ฑ
์ผ๋ก ์ ์ดํ๋ ํจ์จ์ ์ธ ์ค๊ณ๋ก ๊ธฐ์กด ๋ค์ค ์ ์ฑ
๋ฐฉ์์ ํ๊ณ ๊ทน๋ณต
- Phase variable ๊ธฐ๋ฐ gait ์ ์ด๋ก ์ฐ์์ ์ธ ๋ช
๋ น ๊ณต๊ฐ์์์ ๋ถ๋๋ฌ์ด ์ ํ ์คํ
Limitation & Further Study
- ํธํ(hopping) ํ๋์ ๋ณ๋์ ์ ์ฑ
ํ์๋ก ์์ ํ ํตํฉ์ด ์๋
- ๊ณ ๋ฅด์ง ์์ ์งํ์ด๋ ๋์ ์ฅ์ ๋ฌผ ํํผ ๋ฅ๋ ฅ ์ธ๊ธ ๋ถ์กฑ
- ์๋ฐ์ ๊ฐ์
์ด ํ๋ฐ์ ๋ณดํ์ ๋ฏธ์น๋ ์ํฅ์ ๋ํ ์ ๋์ ๋ถ์ ์ ํ์
- Unitree H1 ๋จ์ผ ๋ก๋ด์์๋ง ๊ฒ์ฆ๋์ด ๋ค์ํ ํด๋จธ๋
ธ์ด๋ ํ๋ซํผ์ผ๋ก์ ์ผ๋ฐํ ๊ฒ์ฆ ํ์
- ์ค์ ํ๊ฒฝ์์์ ์ฅ๊ธฐ ์์ ์ฑ ๋ฐ ์๋์ง ํจ์จ์ฑ ํ๊ฐ ๋ถ์ฌ
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: HugWBC๋ ํ์ฅ๋ ๋ช
๋ น ๊ณต๊ฐ๊ณผ intervention training ๊ธฐ๋ฒ์ ํตํด ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ๋ค์ํ ๋ณดํ๊ณผ ๋ก์ฝ-์กฐ์์ ํตํฉ์ ์ผ๋ก ์ ์ดํ๋ ์ฒซ ๋ฒ์งธ ์ ์ ์ปจํธ๋กค๋ฌ๋ก์, ์ฐ์ํ ์ถ์ ์ฑ๋ฅ๊ณผ ๊ฐ๊ฑด์ฑ์ผ๋ก ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ์ค์ฉ ๋ฅ๋ ฅ์ ํฌ๊ฒ ํฅ์์ํค๋ ์๋ฏธ ์๋ ๊ธฐ์ฌ์ด๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์