Mobile-TeleVision: Predictive Motion Priors for Humanoid Whole-Body Control
์ ์: Chenhao Lu, Xuxin Cheng, Jialong Li, Shiqi Yang, Mazeyu Ji, Chengjing Yuan, Ge Yang, Sha Yi, Xiaolong Wang | ๋ ์ง: 2024-12-10 | URL: https://arxiv.org/abs/2412.07773 📄 PDF
Essence
Fig. 2: The training pipeline consists of three stages: (a) preprocessing of the motion dataset by mapping local rotatio
ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ์ ์ ์ ์ด๋ฅผ ์ํด ์์ฒด ์กฐ์๊ณผ ํ์ฒด ๋ณดํ์ ๋ถ๋ฆฌํ๊ณ , CVAE ๊ธฐ๋ฐ Predictive Motion Priors (PMP)๋ฅผ ์ฌ์ฉํ์ฌ ์์ฒด์ ์ ๋ฐํ ์กฐ์๊ณผ ํ์ฒด์ ๊ฐ๊ฑดํ ๋ณดํ์ ๋์์ ๋ฌ์ฑํ๋ค.
Motivation
- Known: ์ต๊ทผ RL ๊ธฐ๋ฐ ์ ์ ์ ์ด ๋ฐฉ๋ฒ๋ค(ExBody, OmniH2O, HumanPlus)์ด ๋ณดํ๊ณผ ์กฐ์์ ํจ๊ป ํ์ตํ์ง๋ง, ๊ณ ์์ ๋ ํ์ ์ ๋ฐํ ์กฐ์์์๋ ๋ถ์กฑํ๋ค.
- Gap: RL์ ๊ณ DoF ์์น ๋ฐ ๋ฐฉํฅ ์ ์ด์ ์ ํฉํ์ง ์์ผ๋ฉฐ, ๋์ ๋ณดํ ์ค ํ ์ ์ด์ ๋ถ์์ ์ฑ์ด ๋ฐ์ํ๊ณ , ์์ ๋ถ๋ฆฌ ์ ์ด๋ ์ํ์ฒด ์ํธ์์ฉ์ผ๋ก ์ธํ ๋ถ์์ ์ ์ผ๊ธฐํ๋ค.
- Why: ์ผ์์ ๋ก๋ด ํ๋์์ ํ๊ณผ ๋ค๋ฆฌ์ ์๊ตฌ ์ฌํญ์ด ๊ทผ๋ณธ์ ์ผ๋ก ๋ค๋ฅด๋ฏ๋ก(ํ: ์ ๋ฐ์ฑ๊ณผ ๋ค์ํ ํ, ๋ค๋ฆฌ: ๊ท ํ ์ ์ง), ์ด๋ฅผ ํตํฉ์ ์ผ๋ก ํด๊ฒฐํ๋ ๊ฒ์ด ์ค์ฉ์ ํด๋จธ๋
ธ์ด๋ ์์คํ
๊ตฌํ์ ํต์ฌ์ด๋ค.
- Approach: ์์ฒด ์ ์ด๋ฅผ ์ญ๊ธฐ๊ตฌํ๊ณผ ๋ชจ์
๋ฆฌํ๊ฒํ
์ผ๋ก ์ฒ๋ฆฌํ๊ณ , ํ์ฒด ๋ณดํ์ RL๋ก ํ์ตํ๋, CVAE๋ฅผ ํตํด ์์ฒด ๋ชจ์
์ ๋ฏธ๋ ์ ๋ณด๋ฅผ ์ ์ฌ ํํ์ผ๋ก ์ธ์ฝ๋ฉํ์ฌ ํ์ฒด ์ ์ฑ
์ ๊ด์ฐฐ๊ฐ์ผ๋ก ์ ๊ณตํจ์ผ๋ก์จ ์ํ์ฒด ๋ถ๋ฆฌ์ ํตํฉ์ ๋์์ ๋ฌ์ฑํ๋ค.
Achievement
Fig. 1: Humanoid robot doing whole-body tasks that require both precise manipulation and robust locomotion. The robot
- ๋ถ๋ฆฌ๋ ์ ์ด ๊ตฌ์กฐ์ ์์ ์ฑ: CVAE ๊ธฐ๋ฐ motion prior๋ฅผ ํ์ฒด ์ ์ฑ
์ ์ ๊ณตํจ์ผ๋ก์จ ์์ ๋ถ๋ฆฌ์ ๋ถ์์ ์ฑ์ ํด์ํ๋ฉด์๋ ์์ฒด ์ ๋ฐ์ฑ ์ ์ง
- ๋์ ์์ ๋ ์กฐ์: 7 DoF ํ๋ก GR1, Unitree H1์์ ์ ๋ฐํ ์กฐ์ ์ํ (๊ธฐ์กด ๋ฐฉ๋ฒ์ 4-5 DoF)
- ๊ฐ๊ฑดํ ๋ณดํ: ์ง ์ด๋ฐ, ๋ฐ๊ธฐ, ์๋ฆฌ๋ฒ ์ดํฐ ์ฌ์ฉ ๋ฑ ๋ถํ๊ฐ ์๋ ํ๊ฒฝ์์ 10์ด ์ด์์ ์์ ์ ๋ณดํ ๋ฌ์ฑ
- ํ
๋ ์คํผ๋ ์ด์
์นํ์ : ๊ฐ๋จํ ์๋ ๋ช
๋ น๊ณผ ํ ์ ์ด๋ฅผ ํตํด ์๊ฒฉ ์กฐ์ ๊ฐ๋ฅ, ๋ฎ์ ์ฐ์ฐ ๋น์ฉ
- ์ค์ธ๊ณ ๋ฐฐํฌ: ์๋ฎฌ๋ ์ด์
์์์ ์ฑ๋ฅ์ด ์ค์ ๋ก๋ด(Unitree H1)์ ์ง์ ์ ์ด ๊ฐ๋ฅ
How
Fig. 2: The training pipeline consists of three stages: (a) preprocessing of the motion dataset by mapping local rotatio
- Stage 1 (๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ): ์ธ๊ฐ ๋ชจ์
๋ฐ์ดํฐ์
์ ๋ํด ๋ก์ปฌ ๋กํ
์ด์
๋งคํ์ ์ ์ฉํ์ฌ ๋ก๋ด ๊ด์ ๊ฐ๋๋ก ๋ณํ ๋ฐ ๋ฆฌํ๊ฒํ
- Stage 2 (Motion Prior ํ์ต): CVAE ์ํคํ
์ฒ๋ก ๊ณผ๊ฑฐ ์์ฒด ๋ชจ์
Mโโ(t-W~t-1)์ผ๋ก๋ถํฐ ๋ฏธ๋ ๋ชจ์
Mโโ(t~t+W-1) ์์ธก, ์ ์ฌ ๋ฒกํฐ zโ โ โโถโด ํ์ต
- CVAE ๋ชฉ์ ํจ์: Evidence Lower Bound (ELBO)๋ก ์ฌ๊ตฌ์ฑ ์์ค๊ณผ KL ๋ฐ์ฐ์ ๊ฒฐํฉํ์ฌ ์์ฑ์ ๋ชจ์
ํํ ํ์ต
- Stage 3 (RL ์ ์ฑ
ํ์ต): ํ์ฒด RL ์ ์ฑ
์ ์์ฒด motion prior zโ๋ฅผ ๊ด์ฐฐ๊ฐ์ผ๋ก ์์ , ํ์ฒด 12๊ฐ ๊ด์ ๋ง ์ ์ด, ์์ฒด๋ IK/๋ฆฌํ๊ฒํ
์ผ๋ก ์ง์ ์ ์ด
- Curriculum ํ์ต: ์์ฒด ์ ์ด๋ฅผ ์ ์ง์ ์ผ๋ก ํ์ฅํ๋ ์ปค๋ฆฌํ๋ผ ์ค์ผ์ค๋ก ํ์ต ์์ ์ฑ ๊ฐํ
- Gait periodic signal ํตํฉ: ๋ณดํ ๋ฆฌ๋ฌ ์ ๋ณด๋ฅผ ํ์ฒด ์ ์ฑ
์
๋ ฅ์ ํฌํจํ์ฌ ๊ฑธ์์ ์์ ์ฑ ํฅ์
Originality
- Motion Prior๋ฅผ ํตํ ๋ถ๋ฆฌ-ํตํฉ ๊ฒฐํฉ: ์์ ๋ถ๋ฆฌ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ฉด์๋ ๋
๋ฆฝ์ ์ต์ ํ๋ฅผ ์ ์งํ๋ ์๋ก์ด ํจ๋ฌ๋ค์ ์ ์
- CVAE ์ ์ฌ ํํ์ ์ ์ฑ
์กฐ๊ฑดํ: ๋จ์ํ ์ํ ํผ์ฒ๊ฐ ์๋๋ผ ๋ฏธ๋ ๋ชจ์
์์ธก ์ ๋ณด๋ฅผ ์ ์ฑ
์
๋ ฅ์ผ๋ก ์ฌ์ฉํ๋ ์ฐฝ์์ ์ ๊ทผ
- ๊ณ DoF ํ์ ๋ํ ์ญ๊ธฐ๊ตฌํ ์ง์ ์ ์ด: RL์ ๊ฑฐ์น์ง ์๊ณ ๋น์ฉ ํจ์ ๊ธฐ๋ฐ IK๋ก ์ ๋ฐ์ฑ ํ๋ณด, ๊ธฐ์กด ๋ฐฉ๋ฒ๊ณผ ๊ตฌ๋ณ
- ์ค์ธ๊ณ ํ
๋ ์คํผ๋ ์ด์
์์คํ
๊ตฌ์ถ: ๋จ์ ์๋ ๋ช
๋ น + ์ ๋ฆฌํ๊ฒํ
์ผ๋ก ์ค์ฉ์ ์ธํฐํ์ด์ค ์ ๊ณต
Limitation & Further Study
- CVAE ํ์ต ๋ฐ์ดํฐ ์์กด์ฑ: ์ธ๊ฐ ๋ชจ์
๋ฐ์ดํฐ์
์ ๋ถํฌ์ ํฌ๊ฒ ์์กดํ๋ฉฐ, ๋ฐ์ดํฐ์
์ธ ๋ชจ์
์์ฒญ ์ ์ฑ๋ฅ ์ ํ ๊ฐ๋ฅ์ฑ
- ์ํ์ฒด ๋ฌผ๋ฆฌ์ ์ํธ์์ฉ ์ ํ: ์์ฒด ์ ์ด๊ฐ ์ฌ์ค์ ์คํ๋ฃจํ์ด๋ฏ๋ก, ์์ฒด ๋ฌด๊ฒ๊ฐ ํ์ฒด ์์ ์ฑ์ ์ํฅ์ ๋ฏธ์น๋ ๊ฒฝ์ฐ์ ์ ๋์ ๋ถ์ ๋ถ์กฑ
- ์ค์๊ฐ ๊ณ์ฐ ๋ณต์ก๋: CVAE ์ธ์ฝ๋/๋์ฝ๋์ RL ์ ์ฑ
๋์ ์คํ์ ์ค์๊ฐ ๊ณ์ฐ ๋น์ฉ ๋ถ์ ๋ฏธํก
- ์ผ๋ฐํ ์ฑ๋ฅ: ๋ ๊ฐ์ง ๋ก๋ด(GR1, H1)์์๋ง ํ๊ฐ๋์์ผ๋ฉฐ, ๋ ๋ค์ํ ํํ์ ํด๋จธ๋
ธ์ด๋์์์ ๊ฒ์ฆ ํ์
- ํ์ ์ฐ๊ตฌ: (1) ์ํ์ฒด ํผ๋๋ฐฑ ๋ฃจํ๋ฅผ ํตํ ์ ์์ ๋ณดํ ์กฐ์ , (2) ํ์ต ๊ธฐ๋ฐ ์-๋ฐ ํ์ ๋ฉ์ปค๋์ฆ, (3) ๋ ํฐ ๊ท๋ชจ ์ค์ธ๊ณ ๋ฐฐํฌ ๋ฐ ์ฅ์๊ฐ ์์ ์ฑ ํ
์คํธ
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ์์ฒด ์ ๋ฐ ์กฐ์๊ณผ ํ์ฒด ๊ฐ๊ฑด ๋ณดํ์ด๋ผ๋ ๊ทผ๋ณธ์ ์ผ๋ก ๋ค๋ฅธ ์๊ตฌ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ๋ถ๋ฆฌํ๋ฉด์๋ CVAE ๊ธฐ๋ฐ motion prior๋ฅผ ํตํด ํตํฉํ๋ ์ฐฝ์์ ์ ๊ทผ์ผ๋ก, ๊ณ DoF ํ ์ ์ด์์ ๊ธฐ์กด ์ ์ RL ๋ฐฉ๋ฒ์ ๋ช
ํํ ๋ฅ๊ฐํ๋ค. ์ค์ธ๊ณ ํ
๋ ์คํผ๋ ์ด์
๊ฐ๋ฅ์ฑ๊น์ง ๋ณด์ฌ์ฃผ์ด ์ค์ฉ์ฑ์ด ๋์ ์ฐ๊ตฌ์ด๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์