Towards Adaptable Humanoid Control via Adaptive Motion Tracking
์ ์: Tao Huang, Huayi Wang, Junli Ren, Kangning Yin, Zirui Wang, Xiao Chen, Feiyu Jia, Wentao Zhang, Junfeng Long, Jingbo Wang, Jiangmiao Pang | ๋ ์ง: 2025-10-16 | DOI: 10.48550/arXiv.2510.14454 📄 PDF
Essence
Fig. 2: Method overview. (a) Human motions are reconstructed into SMPL motions via GVHMR [21] and retargeted to the huma
AdaMimic์ ๋จ์ผ ์ฐธ์กฐ ๋์์ผ๋ก๋ถํฐ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ์ ์ํ ์ ์ด๋ฅผ ๊ฐ๋ฅํ๊ฒ ํ๋ ๋์ ์ถ์ ์๊ณ ๋ฆฌ์ฆ์ผ๋ก, ํคํ๋ ์ ๊ธฐ๋ฐ ๋ฐ์ดํฐ ์ฆ๊ฐ๊ณผ ๋จ๊ณ์ ์ด๋ํฐ ํ์ต์ ํตํด ์ ํํ ๋ชจ๋ฐฉ๊ณผ ๊ด๋ฒ์ํ ์ ์์ฑ์ ๋์์ ๋ฌ์ฑํ๋ค.
Motivation
- Known: ๊ธฐ์กด motion prior ๊ธฐ๋ฐ RL ๋ฐฉ๋ฒ์ ์ ์์ฑ์ ์ฐ์ํ์ง๋ง ๋ชจ๋ฐฉ ์ ํ๋๊ฐ ๋ฎ๊ณ , motion tracking ๋ฐฉ๋ฒ์ ์ ํํ ๋ชจ๋ฐฉ์ด ๊ฐ๋ฅํ์ง๋ง ๋ค์ํ ์กฐ๊ฑด์ ์ปค๋ฒํ๊ธฐ ์ํด ๋๊ท๋ชจ ํ์ต ๋ฐ์ดํฐ์ ํ
์คํธ ์ ์ฐธ์กฐ ๋์์ด ํ์ํ๋ค.
- Gap: ๋จ์ผ ์ฐธ์กฐ ๋์์ผ๋ก๋ถํฐ ๋ฐ์ดํฐ ์์กด์ฑ์ ์ค์ด๋ฉด์๋ ์ ํํ ๋ชจ๋ฐฉ ์ฑ๋ฅ๊ณผ ๊ด๋ฒ์ํ ์ ์์ฑ์ ๋์์ ์ ๊ณตํ ์ ์๋ ๋ฐฉ๋ฒ์ด ๋ถ์ฌํ๋ค.
- Why: ์ค์ ํ๊ฒฝ์ ๋ค์ํ ์กฐ๊ฑด์์ ๋์ํด์ผ ํ๋ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ด ์ ์๋ ฅ ์๋ ๋์์ ์ต์ํ์ ๋ฐ์ดํฐ๋ก ํ์ตํ ์ ์์ผ๋ฉด ์ค์ฉ์ฑ์ด ํฌ๊ฒ ํฅ์๋๊ธฐ ๋๋ฌธ์ด๋ค.
- Approach: ๋จ์ผ ์ฐธ์กฐ ๋์์ ํคํ๋ ์์ผ๋ก ํฌ์ํํ๊ณ ์ต์ํ์ ๋ฌผ๋ฆฌ ๊ฐ์ ์ผ๋ก ํธ์งํ์ฌ ์ฆ๊ฐ ๋ฐ์ดํฐ์
์ ์์ฑํ ํ, ๊ณ ์ phase interval๋ก ์ ์ฑ
์ ์ด๊ธฐํํ๊ณ , ์ดํ phase adapter์ tracking adapter๋ฅผ ํ์ตํ์ฌ ์ ์ฐํ time warping์ ํตํด ์ ์์ฑ์ ํ๋ณดํ๋ค.
Achievement
Fig. 1: Overview. Our method, AdaMimic (adaptive motion tracking), achieves agile humanoid whole-body adaptation from on
- ๋จ์ผ ๋์์ผ๋ก๋ถํฐ์ ํ์ต: ๋๊ท๋ชจ ๋ฐ์ดํฐ์
์์ด ํ๋์ ์ฐธ์กฐ ๋์๋ง์ผ๋ก ๋ค์ํ ์กฐ๊ฑด์ ์ ์ํ ์ ์๋ ํด๋จธ๋
ธ์ด๋ ์ ์ด ์ ์ฑ
๊ฐ๋ฐ
- ์ ํํ ๋ชจ๋ฐฉ๊ณผ ์ ์์ฑ์ ๊ฒฐํฉ: ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค์ trade-off๋ฅผ ๊ทน๋ณตํ์ฌ ๋์ ๋ชจ๋ฐฉ ์ ํ๋์ ๋์ ์ ์ ๋ฒ์๋ฅผ ๋์ ๋ฌ์ฑ
- ์ค์ ๋ก๋ด ๊ฒ์ฆ: Unitree G1 ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์์ ์ ํ, ๋ฐฐ๋๋ฏผํด, ํ
๋์ค ๋ฑ ๋ค์ํ ๊ณผ์ ์์ ๊ด๋ฒ์ํ ์ ์ ์กฐ๊ฑด ํ์์ ์ฐ์ํ ์ฑ๋ฅ ์
์ฆ
- ๋จ๊ณ์ ํ์ต ํ๋ ์์ํฌ: ๊ณ ์ phase interval ์ถ์ ํ ๋์ ์ด๋ํฐ ํ์ต์ two-stage ์ค๊ณ๋ก ํจ์จ์ ์ด๊ณ ์์ ์ ์ธ ํ์ต ๊ฐ๋ฅ
How
Fig. 2: Method overview. (a) Human motions are reconstructed into SMPL motions via GVHMR [21] and retargeted to the huma
- ์ธ๊ฐ ๋์์ GVHMR์ ํตํด SMPL ๋ชจ์
์ผ๋ก ์ฌ๊ตฌ์ฑํ๊ณ ๋ก๋ด์ ๋ง๊ฒ retarget
- ๋จ์ผ ์ฐธ์กฐ ๋์์์ ์ค์ keyframe์ ์ ํํ๊ณ global trajectory ๋ณํ๋ฅผ ์ ์ฉํ์ฌ ํธ์ง ๋ฐ์ดํฐ์
D_ref^edit ์์ฑ
- Observation o_k = (qฬ_ฯk, q_ฯk, ฮธฬ_k, ฯฬ_k, ฯ_k)๋ฅผ ์
๋ ฅ๋ฐ์ tracking policy ฯ_track ํ์ต
- Sparse global reward์ dense local reward๋ฅผ ์ด์ฉํ ์ด์ค critic (V_track^sparse, V_track^dense) ํ์ฉ
- Stage 1: ๊ณ ์ ๋ ฮฯ_k๋ก phase interval์ ๋ฐ๋ฅธ ๊ธฐ๋ณธ ์ถ์ ์ ์ฑ
ํ์ต
- Stage 2: Phase adapter ฯ_phase^ฮ๋ก motion speed ์กฐ์ ๊ณผ tracking adapter ฯ_track^ฮ๋ก ์ ์์ค ๋์ ๋ณด์ , ์ด๋ฅผ ํตํด flexible time warping ๊ตฌํ
- ํ์ต๋ ์ ์ฑ
์ Unitree G1 ๋ก๋ด์ ์ง์ ๋ฐฐํฌํ์ฌ IMU, ๊ด์ , Lidar odometry ์ ๋ณด ํ์ฉ
Originality
- ํคํ๋ ์ ๊ธฐ๋ฐ ๋ฐ์ดํฐ ์ฆ๊ฐ: ๋จ์ผ ๋์์ผ๋ก๋ถํฐ local pattern์ ๋ณด์กดํ๋ฉด์ global trajectory๋ง ๋ณํํ์ฌ ํจ์จ์ ์ผ๋ก ์ฆ๊ฐ ๋ฐ์ดํฐ ์์ฑ
- ์ด์ค ๋ณด์ ๊ตฌ์กฐ: Global-level๊ณผ local-level ๋ณด์์ ๋ถ๋ฆฌํ์ฌ sparse keyframe ์ถ์ ๊ณผ dense ์ค๊ฐ ๋์์ ํจํด ๋ณด์กด์ ๋์์ ๋ฌ์ฑ
- ์ ์ํ Phase ๋ฐ Tracking ์ด๋ํฐ: Motion speed์ ์ ์์ค ๋์์ ๋
๋ฆฝ์ ์ผ๋ก ์กฐ์ ํ๋ two-stage ์ด๋ํฐ ์ค๊ณ๋ก flexible time warping ์ ๊ณต
- ์ต์ ๋ฌผ๋ฆฌ ๊ฐ์ ์ผ๋ก์ ํธ์ง: ๋ณต์กํ space-time constraints ์์ด๋ ๋ฌผ๋ฆฌ์ ํ๋น์ฑ ์ ์ง
Limitation & Further Study
- ์ ํ๋ ์ฐธ์กฐ ๋์: ๋ณต์กํ ๋ค์ค ํ์ด์ฆ ๋์์ด๋ ๋์ ์ญ๋์ฑ์ด ํ์ํ ์์ง์์ ๋จ์ผ ์ฐธ์กฐ ๋์์ผ๋ก ์ถฉ๋ถํ์ง ์์ ์ ์์
- ํ๊ฒฝ ์กฐ๊ฑด ์์กด์ฑ: ์ค์ ๋ก๋ด ๋ฐฐํฌ์์ ๋ถ๊ท์นํ ์งํ, ์ธ๋ถ ๋ฐฉํด ๋ฑ์ ๋ํ ๊ฐ๊ฑด์ฑ ๊ฒ์ฆ ๋ถ์กฑ
- ํ์ฅ์ฑ ๋ฏธ๋ถ์: ๋ค์ํ ๋ก๋ด ํ๋ซํผ์ด๋ ํํ (bipedal์ด ์๋ quadruped ๋ฑ)์์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ ๋ฏธ๋ช
์
- ํ์ ์ฐ๊ตฌ: (1) ๋ณตํฉ ๋์์ ๋ค์ค segment ์ฒ๋ฆฌ, (2) ์๋ฎฌ๋ ์ด์
-ํ์ค ๊ฐ๊ฒฉ(sim-to-real gap) ๋์ฑ ์ฒด๊ณ์ ๋ถ์, (3) ๋ค์ํ ๋ก๋ด ํํ์ ๋ํ ๋ฒ์ฉ ์ ์ ๋ฉ์ปค๋์ฆ ๊ฐ๋ฐ
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: AdaMimic์ ๋จ์ผ ์ฐธ์กฐ ๋์์ผ๋ก๋ถํฐ ๊ณ ์ ๋ฐ ๋ชจ๋ฐฉ๊ณผ ๊ด๋ฒ์ ์ ์์ฑ์ ๋์์ ๋ฌ์ฑํ๋ ํ์ ์ ์ ๊ทผ์ผ๋ก, ๋ ๋จ๊ณ ํ์ต๊ณผ ์ด์ค ์ด๋ํฐ ๊ตฌ์กฐ์ ์๋ก์ด ์ค๊ณ๊ฐ ์๋ฏธ ์์ผ๋ฉฐ, ์ค์ ๋ก๋ด์์์ ๊ด๋ฒ์ํ ๊ฒ์ฆ์ด ์ ์๋์ด ์ค์ฉ์ฑ์ด ๋๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์