Agility Meets Stability: Versatile Humanoid Control with Heterogeneous Data
์ ์: Yixuan Pan, Ruoyi Qiao, Li Chen, Kashyap Chitta, Liang Pan, Haoguang Mai, Qingwen Bu, Hao Zhao, Cunyuan Zheng, Ping Luo, Hongyang Li | ๋ ์ง: 2026-03-03 | DOI: 10.48550/arXiv.2511.17373 📄 PDF
Essence
Fig. 2: Overview of AMS. (a) The general whole-body tracking pipeline retargets human MoCap data to reference motions
AMS๋ ํด๋จผ ๋ชจ์
์บก์ฒ ๋ฐ์ดํฐ์ ํฉ์ฑ ๋ฐธ๋ฐ์ค ๋ฐ์ดํฐ๋ฅผ ๊ฒฐํฉํ์ฌ ๋จ์ผ ์ ์ฑ
์ผ๋ก ๋ฏผ์ฒฉํ ๋์๊ณผ ๊ทนํ์ ๋ฐธ๋ฐ์ค ์ ์ง๋ฅผ ๋์์ ์ํํ ์ ์๋ ํด๋จธ๋
ธ์ด๋ ์ ์ด ํ๋ ์์ํฌ๋ค.
Motivation
- Known: ์ต๊ทผ ๊ฐํํ์ต ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ด ๋ฏผ์ฒฉํ ๋์(์ถค, ๋ฌ๋ฆฌ๊ธฐ) ๋๋ ์์ ์ ์ธ ๋ฐธ๋ฐ์ค ์ ์ด๋ฅผ ๊ฐ๊ฐ ์ฑ๊ณต์ ์ผ๋ก ํ์ตํ์ผ๋, ๋ ๋ฅ๋ ฅ์ ํตํฉํ๋ ๋จ์ผ ์ ์ฑ
์ ์์ง ๊ตฌํ๋์ง ๋ชปํ๋ค.
- Gap: ๊ธฐ์กด ๋ฐฉ๋ฒ์ ํด๋จผ ๋ชจ์
์บก์ฒ ๋ฐ์ดํฐ์ ์์กดํ๋ฏ๋ก ๊ทนํ์ ๋ฐธ๋ฐ์ค ์๋๋ฆฌ์ค๊ฐ ๋ถ์กฑํ๊ณ , ๋ฏผ์ฒฉ์ฑ๊ณผ ์์ ์ฑ์ ์์ถฉํ๋ ์ต์ ํ ๋ชฉํ๋ฅผ ๋์์ ํด๊ฒฐํ์ง ๋ชปํ๋ค.
- Why: ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ด ์ธ๊ฐ ์ค์ฌ ํ๊ฒฝ์์ ๋ค์ํ ์์
์ ์ํํ๋ ค๋ฉด ๋ฏผ์ฒฉํจ๊ณผ ๊ฐ๊ฑดํ ๋ฐธ๋ฐ์ค๋ฅผ ๋์์ ๊ฐ์ถฐ์ผ ํ๋ฉฐ, ์ด๋ ์ค์ฉ์ ์ธ ์์จ ํด๋จธ๋
ธ์ด๋ ์์ฉ์ ํต์ฌ์ด๋ค.
- Approach: ์ด์ง์ ๋ฐ์ดํฐ ์์ค(์ธ๊ฐ MoCap ๋ฐ์ดํฐ์ ๋ฌผ๋ฆฌ์ ์ผ๋ก ์ ์ฝ๋ ํฉ์ฑ ๋ฐธ๋ฐ์ค ๋ชจ์
)๋ฅผ ํ์ฉํ๊ณ , ์ผ๋ฐ ์ถ์ ๋ณด์๊ณผ ๋ฐธ๋ฐ์ค ํนํ ๋ณด์์ผ๋ก ๊ตฌ์ฑ๋ ํ์ด๋ธ๋ฆฌ๋ ๋ณด์ ์คํด, ๊ทธ๋ฆฌ๊ณ ์ ์ํ ํ์ต ์ ๋ต(์ฑ๋ฅ ๊ธฐ๋ฐ ์ํ๋ง ๋ฐ ๋ชจ์
๋ณ ๋ณด์ ํ์ฑ)์ ์ ์ฉํ๋ค.
Achievement
Fig. 1: Introducing AMS (Agility Meets Stability), one single policy that performs diverse motions with stability and ag
- ์ด์ง์ ๋ฐ์ดํฐ ํ์ฉ: ํด๋จผ ๋ชจ์
์บก์ฒ์ ๋ค์์ฑ๊ณผ ํฉ์ฑ ๋ฐธ๋ฐ์ค ๋ฐ์ดํฐ์ ๋ฌผ๋ฆฌ์ ์ ํ์ฑ์ ๊ฒฐํฉํ์ฌ ์ฅ๊ผฌ๋ฆฌ ๋ถํฌ ๋ฌธ์ ํด๊ฒฐ
- ํ์ด๋ธ๋ฆฌ๋ ๋ณด์ ์ฒด๊ณ: ๋ชจ๋ ๋ฐ์ดํฐ์ ์ผ๋ฐ ์ถ์ ๋ชฉํ๋ฅผ ์ ์ฉํ๋ฉด์ ํฉ์ฑ ๋ชจ์
์๋ง ๋ฐธ๋ฐ์ค ํนํ ์ฌ์ ์ง์์ ์ฃผ์
ํ์ฌ ์์ถฉํ๋ ์ต์ ํ ๋ชฉํ ์กฐํ
- ์ ์ํ ํ์ต ์ ๋ต: ์ฑ๋ฅ ๊ธฐ๋ฐ ์ํ๋ง๊ณผ ๋ชจ์
๋ณ ๋ณด์ ํ์ฑ์ผ๋ก ์ด์ง์ ๋ชจ์
๋ถํฌ์ ๊ฑธ์น ํจ์จ์ ํ์ต ์คํ
- ์ค์ ๋ก๋ด ๊ฒ์ฆ: Unitree G1 ํด๋จธ๋
ธ์ด๋์์ ์ถค, ๋ฌ๋ฆฌ๊ธฐ ๋ฑ์ ๋ฏผ์ฒฉํ ๋์๊ณผ Ip Man's Squat ๊ฐ์ ์ ๋ก์ท ๊ทนํ ๋ฐธ๋ฐ์ค ๋์ ๋ชจ๋ ์ฑ๊ณต์ ์ผ๋ก ์คํ
How
Fig. 2: Overview of AMS. (a) The general whole-body tracking pipeline retargets human MoCap data to reference motions
- Teacher-student ๊ธฐ๋ฐ ๊ฐํํ์ต ํ์ดํ๋ผ์ธ์ผ๋ก ์ผ๋ฐ์ ์ธ ์ ์ ์ถ์ (whole-body tracking) ๊ตฌํ
- ํน์ ๋ฐธ๋ฐ์ค ํฌ์ฆ์ CenterOfMass๋ฅผ ์์ฑ๊ธฐ๋ก ์ํ๋งํ์ฌ ๋ฌผ๋ฆฌ์ ์ผ๋ก ์คํ ๊ฐ๋ฅํ ํฉ์ฑ ๋ฐธ๋ฐ์ค ๋ชจ์
๋ฐ์ดํฐ ์์ฑ
- ์ผ๋ฐ ๋ณด์(tracking loss, action regularization)์ ๋ฐธ๋ฐ์ค ํนํ ๋ณด์(COM ์ ์ฝ, support foot ์์ ์ฑ)์ ์กฐ๊ฑด๋ถ๋ก ์ ์ฉํ๋ ํ์ด๋ธ๋ฆฌ๋ ๋ณด์ ํจ์ ์ค๊ณ
- ๊ฐ ๋ชจ์
์ ์ฑ๋ฅ์ ๊ธฐ๋ฐํ์ฌ ์ํ๋ง ํ๋ฅ ๊ณผ ๋ณด์ ํ์ฑ ๊ณ์๋ฅผ ๋์ ์ผ๋ก ์กฐ์ ํ๋ ์ ์ํ ํ์ต ๋ฉ์ปค๋์ฆ ๊ตฌํ
- ์๋ฎฌ๋ ์ด์
์์ ํ์ตํ ์ ์ฑ
์ Sim2Real ์ ์ด๋ฅผ ํตํด ์ค์ ๋ก๋ด์ ์ ์ฉ
Originality
- ์ด์ง์ ๋ฐ์ดํฐ ์์ค(ํด๋จผ MoCap + ํฉ์ฑ ๋ฐธ๋ฐ์ค ๋ฐ์ดํฐ)๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ๊ฒฐํฉํ์ฌ ๋ฏผ์ฒฉ์ฑ๊ณผ ์์ ์ฑ์ ๋์์ ๋ฌ์ฑํ๋ ์ฒซ ๋ฒ์งธ ํตํฉ ํ๋ ์์ํฌ
- ๋ฐธ๋ฐ์ค ํนํ ๋ณด์์ ํฉ์ฑ ๋ฐ์ดํฐ์๋ง ์ ํ์ ์ผ๋ก ์ ์ฉํ์ฌ ์์ถฉํ๋ ์ต์ ํ ๋ชฉํ ๊ฐ์ ๊ฐ๋ฑ ํด๊ฒฐํ๋ ์ฐฝ์์ ํ์ด๋ธ๋ฆฌ๋ ๋ณด์ ์ค๊ณ
- ์ฑ๋ฅ ๊ธฐ๋ฐ ์ ์ํ ์ํ๋ง๊ณผ ๋ชจ์
๋ณ ๋ณด์ ํ์ฑ์ผ๋ก ์ด์ง์ ๋ฐ์ดํฐ ๋ถํฌ์์์ ํจ์จ์ ํ์ต ์คํ
- ์ ๋ก์ท ์ผ๋ฐํ๋ฅผ ํตํด ํ์ต ์ค ๋ณด์ง ๋ชปํ ๊ทนํ ๋ฐธ๋ฐ์ค ๋์(์: Ip Man's Squat) ์ํ ๊ฐ๋ฅ
Limitation & Further Study
- ํฉ์ฑ ๋ฐธ๋ฐ์ค ๋ฐ์ดํฐ ์์ฑ์ ๋ฌผ๋ฆฌ์ ์ ์ฝ์ด ๋ก๋ด์ ์ค์ ๋ฅ๋ ฅ์ ์์ ํ ํฌ๊ดํ์ง ๋ชปํ ๊ฐ๋ฅ์ฑ
- ํ์ด๋ธ๋ฆฌ๋ ๋ณด์ ์คํด์ ๊ฐ์ค์น ์ค์ ๊ณผ ์ ์ํ ํ์ต ํ๋ผ๋ฏธํฐ์ ๋ฏผ๊ฐ๋ ๋ถ์ ๋ถ์กฑ
- ๋จ์ผ ๋ก๋ด(Unitree G1)์์๋ง ๊ฒ์ฆ๋์์ผ๋ฏ๋ก ๋ค์ํ ํด๋จธ๋
ธ์ด๋ ํ๋ซํผ์ ๋ํ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ ๋ฏธํ์ธ
- ์ค์๊ฐ ํ
๋ ์คํผ๋ ์ด์
์ฑ๋ฅ๊ณผ ์์ ์ฑ์ ๋ํ ์์ธํ ์ ๋์ ๋ถ์ ํ์
- ํ์ ์ฐ๊ตฌ: ๋ ๋ณต์กํ ์กฐ์ ์์
(loco-manipulation)์ผ๋ก ํ์ฅ, ์ธ์ด ๋ช
๋ น ๊ธฐ๋ฐ ๊ณ ์์ค ์ ์ด ํตํฉ, ๋ค์ํ ๋ก๋ด ํ๋ซํผ์์์ ์ผ๋ฐํ ๊ฒ์ฆ
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด ์ ์ด์ ์ค๋ซ๋์์ ๊ณผ์ ์ธ ๋ฏผ์ฒฉ์ฑ๊ณผ ์์ ์ฑ์ ํตํฉ์ ์ฒ์์ผ๋ก ์ฒด๊ณ์ ์ผ๋ก ํด๊ฒฐํ๋ฉฐ, ์ด์ง์ ๋ฐ์ดํฐ์ ํ์ด๋ธ๋ฆฌ๋ ๋ณด์ ์ค๊ณ๋ฅผ ํตํ ์ฐฝ์์ ์ ๊ทผ๊ณผ ์ค์ ๋ก๋ด์์์ ๊ฐ๋ ฅํ ์ฑ๊ณผ๋ฅผ ๋ณด์ฌ์ค๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์