Track Any Motions under Any Disturbances
์ ์: Zhikai Zhang, Jun Guo, Chao Chen, Jilong Wang, Chenghuai Lin, Yunrui Lian, Han Xue, Zhenrong Wang, Maoqi Liu, Jiangran Lyu, Huaping Liu, He Wang, Li Yi | ๋ ์ง: 2025-09-30 | DOI: 10.48550/arXiv.2509.13833 📄 PDF
Essence
Fig. 1: (a) The humanoid tracks diverse, highly dynamic, and contact-rich motions using a single policy. (b) The humanoi
์ด ๋
ผ๋ฌธ์ humanoid ๋ก๋ด์ด ๋ค์ํ๊ณ ๋์ ์ด๋ฉฐ ์ ์ด์ด ๋ง์ ๋์์ ์ถ์ ํ๋ฉด์ ๋์์ ์งํ, ์ธ๋ ฅ, ๋ฌผ๋ฆฌ์ ์์ฑ ๋ณํ ๋ฑ์ ์ค์ธ๊ณ ๊ต๋์ ๊ฐ๊ฑดํ๊ฒ ์ ์ํ ์ ์๋๋ก ํ๋ Any2Track์ ์ ์ํ๋ค. AnyTracker์ AnyAdapter ๋ ๊ฐ์ง ์ฃผ์ ์ปดํฌ๋ํธ๋ก ๊ตฌ์ฑ๋ 2๋จ๊ณ RL ํ๋ ์์ํฌ๋ฅผ ํตํด ๋จ์ผ ์ ์ฑ
์ผ๋ก ๋ค์ํ ๋์์ ์ถ์ ํ๋ฉด์๋ ์จ๋ผ์ธ ๋์ญํ ์ ์์ฑ์ ๋ฌ์ฑํ๋ค.
Motivation
- Known: ๊ธฐ์กด humanoid motion tracking์ ์ฃผ๋ก ํน์ ๋์์ ๋ํด์๋ง ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ด๊ฑฐ๋(ASAP), ์ ํ๋ ๋์ ๋ค์์ฑ์ ์ถ์ ํ๋ฉฐ(GMT), ์ค์ ํ๊ฒฝ์ ๊ต๋(terrain, external force, physical property change)์ ๋ํ ์ ์์ฑ์ด ๋ถ์กฑํ๋ค. Motion tracking๊ณผ online dynamics adaptation์ ๋์์ ๋ฌ์ฑํ ํตํฉ์ ์ธ ์ ๊ทผ ๋ฐฉ์์ด ๋ถ์ฌํ๋ค.
- Gap: ๊ธฐ์กด ์ฐ๊ตฌ๋ค์ (1) ๋ณต์กํ ํ๋ ๊ณต๊ฐ์ผ๋ก ์ธํ ์ต์ ํ ์ด๋ ค์์ผ๋ก ์ธํด ๋ค์ํ ๋์ ์ถ์ ์ ์คํจํ๊ฑฐ๋ (2) naive domain randomization์๋ง ์์กดํ์ฌ ์ค์ ํ๊ฒฝ์ ๊ต๋์ ๋์ํ์ง ๋ชปํ๋ค. ํนํ motion diversity, high dynamism, contact-richness ๋ฐ multiple real-world disturbances์ ๋ชจ๋ ๋์ํ๋ ํตํฉ ์ถ์ ๊ธฐ๊ฐ ๋ถ์กฑํ๋ค.
- Why: Humanoid ๋ก๋ด์ ์ค์ ํ์ฉ์ ์ํด์๋ ๋จ์ํ ํน์ ๋์์ ์ ํํ ์ถ์ ํ๋ ๊ฒ์ ๋์ด, ์ค์ธ๊ณ์ ์์ธก ๋ถ๊ฐ๋ฅํ ๊ต๋ ์์์๋ ์ ์์ ์ผ๋ก ๋ค์ํ ๋์์ ์ถ์ ํ ์ ์๋ ๋ฅ๋ ฅ์ด ํ์์ ์ด๋ค. ์ด๋ ๋ก๋ด์ ๋ฒ์ฉ์ฑ๊ณผ ๊ฒฌ๊ณ ์ฑ์ ๊ฒฐ์ ์ง๋ ํต์ฌ ๊ณผ์ ์ด๋ค.
- Approach: 2๋จ๊ณ RL ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. ์ฒซ ๋ฒ์งธ ๋จ๊ณ์์ AnyTracker๋ canonicalized action spaces์ specialist-to-generalist ์ ๋ต์ผ๋ก ๋ณต์กํ ํ๋ ๊ณต๊ฐ์ ์ต์ ํ ์ด๋ ค์์ ์ํํ์ฌ ๋ค์ํ ๋์์ ๋จ์ผ ์ ์ฑ
์ผ๋ก ์ถ์ ํ๋ค. ๋ ๋ฒ์งธ ๋จ๊ณ์์ AnyAdapter๋ dynamics-aware world model prediction์ ํตํด ๋์ญํ ํน์ฑ์ embedding์ผ๋ก ์ถ์ถํ๊ณ , adapter ์ํคํ
์ฒ๋ฅผ ์ฌ์ฉํ์ฌ ๊ธฐ๋ณธ ์ถ์ ๊ธฐ๋ฅผ freezeํ ์ํ์์ ๋์ญํ ๋ณํ์ ๋์ํ๋ ํ๋ ์กฐ์ ์ ํ์ตํ๋ค.
Achievement
Fig. 1: (a) The humanoid tracks diverse, highly dynamic, and contact-rich motions using a single policy. (b) The humanoi
Any2Track ํ๋ ์์ํฌ: ๋ค์์ฑ, ๊ณ ์ญ๋์ฑ, ์ ์ด ํ๋ถํจ์ ๋ชจ๋ ๋ง์กฑํ๋ motion tracking ๋ฅ๋ ฅ. ์ค์ธ๊ณ ๊ต๋ ์ ์: Terrain, external force, physical property change์ ๋ชจ๋ ๋์ํ๋ฉฐ zero-shot sim2real transfer ๋ฌ์ฑ. Unitree G1 ํ๋์จ์ด ๋ฐฐํฌ: ์ค์ humanoid ๋ก๋ด์์ ๊ด๋ฒ์ํ ๋์์ ์ถ์ ํ๊ณ ๊ต๋์ ๊ฐ๊ฑดํ๊ฒ ์๋ํ๋ ์ฑ๋ฅ ์ค์ฆ. ๊ธฐ์กด ๋ฐฉ๋ฒ ๋๋น ์ฐ์์ฑ: Table I์์ GMT ๋ฑ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค๊ณผ ๋ฌ๋ฆฌ motion diversity์ disturbance adaptability๋ฅผ ๋ชจ๋ ๋ฌ์ฑํ ์ต์ด์ ์ฌ๋ก.
How
Fig. 2: Overview of our method. Any2Track consists of two key components: AnyTracker and AnyAdapter. AnyTracker
- Canonicalized action space๋ฅผ ์ค๊ณํ์ฌ ๋ณต์กํ ์์ ๋์ ๋์ ๋ค์์ฑ์ผ๋ก ์ธํ ์ต์ ํ ๋ฌธ์ ์ํ
- Specialist-to-generalist ์ ๋ต์ผ๋ก ํน์ ๋์์์ ์ผ๋ฐํ๋ ์ ์ฑ
์ผ๋ก ๋จ๊ณ์ ์ ์ด
- Dynamics-aware world model prediction ๋ณด์กฐ ๊ณผ์ ๋ก ๋์ญํ ํน์ง ํ์ต
- Adapter ์ํคํ
์ฒ๋ก ๊ธฐ์กด ์ถ์ ๋ฅ๋ ฅ์ ๋ณด์กดํ๋ฉด์ ๋์ญํ ์ ์์ฑ๋ง ์ถ๊ฐ
- ๊ธฐ๋ณธ ์ถ์ ๊ธฐ์ ๋งค๊ฐ๋ณ์๋ freezeํ์ฌ ํ์ต๋ ๋์ ์ถ์ ๊ธฐ์ ์์ ๋ฐฉ์ง
Originality
- Motion tracking๊ณผ online dynamics adaptation์ ํตํฉํ๋ ์๋ก์ด 2๋จ๊ณ RL ํ๋ ์์ํฌ ์ ์
- Canonicalized action space์ specialist-to-generalist ์ ๋ต์ผ๋ก ๋ณต์กํ ํ๋ ๊ณต๊ฐ ๋ฌธ์ ํด๊ฒฐ
- Dynamics-aware world model prediction์ adapter ํ์ต์ ๋ณด์กฐ ๊ณผ์ ๋ก ํ์ฉํ๋ ํ์ ์ ์ค๊ณ
- Adapter ์ํคํ
์ฒ๋ฅผ ์ฌ์ฉํ์ฌ ๊ธฐ์กด ๋ฅ๋ ฅ ๋ณด์กด๊ณผ ์๋ก์ด ์ ์์ฑ์ ๋์์ ๋ฌ์ฑ
Limitation & Further Study
ํ์ฌ ์ฐ๊ตฌ๋ Unitree G1 ๋ก๋ด์๋ง ๋ฐฐํฌ๋์ด ๋ค๋ฅธ humanoid ํ๋ซํผ์ผ๋ก์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ด ๋ฏธ์ง์. ์ค์ธ๊ณ ์คํ์ด ๋๋ถ๋ถ ์ ํ๋ ํ๊ฒฝ์์ ์ํ๋์์ผ๋ฉฐ, ๊ทน๋จ์ ์ธ ๊ต๋์ด๋ ์์ธก ๋ถ๊ฐ๋ฅํ ์ค์ ํ๊ฒฝ์์์ ์ฑ๋ฅ์ ๋ฏธ๊ฒ์ฆ. ์ ์ ๋ชจ๋์ ๊ณ์ฐ ๋ณต์ก๋์ ์ค์๊ฐ ์ถ๋ก ์๋์ ๋ํ ๋ถ์ ๋ถ์กฑ. ํฅํ ๋ ๋ง์ humanoid ํ๋ซํผ์์์ ๊ฒ์ฆ๊ณผ ๊ณ์ฐ ํจ์จ์ฑ ๊ฐ์ ์ด ํ์.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 5/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ humanoid motion tracking์ ์ค๋ ๊ณผ์ ์ธ ๋ค์ํ ๋์ ์ถ์ ๊ณผ ์ค์ธ๊ณ ๊ต๋ ์ ์์ ๋์์ ํด๊ฒฐํ๋ ํฌ๊ด์ ์ธ ์๋ฃจ์
์ ์ ์ํ๋ค. 2๋จ๊ณ RL ํ๋ ์์ํฌ์ ์ค๊ณ๊ฐ ์ฒด๊ณ์ ์ด๋ฉฐ, ์ค์ ํ๋์จ์ด ๋ฐฐํฌ๋ฅผ ํตํ ์ฑ๋ฅ ์
์ฆ์ด ์ค๋๋ ฅ ์๋ค. ๋ค๋ง ๋จ์ผ ํ๋ซํผ์๋ง์ ํ๊ฐ์ ๊ณ์ฐ ํจ์จ์ฑ ๋ถ์ ๋ถ์ฌ๊ฐ ํ๊ณ์ด์ง๋ง, ์ด ๋ถ์ผ์ ์๋นํ ๊ธฐ์ฌ๋ฅผ ํ๋ ์ฐ์ํ ์ฐ๊ตฌ๋ก ํ๊ฐ๋๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์