Track Any Motions under Any Disturbances
์ ์: Zhikai Zhang, Jun Guo, Chao Chen, Jilong Wang, Chenghuai Lin, Yunrui Lian, Han Xue, Zhenrong Wang, Maoqi Liu, Jiangran Lyu, Huaping Liu, He Wang, Li Yi | ๋ ์ง: 2025-09-30 | DOI: 10.48550/arXiv.2509.13833 📄 PDF
Essence
Fig. 1: (a) The humanoid tracks diverse, highly dynamic, and contact-rich motions using a single policy. (b) The humanoi
Any2Track๋ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ด ๋ค์ํ ๋์์ ์ถ์ ํ๋ฉด์ ๋์์ ์งํ, ์ธ๋ ฅ, ๋ฌผ๋ฆฌ์ ์ฑ์ง ๋ณํ ๋ฑ ์ค์ ํ๊ฒฝ ๊ต๋์ ์ ์ํ ์ ์๋๋ก ํ๋ ๋ ๋จ๊ณ ๊ฐํํ์ต ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค.
Motivation
- Known: ๊ธฐ์กด ํด๋จธ๋
ธ์ด๋ ๋ชจ์
์ถ์ ๋ฐฉ๋ฒ๋ค(GMT, ASAP ๋ฑ)์ ๋ค์ํ ๋์์ ์ถ์ ํ ์ ์์ง๋ง, ์ค์ ํ๊ฒฝ์ ๊ต๋์ ๋ํ ์ ์ ๋ฅ๋ ฅ์ด ๋ถ์กฑํ๊ฑฐ๋ ์ ํ์ ์ด๋ค. Domain randomization์ ํตํ ๋จ์ํ ๊ฐํ์ฑ์ ๋์ ๋ณํ์ ๋ํ ์ ๊ทน์ ๋์์ด ๋ถ๊ฐ๋ฅํ๋ค.
- Gap: ํตํฉ๋ ๋จ์ผ ์ ์ฑ
์ผ๋ก ๋ค์ํ๊ณ ๋์ ์ด๋ฉฐ ์ ์ด์ด ๋ง์ ๋์์ ์ถ์ ํ๋ฉด์ ๋์์ ์จ๋ผ์ธ ๋์ญํ ์ ์์ ํตํด ์ค์ ํ๊ฒฝ์ ์ฌ๋ฌ ๊ต๋(์งํ, ์ธ๋ ฅ, ๋ฌผ๋ฆฌ์ ํน์ฑ ๋ณํ)์ ๋์ํ ์ ์๋ ๋ฐฉ๋ฒ์ด ๋ถ์ฌํ๋ค.
- Why: ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ์ค์ ์ด์ฉ์ ์ํด์๋ ๋จ์ํ ๋์ ์ฌํ์ ๋์ด ์์ธก ๋ถ๊ฐ๋ฅํ ํ๊ฒฝ ๋ณํ์ ๊ฐ๊ฑดํ๊ฒ ๋์ํด์ผ ํ๋ฉฐ, ์ด๋ฅผ ํตํด ์ผ๋ฐ์ ์ธ ์ค์ฉ์ฑ์ ๊ฐ์ถ ๊ธฐ์ด ๋ชจ์
์ถ์ ์์คํ
์ ๊ตฌ์ถํ ์ ์๋ค.
- Approach: Any2Track์ ๋์ญํ ์ ์์ฑ์ ๊ธฐ๋ณธ ํ๋ ์คํ ์์ ์ถ๊ฐ ๋ฅ๋ ฅ์ผ๋ก ์ฌ์ ์ํ๋ฉฐ, ์ฒซ ๋ฒ์งธ ๋จ๊ณ์์ AnyTracker๋ก ์ผ๋ฐ์ ์ธ ๋ชจ์
์ถ์ ๋ฅ๋ ฅ์ ํ๋ณดํ๊ณ , ๋ ๋ฒ์งธ ๋จ๊ณ์์ AnyAdapter๋ฅผ ํตํด history ์ ๋ณด ๊ธฐ๋ฐ์ ์จ๋ผ์ธ ์ ์์ ์ํํ๋ค.
Achievement
Fig. 1: (a) The humanoid tracks diverse, highly dynamic, and contact-rich motions using a single policy. (b) The humanoi
- ํตํฉ ๋ชจ์
์ถ์ ์ ์ฑ
: ์ ๊ทํ๋ ํ๋ ๊ณต๊ฐ๊ณผ specialist-to-generalist ์ ๋ต์ ํตํด LAFAN1๊ณผ AMASS ๋ฐ์ดํฐ์
์ ๋ค์ํ ๋์์ ๋จ์ผ ์ ์ฑ
์ผ๋ก ์ถ์ ๊ฐ๋ฅ
- ์จ๋ผ์ธ ๋์ญํ ์ ์: Dynamics-aware world model prediction์ ๋ณด์กฐ ์์
์ผ๋ก ์ฌ์ฉํ์ฌ history ๋ฒํผ์์ ์ถ์ถํ ๋์ญํ ์๋ฒ ๋ฉ์ ํตํด ์ค์๊ฐ ํ๊ฒฝ ์ ์
- ๋ค์ค ๊ต๋ ๋์: ์งํ, ์ธ๋ ฅ(๋กํ ๋น๊น, ์ฌ๋์ ๋ฐ๊ธฐ), ๋ฌผ๋ฆฌ์ ์ฑ์ง ๋ณํ(๋ฐฐ ์์ ํ์ค) ๋ฑ ์ฌ๋ฌ ๊ต๋์ ๋์์ ๋์
- Sim2real ์ฑ๊ณต: Unitree G1 ํ๋์จ์ด์ zero-shot ์ ์ด๋ก ์ฑ๊ณต์ ์ผ๋ก ๋ฐฐํฌ๋์ด ์ค์ ํ๊ฒฝ์์ ์ฐ์ํ ์ฑ๋ฅ ๋ฌ์ฑ
How
Fig. 2: Overview of our method. Any2Track consists of two key components: AnyTracker and AnyAdapter. AnyTracker
- AnyTracker ์ค๊ณ: ๋ณต์กํ ํ๋ ๊ณต๊ฐ์ผ๋ก ์ธํ ์ต์ ํ ์ด๋ ค์์ ํด๊ฒฐํ๊ธฐ ์ํด canonicalized action space ๋์
๋ฐ specialist-to-generalist ํ์ต ์ ๋ต ์ ์ฉ
- Adapter ์ํคํ
์ฒ: ๊ธฐ๋ณธ ์ถ์ ๊ธฐ์ ํ๋ผ๋ฏธํฐ ์ง์ ๋ฏธ์ธ์กฐ์ ๋์ adapter๋ฅผ ์ถ๊ฐํ์ฌ ๋์ญํ ์๋ฒ ๋ฉ์ ์
๋ ฅ์ผ๋ก ๋ฐ์ ํ๋์ ์ ์์ ์ผ๋ก ์กฐ์
- History ๊ธฐ๋ฐ ๋์ญํ ์ธ์: ์ต๊ทผ ์ํ ์ด๋ ฅ์ ๋์ญํ ์๋ฒ ๋ฉ์ผ๋ก ์ธ์ฝ๋ฉํ๊ณ dynamics-aware world model prediction์ ๋๋ฆฌ ์์
์ผ๋ก ํ์ต
- Two-stage ๋ถ๋ฆฌ ํ์ต: ๋์ญํ ๊ต๋์ด ์๋ ์ํ์์ AnyTracker ํ์ต, ์ดํ ๋์ญํ ๋ณํ๋ฅผ ๋์
ํ์ฌ AnyAdapter ํ์ต์ผ๋ก ์ถ์ ์ฑ๋ฅ ์ ํ ๋ฐฉ์ง
Originality
- ๋์ญํ ์ ์์ฑ์ ์ถ๊ฐ ๋ฅ๋ ฅ์ผ๋ก ๋ช
์์ ์ผ๋ก ์ฌ์ ์ํ๊ณ ๋ ๋จ๊ณ ํ์ต์ผ๋ก ๋ถ๋ฆฌํ๋ ์ค๊ณ ์ฒ ํ์ ํ์
- Dynamics-aware world model prediction์ ๋ณด์กฐ ์์
์ผ๋ก ํ์ฉํ์ฌ ๊ธฐ์กด ์จ๋ผ์ธ ์ ์ ๋ฐฉ๋ฒ(RMA, DWL)๋ณด๋ค ๋ ์ ๋ณด์ฑ ๋์ ๋์ญํ ํํ ํ์ต
- Adapter ์ํคํ
์ฒ๋ฅผ ํตํด ๊ธฐ๋ณธ ์ ์ฑ
์ ๋์ ์ถ์ ๋ฅ๋ ฅ์ ๋ณด์กดํ๋ฉด์ ๋์ญํ ์ ์์ฑ์ ์ถ๊ฐํ๋ ๋ฐฉ์
- ์งํ, ์ธ๋ ฅ, ๋ฌผ๋ฆฌ์ ์ฑ์ง ๋ณํ ๋ฑ ์ฌ๋ฌ ์ ํ์ ๊ต๋์ ๋์์ ๋์ํ ์ ์๋ ํตํฉ๋ ์ ์ ๋ฉ์ปค๋์ฆ
Limitation & Further Study
- Unitree G1 ํ๋ซํผ์์๋ง ๊ฒ์ฆ๋์์ผ๋ฉฐ ๋ค๋ฅธ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด ํ๋ซํผ์ผ๋ก์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ด ๋ช
ํํ์ง ์์
- History ๊ธธ์ด์ adapter ์ํคํ
์ฒ์ ์ค๊ณ ์ ํ์ด ๊ฒฝํ์ ๊ธฐ๋ฐ์ธ ๊ฒ์ผ๋ก ๋ณด์ด๋ฉฐ, ์ด๋ค์ด ์ฑ๋ฅ์ ๋ฏธ์น๋ ์ํฅ์ ๋ํ ์ฒด๊ณ์ ๋ถ์ ํ์
- Sim2real ์ ์ด ์ฑ๊ณต์ ์ฃผ์ ๊ธฐ์ฌ ์์ธ(domain randomization ์์ค, ์๋ฎฌ๋ ์ด์
ํ๊ฒฝ ๊ตฌ์ฑ, ๋์ญํ ํ๋ผ๋ฏธํฐ ๋ฒ์ ๋ฑ)์ ๋ํ ์์ธํ ๋ถ์ ๋ถ์ฌ
- ํ์ ์ฐ๊ตฌ: (1) ๋ ๋ค์ํ ํด๋จธ๋
ธ์ด๋ ํ๋ซํผ์ผ๋ก์ ์ผ๋ฐํ, (2) ์ ์ ๋ชจ๋์ ์จ๋ผ์ธ ํ์ต ์๋ ๊ฐ์ , (3) ๋ณด์กฐ ์์
์ ์ต์ ์ฑ ๋ถ์, (4) ์์ธก ๋ถ๊ฐ๋ฅํ ์๋ก์ด ๊ต๋ ์ ํ์ ๋ํ ๋์ ๋ฅ๋ ฅ ๊ฐํ
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: Any2Track๋ ๋์ญํ ์ ์์ฑ์ ๋ช
์์ ์ผ๋ก ์ฌ์ ์ํ๊ณ ์ด๋ฅผ ๊ธฐ๋ณธ ์ถ์ ๋ฅ๋ ฅ๊ณผ ๋ถ๋ฆฌํ์ฌ ํ์ตํ๋ ํ์ ์ ์ ๊ทผ์ ์ ์ํ๋ฉฐ, Unitree G1์์ zero-shot sim2real ์ ์ด๋ฅผ ๋ฌ์ฑํ์ฌ ์ค์ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ์ค์ฉํ์ ์ค์ํ ๊ธฐ์ฌ๋ฅผ ํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์