Deep Whole-body Parkour
์ ์: Ziwen Zhuang, Shaoting Zhu, Mengjie Zhao, Hang Zhao | ๋ ์ง: 2026-01-12 | DOI: 10.48550/arXiv.2601.07701 📄 PDF
Essence
Fig. 2: Data-driven whole-body control framework. Real-world environment scans and human demonstrations are processed an
์ด ๋
ผ๋ฌธ์ exteroceptive perception์ whole-body motion tracking์ ํตํฉํ์ฌ humanoid robot์ด ๋ณต์กํ ์งํ์์ vault, dive-rolling ๋ฑ์ ๋ค์ค ์ ์ด parkour ๊ธฐ์ ์ ์ํํ๋๋ก ํ๋ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. ๊ธฐ์กด์ locomotion-centric ์ ๊ทผ๊ณผ environment-agnostic ๋์ ์ถ์ ์ ๊ฒฐํฉํ์ฌ ์ง๊ฐ ๊ธฐ๋ฐ์ ์ผ๋ฐ์ ๋์ ์ ์ด๋ฅผ ์คํํ๋ค.
Motivation
- Known: Deep reinforcement learning์ด ๋ค๋ฆฌ ๋ก๋ด ์ ์ด์์ ๋์ ์ฑ๊ณผ๋ฅผ ๋ณด์์ผ๋, ๊ธฐ์กด perceptive locomotion์ ๋ฐ ๊ธฐ๋ฐ ๋ณดํ๋ง ๊ฐ๋ฅํ๊ณ general motion tracking์ ํ๊ฒฝ์ ๋ฌด์ํ๋ ํ๊ณ๊ฐ ์๋ค. DeepMimic๊ณผ AMP๋ ๋ณต์กํ ๋์ ์ถ์ ์ ์ฑ๊ณตํ์ผ๋ ํ๊ฒฝ ์ธ์ ๋ฅ๋ ฅ์ด ๋ถ์กฑํ๋ค.
- Gap: ๊ธฐ์กด ์ฐ๊ตฌ๋ค์ ์งํ ์ธ์ ๋ฅ๋ ฅ๊ณผ ๋ณต์กํ ์ ์ ๋์ ์ํ ๋ฅ๋ ฅ์ ๋์์ ๋ฌ์ฑํ์ง ๋ชปํ๋ค. Perceptive locomotion์ ์๋ ๋ช
๋ น์ผ๋ก ์ ํ๋์ด vault์ ๊ฐ์ ๋ณต์กํ ์ํธ์์ฉ ๋ชจ๋๋ฅผ ๊ตฌ๋ถํ ์ ์๊ณ , motion tracking์ ํ๋ฉด ํ๊ฒฝ์ ๊ฐ์ ํ์ฌ ๋ถ๊ท์นํ ์งํ์ ์ ์ํ์ง ๋ชปํ๋ค.
- Why: humanoid robot์ด ์ธ๊ฐ ์์ค์ ์ด๋์ฑ์ ๋ฌ์ฑํ๋ ค๋ฉด ๋ฐ ์ ์ด๋ฟ๋ง ์๋๋ผ ์ ๋ฑ ์ ์ ์ ํ์ฉํ ๋ค์ค ์ ์ด ์ํธ์์ฉ์ด ํ์์ด๋ฉฐ, ๋์์ ํ๊ฒฝ ๊ธฐํํ์ ๋ํ ์ค์๊ฐ ์ ์์ด ํ์ํ๊ธฐ ๋๋ฌธ์ ์ค์ํ๋ค.
- Approach: ๊ดํ ๋ชจ์
์บก์ฒ์ LiDAR ๊ธฐ๋ฐ 3D ์ค์บ์ผ๋ก ์ธ๊ฐ parkour ๋์๊ณผ ํ๊ฒฝ ๊ธฐํํ์ ๋์์ ์์งํ๊ณ , GMR ํ๋ ์์ํฌ๋ก Unitree G1 humanoid์ ์ฌํ๊ฒํ
ํ๋ค. ์ค์บ๋ ๋ฉ์๋ฅผ ์ฒ๋ฆฌํ์ฌ canonical obstacle ์์ฐ์ ์์ฑํ๊ณ , NVIDIA Isaac Lab์์ ๋๊ท๋ชจ ๋ณ๋ ฌ ํ์ต ํ๊ฒฝ์ ๊ตฌ์ถํ๋ค. ์ปค์คํ
GPU ๊ธฐ๋ฐ ray-caster๋ฅผ ๊ตฌํํ์ฌ ๋ณ๋ ฌ ํ๊ฒฝ์์ depth ์ผ์ฑ์ ํจ์จ์ ์ผ๋ก ์ฒ๋ฆฌํ๋ค.
Achievement
Fig. 1: Deep Whole-Body Parkour. Our framework enables a humanoid robot to autonomously traverse challenging obstacles
์ ํํ ๋ค์ค ์ ์ด parkour ์ํ: Vault, dive-rolling, jumping์ ๋ถ๊ท์นํ ์งํ์์ ๊ฒฌ๊ณ ํ๊ฒ ์คํํ๋ฉฐ, ๋จ์ผ ์ ์ฑ
์ผ๋ก ์ฌ๋ฌ ๊ตฌ๋ณ๋๋ ๋์์ ๋ค์ํ ์งํ ํน์ฑ์ ๊ฑธ์ณ ์ํํ๋ค. ์ด๊ธฐ ์กฐ๊ฑด์ ๋ํ ๊ฐ๊ฑด์ฑ: ์๊ฐ ํผ๋๋ฐฑ์ ํตํด ๋ก๋ด์ด ํ๋ซํผ๊น์ง์ ๊ฑฐ๋ฆฌ๋ ๊ฐ๋ ๋ณํ์ ์๋์ผ๋ก ์ ์ํ์ฌ ์ ํํ ๋ฐ๊ณผ ์ ์ ์ด์ ๋ณด์ฅํ๋ค. traversability ํ์ฅ: ๋จ์ ๋ณดํ์ด๋ ๋ฌ๋ฆฌ๊ธฐ๋ฅผ ํฌ๊ฒ ๋์ด์๋ ๋ฅ๋ ฅ์ ์์ฐํ๋ค. ๊ธฐ์ ๊ธฐ์ฌ: Mesh instancing๊ณผ collision grouping์ ํ์ฉํ ์ต์ ํ๋ ray-caster ๊ตฌํ์ผ๋ก ๊ณ ์ฒ๋ฆฌ๋์ depth ์๋ฎฌ๋ ์ด์
๊ฐ๋ฅํ๊ฒ ํ๋ค.
How
Fig. 2: Data-driven whole-body control framework. Real-world environment scans and human demonstrations are processed an
- ์ค์ ํ๊ฒฝ ์ค์บ๊ณผ ์ธ๊ฐ ์์ฐ์ ์์งํ๊ณ ์ ๋ ฌํ์ฌ ์คํ ๊ฐ๋ฅํ ๋์-์งํ ์ ์์ฑ
- Motion capture ๋ฐ์ดํฐ์ LiDAR ์ค์บ์ ๋์์ ์์งํ์ฌ ๊ณต๊ฐ์ ์ ๋ ฌ ๋ณด์ฅ
- GMR ๊ธฐ๋ฐ ์ต์ ํ kinematic filtering์ผ๋ก robot morphology์ ๋ง๊ฒ ์ฌํ๊ฒํ
- Procedural environment generation์ผ๋ก ํน์ capture ํ๊ฒฝ์ ๊ณผ์ ํฉ๋์ง ์๋๋ก ์ผ๋ฐํ
- ๋๊ท๋ชจ reinforcement learning์ผ๋ก exteroceptive observations๋ฅผ ํฌํจํ ์ ์ฑ
ํ๋ จ
- GPU ๋ณ๋ ฌํ๋ ray-casting์ผ๋ก ์์ฒ ๊ฐ ์๋ฎฌ๋ ์ด์
ํ๊ฒฝ์์ ํจ์จ์ depth ๋ ๋๋ง
Originality
- Perceptive locomotion๊ณผ general motion tracking ํจ๋ฌ๋ค์์ ์ต์ด ํตํฉ์ผ๋ก whole-body awareness์ environment adaptability๋ฅผ ๋์์ ๋ฌ์ฑ
- Motion capture์ ํ๊ฒฝ ๊ธฐํํ์ ์๊ฒฉํ๊ฒ ๊ฒฐํฉํ๋ custom dataset curation ๋ฐฉ์์ ํ์
- Mesh instancing๊ณผ collision grouping์ ํ์ฉํ ๊ณ ๋๋ก ์ต์ ํ๋ parallel ray-caster์ ์ ๊ท ๊ตฌํ
- Closed-loop visual feedback์ ํตํ fragile trajectory tracking์ robust spatial-aware control๋ก์ ๋ณํ
Limitation & Further Study
๋ฐ์ดํฐ ์์ง์ ์ ํ์ฑ: ๋ชจ์
์บก์ฒ์ LiDAR ์ค์บ ํ๋ก์ธ์ค๊ฐ ์๋ ์์
๊ณผ ์ค์๊ฐ ๋๊ธฐํ๋ฅผ ์๊ตฌํ์ฌ ๊ท๋ชจ ํ์ฅ์ด ์ด๋ ต๊ณ , ํน์ ์ ํ์ parkour ๋์๋ง ์์ง ๊ฐ๋ฅํ๋ค.
Sim-to-real gap: ์๋ฎฌ๋ ์ด์
๋ depth ๋ ๋๋ง๊ณผ ์ค์ ์ผ์์ ๋
ธ์ด์ฆ ํน์ฑ ๋ถ์ผ์น๋ก ์ธํ ๋๋ฉ์ธ ๊ฐญ ์กด์ฌ.
ํ๊ฒฝ ๋ณต์ก์ฑ: ์ ์ฐจ์ ํ๊ฒฝ ์์ฑ์ด isolated obstacle geometries์ ์ค์ ์ ๋์ด ๋ณตํฉ์ ์ธ multi-obstacle ํ๊ฒฝ์ด๋ ๋์ ์ฅ์ ๋ฌผ์ ๋ํ ์ฑ๋ฅ ๋ฏธํก.
ํ์ ์ฐ๊ตฌ: ๋ ๋ค์ํ humanoid morphologies๋ก์ ํ์ฅ, ๋์ ํ๊ฒฝ ์ฒ๋ฆฌ, ํ์ต ํจ์จ์ฑ ๊ฐ์ ์ด ํ์ํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ์ด ๋
ผ๋ฌธ์ humanoid robot ์ ์ด์ ๋ ์ฃผ์ ํจ๋ฌ๋ค์์ ์ฐฝ์์ ์ผ๋ก ํตํฉํ์ฌ ์งํ ์ธ์ ๋ฅ๋ ฅ๊ณผ ๋ณต์กํ ์ ์ ๋์์ ๋์์ ๋ฌ์ฑํ๋ ์ค์ง์ ์ธ ์๋ฃจ์
์ ์ ์ํ๋ค. ์ปค์คํ
dataset curation, ์ต์ ํ๋ parallel simulation, ๊ฒฌ๊ณ ํ ํ๋ฃจํ ์ ์ด ํตํฉ์ ํตํด vault์ dive-rolling ๊ฐ์ ๊ณ ๋๋ก ๋์ ์ธ parkour ๊ธฐ์ ์ ์ค์ humanoid์์ ๊ตฌํํ๋ค๋ ์ ์์ ์์๊ฐ ํฌ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์