Learning Humanoid Locomotion with Perceptive Internal Model
์ ์: Junfeng Long, Junli Ren, Moji Shi, Zirui Wang, Tao Huang, Ping Luo, Jiangmiao Pang | ๋ ์ง: 2024-11-21 | URL: https://arxiv.org/abs/2411.14386 📄 PDF
Essence
Fig. 2: Overview of our framework. Within PIM, we integrate perceptive information into the state predictor to achieve m
์ธ๊ฐํ ๋ก๋ด์ ์์ ์ ์ธ ์ด๋์ ์ํด ์จ๋ณด๋ elevation map์ ๊ธฐ๋ฐ์ผ๋ก ํ Perceptive Internal Model (PIM)์ ์ ์ํ๋ฉฐ, HIM์ ํ์ฅํ์ฌ ์ง๊ฐ ์ ๋ณด๋ฅผ ํตํฉํ ๋จ์ผ ๋จ๊ณ ํ์ต ๋ฐฉ๋ฒ์ ์ ์ํ๋ค.
Motivation
- Known: ์ฌ์กฑ ๋ก๋ด์ '๋ธ๋ผ์ธ๋' ์ ์ฑ
์ผ๋ก ๋ค์ํ ์งํ์ ๋ค๋น๊ฒ์ด์
ํ ์ ์์ง๋ง, ์ธ๊ฐํ ๋ก๋ด์ ๋์ ์์ ๋์ ๋ถ์์ ํ ํํ๋ก ์ธํด ์์ ์ ์ธ ์ด๋์ ์ํด ์ ํํ ์ง๊ฐ์ด ํ์์ ์ด๋ค.
- Gap: ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค์ ๊น์ด ๋งต์ด๋ raw point cloud๋ฅผ ์ง์ ์ธ์ฝ๋ฉํ๊ฑฐ๋ ๋ค์ค ๋จ๊ณ ํ์ต์ ์ฌ์ฉํ๋ฉฐ, ๊ณ๋จ ๊ฐ์ ๋ฏธ์ธํ ๋ฐํ์ด ํ์ํ ์งํ์์ ๋ถ์ถฉ๋ถํ ์ฑ๋ฅ์ ๋ณด์ธ๋ค.
- Why: ์ธ๊ฐํ ๋ก๋ด์ด ๊ณ๋จ ์ฐ์ ๋ฑ๋ฐ, ๊ฐญ ๋๋ ๋์ ํ๋ซํผ ๋ฑ ๋์ ์ ์ธ ์งํ์ ์์ ์ ์ผ๋ก ๋ค๋น๊ฒ์ด์
ํ ์ ์๋๋ก ํ๋ ๊ฒ์ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด ์ ์ด์ ๊ธฐ์ด ์๊ณ ๋ฆฌ์ฆ ๊ฐ๋ฐ์ ์ค์ํ๋ค.
- Approach: LiDAR ๋๋ RGB-D ์นด๋ฉ๋ผ๋ก๋ถํฐ ๊ตฌ์ฑ๋ ๋ก๋ด ์ค์ฌ์ elevation map์ ์ง๊ฐ ์ ๋ณด๋ก ์ฌ์ฉํ์ฌ HIM ๊ธฐ๋ฐ์ ์ ์ฑ
์ ํ์ตํ๊ณ , ์๋ฎฌ๋ ์ด์
์์ ์ง๋ฉด ๋์ด๋ฅผ ์ง์ ์ฟผ๋ฆฌํ์ฌ ๊น์ด ๋งต ๋ ๋๋ง ์์ด ํจ์จ์ ์ผ๋ก ํ์ตํ๋ค.
Achievement
Fig. 1: We propose a perceptive humanoid locomotion policy capable of mastering various challenging terrains. This polic
- ํจ์จ์ ์ธ ํ์ต: RTX 4090 GPU์์ 3์๊ฐ ๋ด ๋จ์ผ ๋จ๊ณ ์ ์ฑ
ํ์ต ์์ฑ ๋ฐ zero-shot ์ค์ ๋ฐฐํฌ ๊ฐ๋ฅ
- ๋์ ์ฑ๊ณต๋ฅ : ๊ณ๋จ ์ฐ์ ๋ฑ๋ฐ ์ 90% ์ด์์ ์ฑ๊ณต๋ฅ , ๊ฐญ, ๊ณ ์ ์ฐจ ํ๋ซํผ ๋ฑ ๋ค์ํ ๋์ ์ ์งํ ๋ค๋น๊ฒ์ด์
- ์ผ์ ๊ฐ๊ฑด์ฑ: ์นด๋ฉ๋ผ ์์ง์๊ณผ ๋
ธ์ด์ฆ์ ๋ ๋ฏผ๊ฐํ elevation map ๊ธฐ๋ฐ ์ ๊ทผ์ผ๋ก ๋ค์ํ ์ผ์ ๊ตฌ์ฑ(LiDAR, RGB-D) ์ง์
- ๋ค์ค ๋ก๋ด ๊ฒ์ฆ: Unitree H1, Fourier GR-1 ๋ฑ ๋ค์ํ ์ธ๊ฐํ ๋ก๋ด์์ ์ ํจ์ฑ ์
์ฆ
How
Fig. 3: Terrian Perception module implemented by a single
- Hybrid Internal Model (HIM)์ ๊ธฐ๋ฐ์ผ๋ก ํ์ฌ batch-level contrastive learning์ ํตํ ์ํ ์์ธก
- ์จ๋ณด๋ elevation map์ ๋ก๋ด ์ค์ฌ์ผ๋ก ์ฐ์ ์
๋ฐ์ดํธํ์ฌ ๋ฐ ์๋ ์งํ์ ๋ช
ํํ ์ธ์
- ์๋ฎฌ๋ ์ด์
์์ ground-truth ์ฅ์ ๋ฌผ ๋์ด ๋งต์ผ๋ก ์ ์ฑ
ํ์ต ํ ์ค์ ํ๊ฒฝ์์ ๊ตฌ์ฑ๋ elevation map์ ๋์ด ์ํ๋ง์ผ๋ก ์ถ๋ก
- PPO๋ฅผ ํ์ฉํ ์ ์ฑ
์ต์ ํ with privileged information (critic์ด ํ์ต ์ค linear velocity ์ ๊ทผ)
- ๋น์ง๊ฐ ์ ๋ณด์ ์ง๊ฐ ์ ๋ณด๋ฅผ ๋ถ๋ฆฌํ์ฌ ๊ด๋ฆฌ: on_t = [ct, ฯt, gt, ฮธt, ฮธฬt, at-1], op_t = [pt]
Originality
- ๊น์ด ๋งต ๋๋ raw point cloud ์ง์ ์ธ์ฝ๋ฉ ๋์ robot-centered elevation map ๊ธฐ๋ฐ์ ์๋ก์ด ์ง๊ฐ ํํ ๋ฐฉ์ ๋์
- HIM์ batch-level contrastive learning์ ์ง๊ฐ ์ ๋ณด์ ํตํฉํ์ฌ ๋จ์ผ ๋จ๊ณ ํ์ต์ผ๋ก ๋ฌ์ฑ (๊ธฐ์กด ๋ค์ค ๋จ๊ณ training paradigm ํํผ)
- ๋ก๋ด odometry๋ฅผ ๊ณ ๋ คํ ๋์ elevation map ์ ์ง๋ก sim2real ๊ฐญ ๊ฐ์ ๋ฐ ๋๋ฉ์ธ ์ ์ ํ์์ฑ ์ํ
- ์๋ฎฌ๋ ์ด์
์์ ๊น์ด ๋ ๋๋ง ๋ถํ์๋ก ์ธํ ๊ณ์ฐ ๋น์ฉ ์ต์ํ์ ํ์ต ์๊ฐ ๋ํญ ๋จ์ถ
Limitation & Further Study
- Elevation map ๊ตฌ์ฑ์ด ์ ํํ ๋ก๋ด odometry์ ์์กดํ๋ฏ๋ก odometry ์ค๋ฅ ๋์ ์ ์ทจ์ฝํ ์ ์์
- LiDAR์ RGB-D ์นด๋ฉ๋ผ ์ธ ๋ค๋ฅธ ์ผ์ ๋ชจ๋ฌ๋ฆฌํฐ์ ๋ํ ๊ฒ์ฆ ๋ถ์กฑ
- ๊ณ๋จ ๋๋น, ๋์ด ๋ฑ์ ๊ทน๋จ์ ํ๊ฒฝ ๋ณํ์ ๋ํ ์ผ๋ฐํ ์ฑ๋ฅ ๋ถ์ ๋ฏธํก
- ํ์ ์ฐ๊ตฌ๋ก ๋ค์ค ์ผ์ fusion, ๋์ ์ฅ์ ๋ฌผ ํ๊ฒฝ ๋์, ๋ณด๋ค ๋ณต์กํ ์ค๋ด ๋ค๋น๊ฒ์ด์
์๋๋ฆฌ์ค ํ์ฅ ํ์
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ elevation map ๊ธฐ๋ฐ ์ง๊ฐ ๋ชจ๋์ HIM๊ณผ ํตํฉํ์ฌ ์ธ๊ฐํ ๋ก๋ด์ ๋ณต์กํ ์งํ ๋ค๋น๊ฒ์ด์
์ ๋จ์ผ ๋จ๊ณ๋ก ํจ์จ์ ์ผ๋ก ํ์ตํ๋ ์ค์ง์ ์ด๊ณ ์ฐ์ํ ๋ฐฉ๋ฒ์ ์ ์ํ๋ฉฐ, ๋ค์ํ ๋ก๋ด๊ณผ ์งํ์์์ ๊ด๋ฒ์ํ ๊ฒ์ฆ์ ํตํด ์ค์ฉ์ฑ์ ์
์ฆํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์