BeamDojo: Learning Agile Humanoid Locomotion on Sparse Footholds
์ ์: Huayi Wang, Zirui Wang, Junli Ren, Qingwei Ben, Tao Huang, Weinan Zhang, Jiangmiao Pang | ๋ ์ง: 2025-02-14 | URL: https://arxiv.org/abs/2502.10363 📄 PDF
Essence
Fig. 1: Our proposed framework, BEAMDOJO, enables agile and robust humanoid locomotion across challenging sparse foothol
BeamDojo๋ ์ํ๋ง ๊ธฐ๋ฐ์ ๋ค๊ฐํ ๋ฐ ๋ณด์ ํจ์์ ์ด์ค critic ์ํคํ
์ฒ๋ฅผ ๊ฒฐํฉํ 2๋จ๊ณ ๊ฐํํ์ต ํ๋ ์์ํฌ๋ก, ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ด ๋๋ค๋๊ณผ ๊ฐ์ ๋๋ฌธ ๋๋ค์ ์ ๊ฐ์ง ๋ณต์กํ ์งํ์์ ๋ฏผ์ฒฉํ๊ณ ์ ๋ฐํ ๋ณดํ์ ํ์ตํ๊ฒ ํ๋ค.
Motivation
- Known: ๊ธฐ์กด ํ์ต ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ ์ ๋ชจ์ ๋ฐ์ ๊ฐ์ ํ๊ฑฐ๋ ๋๋ฌธ ๋ณด์ ์ ํธ๋ก ์ธํด ๋ณต์กํ ์งํ ํ์ต์ ์ด๋ ค์์ ๊ฒช์ผ๋ฉฐ, ์ฌ์กฑ ๋ก๋ด์์๋ ์ฑ๊ณผ๊ฐ ์์์ผ๋ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์๋ ์ ์ฉ์ด ์ ํ์ ์ด๋ค.
- Gap: ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ๋ค๊ฐํ ๋ฐ ๊ธฐํํ์ ์ํ ์ ์ ํ ๋ณด์ ์ค๊ณ ๋ถ์กฑ๊ณผ ๋๋ฌธ ๋๋ค์ ๋ณด์์ผ๋ก ์ธํ ๋นํจ์จ์ ์ธ ํ์ต ๊ณผ์ , ๊ทธ๋ฆฌ๊ณ ์ค์ ์งํ์์์ ์ ๋ขฐํ ์ ์๋ ์ง๊ฐ ์ ๋ณด ํ๋์ ์ด๋ ค์์ด ์๋ค.
- Why: ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ด ์ํํ ์งํ์ ์์ ํ๊ณ ๋ฏผ์ฒฉํ๊ฒ ํต๊ณผํ๋ ๋ฅ๋ ฅ์ ์ค์ ํ๊ฒฝ ํ์, ๊ตฌ์กฐ ํ๋, ์ฐ์
์์ฉ์์ ์ค์ํ๋ฉฐ, ์ด๋ฅผ ์ํด์๋ ์ ๋ฐํ ๋ฐ ๋ฐฐ์น์ ์์ ์ ์ธ ๋ณดํ์ด ํ์์ ์ด๋ค.
- Approach: BeamDojo๋ 2๋จ๊ณ ์ ๊ทผ๋ฒ์ผ๋ก, ์ฒซ ๋ฒ์งธ ๋จ๊ณ์์ ํํํ ์งํ์์ ๊ณผ์ ์งํ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ฉฐ ํ๋ จํ๊ณ , ๋ ๋ฒ์งธ ๋จ๊ณ์์ ์ค์ ๊ณผ์ ์งํ์์ ์ ์ฑ
์ ๋ฏธ์ธ ์กฐ์ ํ๋ฉฐ, LiDAR ๊ธฐ๋ฐ ๊ณ ๋ ๋งต์ ํตํด ์ค์ธ๊ณ ๋ฐฐํฌ๋ฅผ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
Achievement
Fig. 1: Our proposed framework, BEAMDOJO, enables agile and robust humanoid locomotion across challenging sparse foothol
- ์ํ๋ง ๊ธฐ๋ฐ ๋ค๊ฐํ ๋ฐ ๋ณด์: ๋ค๊ฐํ ๋ฐ์ ์์ ์์ญ๊ณผ์ ๊ฒน์นจ์ ํ๊ฐํ๋ ์๋ก์ด ๋ณด์ ํจ์ ์ค๊ณ๋ก ๊ธฐ์กด ์ ๋ฐ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ ํ๊ณ ๊ทน๋ณต
- ์ด์ค critic ์ํคํ
์ฒ: ๋ฐ์ง ๋ณดํ ๋ณด์๊ณผ ๋๋ฌธ ๋๋ค์ ๋ณด์์ ๋ณ๋๋ก ํ์ตํ์ฌ ํ์ต ๊ณผ์ ์์ ํ
- 2๋จ๊ณ RL ํ๋ ์์ํฌ: ์งํ ์ญํ ์ํ๋ฅผ ํตํ ํจ์จ์ ์ธ ํ์์ผ๋ก ์กฐ๊ธฐ ์ข
๋ฃ ๋ฌธ์ ํด๊ฒฐ ๋ฐ ํ๋ณธ ํจ์จ์ฑ ์ฆ๋
- ์ค์ธ๊ณ ๋ฐฐํฌ ์คํ: LiDAR ๊ธฐ๋ฐ elevation map๊ณผ ๋๋ฉ์ธ ๋๋๋ง์ด์ ์ด์
์ผ๋ก 80% ์์ ์ท sim-to-real ์ ์ด ์ฑ๊ณต๋ฅ ๋ฌ์ฑ
- ๊ฐ๊ฑดํ ์ฑ๋ฅ: ์ธ๋ถ ๊ต๋๊ณผ ์ถ๊ฐ ํ์ค ํ์์๋ ๋์ ์ฑ๊ณต๋ฅ ์ ์ง ๋ฐ ๋ฏธํ์ต ์งํ์ ๋ํ ์์ ์ท ์ผ๋ฐํ ๋ฅ๋ ฅ ์
์ฆ
How
Fig. 3: Overview of BEAMDOJO. (a) Training in Simulation: In stage 1, proprioceptive and perceptive information, locomot
- ๋ฐ ์๋์์ n๊ฐ ์ง์ ์ ์ํ๋งํ๊ณ ์์ ์์ญ๊ณผ์ ์ ์ด ์ฌ๋ถ๋ก ๋ค๊ฐํ ๋ฐ์ ๋ฐฐ์น ํ๊ฐ
- PPO ๊ธฐ๋ฐ ๊ฐํํ์ต์์ locomotion reward์ foothold reward๋ฅผ ์ด์ค critic์ผ๋ก ๋ถ๋ฆฌ ํ์ต
- Stage 1: ํํํ ์งํ์์ ๊ณผ์ ์งํ์ ๋ํ ์ง๊ฐ ์ ๋ณด(elevation map)๋ฅผ ์ ๊ณตํ๋ฉด์ ํ๋ จํ๋, ์คํจ ์ ์ํผ์๋ ์ข
๋ฃ ๋์ ํ๋ํฐ๋ง ๋ถ๊ณผ
- Stage 2: Stage 1์ ์ ์ฑ
์ ์ค์ sparse foothold ์งํ์์ ๋ฏธ์ธ ์กฐ์
- Unitree G1 ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ LiDAR ์ผ์๋ฅผ ํ์ฌํ์ฌ ๋ก๋ด ์ค์ฌ์ elevation map ๊ตฌ์ฑ
- ์๋ฎฌ๋ ์ด์
์์ LiDAR ๋
ธ์ด์ฆ, ์นด๋ฉ๋ผ ๊ฐ๋, ์งํ ๋ณํ ๋ฑ์ ๋ํ ๋๋ฉ์ธ ๋๋๋ง์ด์ ์ด์
์ ์ฉ
Originality
- ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ๋ค๊ฐํ ๋ฐ ๊ธฐํํ์ ๋ช
์์ ์ผ๋ก ๊ณ ๋ คํ ์ต์ด์ end-to-end RL ๊ธฐ๋ฐ sparse foothold ๋ณดํ ํ๋ ์์ํฌ
- ์งํ ์ญํ ์ํ๋ฅผ ํตํ ์๋ก์ด 2๋จ๊ณ ํ๋ จ ํจ๋ฌ๋ค์์ผ๋ก ํ๋ณธ ํจ์จ์ฑ ๊ทน๋ํ
- ์ด์ค critic ๊ตฌ์กฐ๋ก ์๋ก ๋ค๋ฅธ ํน์ฑ์ ๋ณด์ ์ ํธ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํตํฉ
- LiDAR ๊ธฐ๋ฐ elevation map์ผ๋ก depth camera์ ์์ผ๊ฐ ์ ํ์ ๊ทน๋ณตํ๊ณ ์ ํ ์์ง์ ๋ชจ๋ ๊ฐ๋ฅํ๊ฒ ํจ
Limitation & Further Study
- ์๋ฎฌ๋ ์ด์
-์ค์ ํ๊ฒฝ ๊ฐ์ ์๋ฒฝํ ์ผ์น๊ฐ ์์ง ๋ถ๋ถ์ ์ผ๋ก ์กด์ฌํ์ฌ, ๋ ๋ค์ํ ์ค์ ์งํ์์์ ์ผ๋ฐํ ์ฑ๋ฅ ๊ฒ์ฆ ํ์
- 2๋จ๊ณ ํ๋ จ ํ๋ ์์ํฌ์ ์ฒซ ๋ฒ์งธ ๋จ๊ณ์์ ๊ณผ์ ์งํ ์ ๋ณด๋ฅผ ์๋ฒฝํ๊ฒ ์๋ฎฌ๋ ์ด์
ํ๊ธฐ ์ด๋ ค์ธ ์ ์์ผ๋ฉฐ, ์ด๋ ํน์ ๋ณต์กํ ์งํ์์ ์ฑ๋ฅ ์ ํ ๊ฐ๋ฅ์ฑ
- LiDAR ๊ธฐ๋ฐ elevation map์ ๊ณ์ฐ ๋น์ฉ๊ณผ ๋ก๋ด ํ์ฌ ์์คํ
์ ๋ณต์ก์ฑ ์ฆ๊ฐ๋ก ์ธํ ์ค์๊ฐ ์ฑ๋ฅ ์ ์ฝ ๊ณ ๋ ค ํ์
- ๋ ๋์ ์๋์ ๋ฏผ์ฒฉํ ๋ณดํ, ๋ ๊ทน๋จ์ ์ธ ์ธ๋ถ ๊ต๋, ๋ ๋ค์ํ ์งํ ์ ํ(์: ๋ถ๊ท์นํ ์๋ฒฝ)์ ๋ํ ํ์ฅ ์ฑ๋ฅ ํ๊ฐ ์ํ ํ์
- ๋ค๋ฅธ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด ํ๋ซํผ์ผ๋ก์ ์ ์ด ๊ฐ๋ฅ์ฑ๊ณผ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ๋ํ ์ถ๊ฐ ์ฐ๊ตฌ ํ์
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: BeamDojo๋ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ๋ค๊ฐํ ๋ฐ ๊ธฐํํ์ ๋ช
์์ ์ผ๋ก ์ฒ๋ฆฌํ๊ณ 2๋จ๊ณ ํ๋ จ์ผ๋ก ํ๋ณธ ํจ์จ์ฑ์ ๋์ธ ํ์ ์ ์ธ ํ๋ ์์ํฌ๋ก, ์๋ฎฌ๋ ์ด์
๊ณผ ์ค์ ๋ก๋ด ์คํ์ ํตํด sparse foothold์์์ ๋ฏผ์ฒฉํ ๋ณดํ ๋ฅ๋ ฅ์ ์
์ฆํ์ฌ ๋ก๋ด ๋ณดํ ์ ์ด ๋ถ์ผ์ ์ค์ํ ๊ธฐ์ฌ๋ฅผ ํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์