Omni-Perception: Omnidirectional Collision Avoidance for Legged Locomotion in Dynamic Environments
์ ์: Zifan Wang, Teli Ma, Yufei Jia, Xun Yang, Jiaming Zhou, Wenlong Ouyang, Qiang Zhang, Junwei Liang | ๋ ์ง: 2025-05-25 | URL: https://arxiv.org/abs/2505.19214 📄 PDF
Essence
Figure 1: Validation scenarios for the Omni-Perception framework. Effective omnidirectional collision avoid-
๋ณธ ๋
ผ๋ฌธ์ LiDAR ํฌ์ธํธ ํด๋ผ์ฐ๋๋ฅผ ์ง์ ์ฒ๋ฆฌํ๋ end-to-end ๊ฐํํ์ต ์ ์ฑ
Omni-Perception์ ์ ์ํ์ฌ ๋์ ํ๊ฒฝ์์ ๋ค๋ฆฌ ๋ก๋ด์ ์ ๋ฐฉํฅ ์ถฉ๋ ํํผ๋ฅผ ์คํํ๋ค. PD-RiskNet์ด๋ผ๋ ์๋ก์ด ์ง๊ฐ ๋ชจ๋์ ํตํด ์๊ณต๊ฐ์ LiDAR ๋ฐ์ดํฐ๋ฅผ ํด์ํ์ฌ ํ๊ฒฝ ์ํ์ ํ๊ฐํ๋ค.
Motivation
- Known: ๊ธฐ์กด depth ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ ์กฐ๋ช
๋ณํ, ์ผ์ ๋
ธ์ด์ฆ, elevation map ๊ฐ์ ์ค๊ฐ ํํ์ ๊ณ์ฐ ์ค๋ฒํค๋๋ก ์ธํด ํ๊ณ๊ฐ ์์ผ๋ฉฐ, LiDAR์ ์์จ์ฃผํ๊ณผ ์กฐ์ ๋ถ์ผ์์ ํ์ฉ๋์์ผ๋ end-to-end ๋ค๋ฆฌ ๋ก๋ด ์ ์ด์์ ์ง์ ์ ์ฉ์ ๋ฏธํกํ๋ค.
- Gap: LiDAR์ ํ๋ถํ 3D ์ ๋ณด๋ฅผ raw point cloud ํํ๋ก ์ง์ ํ์ฉํ end-to-end ํ์ต ๊ธฐ๋ฐ ๋ค๋ฆฌ ๋ก๋ด ์ ์ด ํ๋ ์์ํฌ๊ฐ ๋ถ์ฌํ๋ฉฐ, ์ค์๊ฐ ํฌ์ธํธ ํด๋ผ์ฐ๋ ์ฒ๋ฆฌ์ ์ ํํ LiDAR ๋ฌผ๋ฆฌ ๋ชจ๋ธ๋ง ์ด๋ ค์์ด ์กด์ฌํ๋ค.
- Why: ๋ค๋ฆฌ ๋ก๋ด์ด ๋ณต์กํ 3D ํ๊ฒฝ(๊ณต์ค ์ฅ์ ๋ฌผ, ๋ถ๊ท์นํ ์งํ, ๋์ ์์ด์ ํธ)์์ ๋ฏผ์ฒฉํ๊ฒ ์์ง์ด๋ฉฐ ์์ ํ๊ฒ ์ถฉ๋์ ํํผํ๋ ค๋ฉด ๊ฐ๊ฑดํ ๊ณต๊ฐ ์ธ์๊ณผ ์ค์๊ฐ ๋ฐ์ ์ ์ด๊ฐ ํ์์ ์ด๋ค.
- Approach: Raw LiDAR ํฌ์ธํธ ํด๋ผ์ฐ๋๋ฅผ ์ง์ ์ฒ๋ฆฌํ๋ PD-RiskNet์ ํตํฉํ RL ๊ธฐ๋ฐ end-to-end ์ ์ฑ
์ ํ์ตํ๋ฉฐ, ํ์ค์ ์ธ ๋
ธ์ด์ฆ ๋ชจ๋ธ๋ง๊ณผ ๋น ๋ฅธ raycasting์ ๊ฐ์ถ cross-platform LiDAR ์๋ฎฌ๋ ์ด์
ํดํท์ ๊ฐ๋ฐํ์ฌ sim-to-real ์ ์ด๋ฅผ ์ฉ์ดํ๊ฒ ํ๋ค.
Achievement
Figure 5: Robot obstacle avoidance performance
- End-to-End LiDAR ๊ธฐ๋ฐ ์ ์ด: ๋ค๋ฆฌ ๋ก๋ด์ด raw LiDAR ํฌ์ธํธ ํด๋ผ์ฐ๋๋ฅผ ์ง์ ์ฒ๋ฆฌํ์ฌ 3D ๊ณต๊ฐ ์ธ์๊ณผ ์ ๋ฐฉํฅ ์ถฉ๋ ํํผ๋ฅผ ์คํํ๋ ์ฒซ ๋ฒ์งธ ํ๋ ์์ํฌ
- PD-RiskNet ์ง๊ฐ ์ํคํ
์ฒ: ์๊ณต๊ฐ์ LiDAR ๋ฐ์ดํฐ๋ฅผ ํจ์จ์ ์ผ๋ก ์ฒ๋ฆฌํ์ฌ ๋ค์ธต ํ๊ฒฝ ์ํ๋๋ฅผ ํ๊ฐํ๋ ์๋ก์ด ์ ๊ฒฝ๋ง ๊ตฌ์กฐ ์ ์
- ๊ณ ์ถฉ์ค๋ LiDAR ์๋ฎฌ๋ ์ด์
ํดํท: ํ์ค์ ๋
ธ์ด์ฆ ๋ชจ๋ธ๊ณผ ๋น ๋ฅธ ๋ณ๋ ฌ raycasting์ ์ง์ํ๋ฉฐ Isaac Gym, Genesis, MuJoCo ๋ฑ ๋ค์ค ๋ฌผ๋ฆฌ ์์ง๊ณผ ํธํ
- ๊ฐ๊ฑดํ ์ค์ ํ๊ฒฝ ๊ฒ์ฆ: ์ ์ /๋์ 3D ์ฅ์ ๋ฌผ์ด ์๋ ๋ณต์กํ ํ๊ฒฝ์์ ์ฐ์ํ ์๋ ์ถ์ ๊ณผ ์ ๋ฐฉํฅ ํํผ ์ฑ๋ฅ์ ์๋ฎฌ๋ ์ด์
๊ณผ ์ค์ ์คํ์ผ๋ก ์
์ฆ
How
Figure 2: Proposed System Framework. (a) Visualization of differing sensor coverage: the typically narrow,
- ๊ด์ฐฐ ๊ณต๊ฐ O๋ฅผ proprioceptive state(๊ด์ ์์น/์๋, ๋ฒ ์ด์ค ์๋, ๊ธฐ์ธ๊ธฐ), exteroceptive state(raw 3D point cloud ํ์คํ ๋ฆฌ Nhist), ์์
๋ช
๋ น(์๋ ์ปค๋งจ๋)์ผ๋ก ๊ตฌ์ฑ
- RL ์ ์ฑ
ฯ: O โ ฮ(A)๋ฅผ ํ์ตํ์ฌ ๊ด์ฐฐ์ ํ๋ ๋ถํฌ๋ก ๋งคํ
- PD-RiskNet์ ํต์ฌ ์ง๊ฐ ๋ชจ๋๋ก ์ฌ์ฉํ์ฌ spatio-temporal LiDAR ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฐ multi-level ํ๊ฒฝ ์ํ ํ๊ฐ
- ๊ณ ์ถฉ์ค๋ ์๋ฎฌ๋ ์ดํฐ์์ ํ์ค์ LiDAR ๋
ธ์ด์ฆ ๋ชจ๋ธ๋ง๊ณผ ํจ์จ์ raycasting ๊ตฌํ์ผ๋ก ๋น ๋ฅธ ํ์ต ๊ฐ๋ฅ
- ํ์ต๋ ์ ์ฑ
์ ์ค์ ๋ก๋ด(Unitree G1 ๋ฑ)์ ์ง์ ๋ฐฐํฌํ์ฌ sim-to-real ์ ์ด ๋ฌ์ฑ
Originality
- Raw LiDAR point cloud๋ฅผ ์ง์ end-to-end RL ์ ์ฑ
์ ํตํฉํ ์ฒซ ์ฌ๋ก๋ก, ๊ธฐ์กด elevation map ๊ฐ์ ์ค๊ฐ ํํ์ ์์กดํ์ง ์์
- PD-RiskNet์ Proximal-Distal ๊ณ์ธต์ ๊ตฌ์กฐ๋ ๊ทผ์ /์๊ฑฐ๋ฆฌ ์ฅ์ ๋ฌผ์ ์ฐจ๋ณํํ์ฌ ์ฒ๋ฆฌํ๋ ์๋ก์ด ์ํ ํ๊ฐ ๋ฐฉ์
- Isaac Gym, Genesis, MuJoCo๋ฅผ ๋ชจ๋ ์ง์ํ๋ cross-platform LiDAR ์๋ฎฌ๋ ์ด์
ํดํท์ผ๋ก ์ํ๊ณ ํธํ์ฑ ํ๋
- ์ ์ , ๋์ , ๊ณต์ค, ํฌ๋ช
, ๊ฐ๋๊ธฐ ๋ฑ ๋ค์ํ ์ฅ์ ๋ฌผ ์ ํ์ ๋ํ ์ ๋ฐฉํฅ ํํผ ๋ฅ๋ ฅ ํตํฉ ์
์ฆ
Limitation & Further Study
- ๋
ผ๋ฌธ์์ PD-RiskNet์ ๋ด๋ถ ์ํคํ
์ฒ ์์ธ(๊ณ์ธต ์, ์ฑ๋ ์, attention ๋ฉ์ปค๋์ฆ ๋ฑ)๊ฐ ๋ถ๋ถ์ ์ผ๋ก๋ง ๊ณต๊ฐ๋จ
- ์ค์ ํ๊ฒฝ ์คํ์ด ์ ํ์ (์ฃผ๋ก ์ค๋ด/ํต์ ๋ ํ๊ฒฝ)์ด๋ฉฐ, ๊ทน๋จ์ ๊ธฐํ ์กฐ๊ฑด์ด๋ ๋งค์ฐ ๋ณต์กํ ์ผ์ธ ํ๊ฒฝ์์์ ์ฑ๋ฅ ๋ฏธ๊ฒ์ฆ
- LiDAR ๋
ธ์ด์ฆ ๋ชจ๋ธ์ด ํน์ ์ผ์(์: Livox Mid360 ๋ฑ)์ ์ต์ ํ๋์์ ๊ฐ๋ฅ์ฑ์ผ๋ก ๋ค๋ฅธ LiDAR ์ผ์๋ก์ ์ผ๋ฐํ ์ ๋ ๋ฏธ๋ช
ํ
- ๊ณ์ฐ ๋น์ฉ ๋ถ์(inference ์๊ฐ, ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋) ๋ฐ ์ค์๊ฐ์ฑ ๊ฒ์ฆ ๋ถ์กฑ
- ํ์ ์ฐ๊ตฌ: ์ด๊ณ ์ ์ฅ์ ๋ฌผ ํํผ, ๋ฉํฐ ๋ก๋ด ํ๋ ฅ ์๋๋ฆฌ์ค, ๊ทน๋จ์ ํ๊ฒฝ ์ ์์ฑ ๊ฐํ ํ์
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ๋ค๋ฆฌ ๋ก๋ด์ ๋์ ํ๊ฒฝ ๋ค๋น๊ฒ์ด์
์ LiDAR์ ์ง์ ํ์ฉํ end-to-end ํ์ต ํ๋ ์์ํฌ๋ผ๋ ์ฐธ์ ํ ์ ๊ทผ์ ์ ์ํ๋ฉฐ, ์ค์ฉ์ ์ธ ์๋ฎฌ๋ ์ด์
ํดํท๊ณผ ํจ๊ป ๊ฐ๊ฑดํ sim-to-real ์ ์ด๋ฅผ ์
์ฆํ๋ค. ๋ค๋ง ๊ธฐ์ ์์ธ ๊ณต๊ฐ ์์ค๊ณผ ๊ทน๋จ ํ๊ฒฝ ๊ฒ์ฆ ๋ณด๊ฐ์ด ํ์ํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์