LiPS: Large-Scale Humanoid Robot Reinforcement Learning with Parallel-Series Structures
์ ์: Qiang Zhang, Gang Han, Jingkai Sun, Wen Zhao, Jiahang Cao, Jiaxu Wang, Hao Cheng, Lingfeng Zhang, Yijie Guo, Renjing Xu | ๋ ์ง: 2025-03-11 | URL: https://arxiv.org/abs/2503.08349 📄 PDF
Essence
Fig. 4: Illustration of LiPS Simulation Training and Real-World Deployment Process.
LiPS๋ GPU ๊ธฐ๋ฐ ๋ณ๋ ฌ ํ๋ จ ํ๊ฒฝ์์ URDF ํ์์ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ์ํ ๊ฐํํ์ต ๋ฐฉ๋ฒ์ผ๋ก, ๋ฉํฐ-๋ฆฌ์ง๋๋ฐ๋ ํ๋ฃจํ ๋์ญํ ๋ชจ๋ธ๋ง์ ํตํด ์๋ฎฌ๋ ์ด์
-ํ์ค ๊ฐ ๊ฒฉ์ฐจ๋ฅผ ์ค์ธ๋ค.
Motivation
- Known: IsaacGym ๋ฑ GPU ๊ธฐ๋ฐ ์๋ฎฌ๋ ์ดํฐ๊ฐ ๋๊ท๋ชจ ๋ณ๋ ฌ ๊ฐํํ์ต ํ๋ จ์ ๊ฐ๋ฅํ๊ฒ ํ๋ฉฐ, ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ๋ณต์กํ ์ง๋ ฌ-๋ณ๋ ฌ ๋ฉ์ปค๋์ฆ์ ํฌํจํ๋ค. ํ์ฌ ๋๋ถ๋ถ์ ๋ฐฉ๋ฒ์ ํ๋ จ ์ค ๊ฐ๋ฃจํ ํ ํด๋ก์ง๋ฅผ ์ฌ์ฉํ๊ณ sim2real ๋จ๊ณ์์ ์ง๋ ฌ-๋ณ๋ ฌ ๊ตฌ์กฐ๋ก ๋ณํํ๋ค.
- Gap: ํ์ฌ GPU ๊ธฐ๋ฐ ๋ฌผ๋ฆฌ ์์ง๋ค์ ํ๋ฃจํ ํ ํด๋ก์ง๋ ๋ณต์กํ ๋ฉํฐ-๋ฆฌ์ง๋๋ฐ๋ ๊ตฌ์กฐ ์๋ฎฌ๋ ์ด์
๋ฅ๋ ฅ์ด ์ ํ๋์ด ์์ผ๋ฉฐ, URDF ํ์์ ๋ณ๋ ฌ ๊ตฌ์กฐ์ ๋์ ํน์ฑ์ ์ ํํ ํํํ์ง ๋ชปํ๋ค.
- Why: ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ๋ณต์กํ ๋์ญํ์ ํ๋ จ ๋จ๊ณ์์ ์ ํํ ์๋ฎฌ๋ ์ด์
ํ ์ ์์ผ๋ฉด ํ๋ จ ํจ์จ์ ๋์ด๊ณ sim2real ๊ฒฉ์ฐจ๋ฅผ ์ค์ฌ ์ค์ ๋ฐฐํฌ ์ ์ฑ๋ฅ์ ํฅ์์ํฌ ์ ์๋ค.
- Approach: LiPS๋ URDF ๊ธฐ๋ฐ ์๋ฎฌ๋ ์ด์
ํ๊ฒฝ์์ ๋ฉํฐ-๋ฆฌ์ง๋๋ฐ๋ ํ๋ฃจํ ๋์ญํ ๋ชจ๋ธ๋ง์ ์ต์ ํํ์ฌ ํ๋ จ ์ค๋ถํฐ ๋ณ๋ ฌ ๊ตฌ์กฐ๋ฅผ ์ ํํ ํํํ๊ณ , ์ด๋ฅผ ํตํด sim2real ๋ณํ ๋์ด๋๋ฅผ ๊ฐ์์ํจ๋ค.
Achievement
Fig. 4: Illustration of LiPS Simulation Training and Real-World Deployment Process.
- ๋๊ท๋ชจ ๋ณ๋ ฌ ํ๋ จ ์ง์: URDF ๊ธฐ๋ฐ ๋ณต์กํ ๋ก๋ด์ GPU ๋ณ๋ ฌ ๊ฐํํ์ต ํ๋ จ์ ํจ๊ณผ์ ์ผ๋ก ์ง์ํ๋ ๋๊ตฌ ์ ๊ณต
- sim2real ๊ฒฉ์ฐจ ๊ฐ์: ํ๋ จ ๋จ๊ณ์์ ๋์ญํ์ ์ ํํ ๋ชจ๋ธ๋งํ์ฌ ํ์ค ๋ฐฐํฌ ์ ์ฑ๋ฅ ์ ํ ์ต์ํ
- ํ๋ จ ๋ฐ ์ถ๋ก ํจ์จ ํฅ์: ๋ณต์กํ ๋์ ๊ฑฐ๋์ ์๋ฎฌ๋ ์ด์
ํ์ฌ ์ค์ ๋ก๋ด ๋ฐฐํฌ ์ ๊ณ์ฐ ๋ถํ์ ์ค๋ฅ ๊ฐ์
- ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ: URDF ๊ธฐ๋ฐ ๋ค์ํ ๋ก๋ด์ ์ฝ๊ฒ ์ ์ฉ ๊ฐ๋ฅํ ๋ฒ์ฉ ๋ฐฉ๋ฒ๋ก ์ ์
How
Fig. 3: Schematic Diagram of Ankle Dynamics Modeling
- URDF ๋ชจ๋ธ ํ์ผ ํ์์ ๊ธฐํํ์ ํน์ฑ์ ๋์ ํน์ฑ์ ์ถ๊ฐ๋ก ๋ชจ๋ธ๋ง
- ๋ฉํฐ-๋ฆฌ์ง๋๋ฐ๋ ํ๋ฃจํ ๋์ญํ์ GPU ๊ธฐ๋ฐ IsaacGym ํ๊ฒฝ์ ํตํฉ
- ํ๋ จ ์ค ๋ณ๋ ฌ-์ง๋ ฌ ๊ตฌ์กฐ๋ฅผ ์ง์ ์๋ฎฌ๋ ์ด์
ํ์ฌ ๊ฐ๋ฃจํ ํ ํด๋ก์ง ๋์ ์ฌ์ฉ
- ๋ฐ๋ชฉ ๋ฉ์ปค๋์ฆ ๋ฑ ๋ณต์กํ ๋ณ๋ ฌ ๊ตฌ์กฐ์ ๋์ญํ์ ์ ํํ ๋ชจ๋ธ๋ง (Fig. 3 ์ฐธ์กฐ)
- ์๋ฎฌ๋ ์ด์
ํ๋ จ ์ ์ฑ
์ ์ค์ ๋ก๋ด์ ์ง์ ๋ฐฐํฌ ๊ฐ๋ฅํ๋๋ก ์ค๊ณ
Originality
- GPU ๊ธฐ๋ฐ ๋๊ท๋ชจ ๋ณ๋ ฌ ํ๋ จ ํ๊ฒฝ์์ ํ๋ฃจํ ๋ฉํฐ-๋ฆฌ์ง๋๋ฐ๋ ๋์ญํ์ ์ฒ์์ผ๋ก ํจ๊ณผ์ ์ผ๋ก ๋ชจ๋ธ๋ง
- ๊ธฐ์กด ๊ฐ๋ฃจํ ํ๋ จ ํจ๋ฌ๋ค์์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ณ ํ๋ จ ๋จ๊ณ์์ ์ค์ ๋ก๋ด ๊ตฌ์กฐ๋ฅผ ๋ฐ์ํ๋ ์๋ก์ด ์ ๊ทผ
- URDF ํ์์ ์ ์ฝ์ ์ ์งํ๋ฉด์ ๋์ ํน์ฑ์ ์ถ๊ฐํ๋ ์ฐฝ์์ ์ธ ์๋ฃจ์
- sim2real ๋ณํ์ ๋์ด๋๋ฅผ ๊ทผ๋ณธ์ ์ผ๋ก ํด๊ฒฐํ๋ ํ์ ์ ๋ฐฉ๋ฒ๋ก
Limitation & Further Study
- ํ์ฌ๊น์ง IsaacGym ๊ธฐ๋ฐ ๊ตฌํ๋ง ์ ์๋์์ผ๋ฉฐ, ๋ค๋ฅธ GPU ๋ฌผ๋ฆฌ ์์ง(PyBullet ๋ฑ)์ผ๋ก์ ํ์ฅ ๊ฒ์ฆ ๋ถ์กฑ
- URDF ํ์ ์์ฒด์ ํํ ๋ฅ๋ ฅ ํ๊ณ๋ก ์ธํ ๊ทน๋๋ก ๋ณต์กํ ๋ณ๋ ฌ ๊ตฌ์กฐ์์์ ์ ํ๋ ๋ฏธ๊ฒ์ฆ
- IsaacLab ๋ฑ ์ ๊ท ์๋ฎฌ๋ ์ด์
ํ๋ซํผ์ผ๋ก์ ์ ์ฉ ๊ฐ๋ฅ์ฑ ๋ฏธ์ ์
- ๋ค์ํ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด ์ค๊ณ(Tesla Optimus, Boston Dynamics ๋ฑ)์ ๋ํ ๊ด๋ฒ์ํ ์ค์ฆ ๋ฐ์ดํฐ ๋ถ์กฑ
- ํ์ ์ฐ๊ตฌ: ์ค์ ํ๋์จ์ด ๋ฐฐํฌ ์ ์ฑ๋ฅ ๊ฒ์ฆ, ๋ค์ํ ๋ณ๋ ฌ ๋ฉ์ปค๋์ฆ ์ค๊ณ์ ๋ํ ์ผ๋ฐํ ์ฐ๊ตฌ, ๊ณ์ฐ ๋น์ฉ ์ต์ ํ ๋ฐฉ์ ๊ฐ๋ฐ
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: LiPS๋ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ GPU ๋ณ๋ ฌ ๊ฐํํ์ต์์ sim2real ๊ฒฉ์ฐจ๋ฅผ ํฌ๊ฒ ์ค์ด๋ ์ค์ง์ ์ด๊ณ ์ค์ฉ์ ์ธ ๋ฐฉ๋ฒ์ผ๋ก, URDF ๊ธฐ๋ฐ ๋ณต์กํ ๋ก๋ด ์ ์ด ์ฐ๊ตฌ์ ์ค์ํ ๊ธฐ์ฌ๋ฅผ ํ๋ค. ๋ค๋ง ๊ด๋ฒ์ํ ์ค์ ๋ก๋ด ๊ฒ์ฆ๊ณผ ๋ค์ํ ์๋ฎฌ๋ ์ด์
ํ๋ซํผ์ผ๋ก์ ํ์ฅ ์ฐ๊ตฌ๊ฐ ํ์ํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์