Load-Aware Locomotion Control for Humanoid Robots in Industrial Transportation Tasks
์ ์: Lequn Fu, Yijun Zhong, Xiao Li, Yibin Liu, Zhiyuan Xu, Jian Tang, Shiqi Li | ๋ ์ง: 2026-03-15 | URL: https://arxiv.org/abs/2603.14308 📄 PDF
Essence
Fig. 1. Overview of the proposed load-aware humanoid loco-manipulation framework. Upper-body manipulation is generated b
์ฐ์
์ฉ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ๋ค์ํ ํ์ค ์กฐ๊ฑด์์ ์์ ์ ๋ณดํ์ ์ํด ๋ถ๋ฆฌ-ํ์กฐ ๊ตฌ์กฐ์ ๋ก์ฝ-๋งค๋ํฐ๋ ์ด์
์ํคํ
์ฒ๋ฅผ ์ ์ํ๋ฉฐ, RL ๊ธฐ๋ฐ ํ์ฒด ์ ์ด์ ์ํ ์ถ์ ๊ธฐ๋ฅผ ํตํด ์๋ฎฌ๋ ์ด์
ํ์ต ํ ์ค์ ๋ก๋ด์ ํ์ธํ๋ ์์ด ๋ฐฐํฌ ์ฑ๊ณต.
Motivation
- Known: ๊ธฐ์กด ๋ชจ๋ธ ๊ธฐ๋ฐ ์ ์ด๋ ํ์ค ๋ณํ์ ๋ฏผ๊ฐํ๊ณ ํ๋์ด ์ด๋ ต๊ณ , RL ๊ธฐ๋ฐ ์ ๊ทผ์ ์ ์ฐํ์ง๋ง ๊ธฐ์กด ๋ก์ฝ-๋งค๋ํฐ๋ ์ด์
์ฐ๊ตฌ๋ ์ํ์ฒด ๋์ ๊ฒฐํฉ์ ๋ช
์์ ์ผ๋ก ๋ชจ๋ธ๋งํ๊ฑฐ๋ ํ์ค ๋ณํ์ ์ ์ํ๋ ๋ฉ์ปค๋์ฆ์ด ๋ถ์กฑํ๋ค.
- Gap: ๊ธฐ์กด ๋ถ๋ฆฌ ์ ์ด๋ ํ์ค์ด ๋ง๋จ ์ดํํฐ์์ ์ด๋ํ๋ ์ฐ์
์์
์ ํน์ฑ์ ๊ฐ๊ณผํ๊ณ , ๊ธฐ์กด ์ ์ฒด์ ์ฒด RL์ ์ํ์ฒด ๊ฒฐํฉ๊ณผ ๋ถ๋ถ ๊ด์ธก ๋ฌธ์ ๋ฅผ ๊ตฌ์กฐํ๋ ๋ฐฉ์์ผ๋ก ๋ค๋ฃจ์ง ์๋๋ค.
- Why: ์ฐ์
ํ๊ฒฝ์์ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ์์จ์ ๋ฐ์ค ์ด๋ฐ ์์
์ ๋ฏธ์ง ํ์ค๊ณผ ์๊ฐ ๋ณํ ์์ฒด ๋์์ ๋ํ ์ ์์ด ํ์์ด๋ฉฐ, ๋ฌดํ๋ ์ค์ ๋ฐฐํฌ๋ ํ์ค์ ๊ฐ์น๊ฐ ๋๋ค.
- Approach: RL ์ ์ฑ
์ด ์ด๋ํ ๊ธฐ๋ฐ ์ฐธ์กฐ ๊ถค์ ์ ๋ํ ์์ฐจ ์กฐ์ธํธ ์ก์
์ ์์ฑํ๋๋ก ํ๊ณ , ํ์คํ ๋ฆฌ ๊ธฐ๋ฐ ์ํ ์ถ์ ๊ธฐ๊ฐ ๊ธฐ์ ์๋ยท๋์ด์ ํ์ค-๋งค๋ํฐ๋ ์ด์
์ธ๋์ ํ์ตํ๋ ๊ตฌ์กฐ๋ก ์ค๊ณํ์ฌ ๋ถ๋ถ ๊ด์ธก์ฑ์ ํด๊ฒฐ.
Achievement
Fig. 3. Training convergence comparison of different offset and refer-
- ๋ถ๋ถ ๊ด์ธก์ฑ ์ฒ๋ฆฌ: ํ์คํ ๋ฆฌ ๊ธฐ๋ฐ ์ํ ์ถ์ ๊ธฐ๊ฐ ๊ธฐ์ ์ ํ ์๋, ๊ธฐ์ ๋์ด, 32์ฐจ์ ์ ์ฌ ํน์ฑ์ ํตํด ํ์คยท์กฐ์ ์ธ๋์ ์ฝคํฉํธํ๊ฒ ์ธ์ฝ๋ฉ
- ํ์ต ํจ์จ ๊ฐ์ : ๋์ด ์กฐ๊ฑดํ ์กฐ์ธํธ๊ณต๊ฐ ์คํ์
๊ณผ ์ด๋ํ ์ฐธ์กฐ๋ก ๊ตฌ์กฐํ๋ ์์ฐจ RL์ ๊ตฌํํ์ฌ ์๋ ด ์๋ ๋ฐ ์ ์ด ํ์ง ํฅ์
- ๋์ด ์กฐ์ ์ฑ๋ฅ: ๋ค์ํ ํ์ค ์กฐ๊ฑด์์ ๊ธฐ์ ๋์ด ์ถ์ ์ ์ ํํ ์ํ
- ๋ฌดํ๋ ์ค๋ฐฐํฌ: ์์ ์๋ฎฌ๋ ์ด์
ํ์ต์ผ๋ก ์ ์ฌ์ด์ฆ ํด๋จธ๋
ธ์ด๋์ ํ์ธํ๋ ์์ด ๋ฐฐํฌ ์ฑ๊ณต
How
Fig. 2. Multi-box detection and target 6D pose estimation. Blue boxes
- ๋ถ๋ ๊ธฐ์ ๋์ญํ ๋ชจ๋ธ์์ ์์ฒด๋ IK ๊ธฐ๋ฐ ๋งค๋ํฐ๋ ์ด์
๋ชจ๋์ด ์ ์ด, ํ์ฒด๋ RL ์ ์ฑ
์ด 12๊ฐ ์กฐ์ธํธ ์ ์ด
- ๊ด์ธก ๊ณต๊ฐ: ์์ ์
๋ ฅ, ํฌ์ ์ค๋ ฅ(gravity), ๊ฐ์๋, 27๊ฐ ์กฐ์ธํธ ์์น/์๋, ๋ช
๋ น, ์ด์ ์ก์
, ์ถ์ ๊ธฐ์ ์๋/๋์ด, 32์ฐจ์ ์ ์ฌ ํน์ฑ ํฌํจ
- ์ด๋ํ ๊ธฐ๋ฐ ์ฐธ์กฐ ๊ถค์ : ๋ช
๋ น ์๋์ ๊ธฐ์ ๋์ด ์กฐ๊ฑด์ผ๋ก ์์ฑ๋๋ ๋ช
๋ชฉ ๊ตฌ์ฑ(nominal configuration)์ RL์ ์์ฐจ ์ก์
์ถ๊ฐ
- ์ํ ์ถ์ ๊ธฐ: ํ์คํ ๋ฆฌ ๋ฒํผ๋ฅผ ํตํด ๋ถ๋ถ ๊ด์ธก POMDP์ ์๋ ์ํ ๋ณต์
- ๋ณด์ ํจ์: ์์ ๋ณดํ, ๊ฒฌ๊ณ ํ ๊ท ํ, ๋์ด ์ถ์ , ์ก์
์ ๊ทํ ํญ ํฌํจ
- ๋๋ฉ์ธ ๋๋๋ง์ด์ ์ด์
: ํ์ค ์ง๋, ์์น, ๋ง์ฐฐ, ์๋ฎฌ๋ ์ดํฐ ํ๋ผ๋ฏธํฐ ๋ณ๋
Originality
- ๋ถ๋ฆฌ-ํ์กฐ ๊ตฌ์กฐ์์ ์์ฒด ๋งค๋ํฐ๋ ์ด์
๊ด์ธก์ ํ์ฒด ์ ์ฑ
์ ๋ช
์์ ์ผ๋ก ํฌํจํ์ฌ ๋์ ๊ฒฐํฉ์ ์ฒ๋ฆฌํ๋ ์๋ก์ด ์ ๊ทผ
- ๋์ด ์กฐ๊ฑดํ ์คํ์
๊ธฐ๋ฐ ๊ตฌ์กฐํ๋ ์์ฐจ RL๋ก ๊ธฐ์กด์ ๊ฒฝ์ง๋ ๋์ด ์ถ์ ์ ์ ์ฐํ
- ํ์ค ๋ฐ ์กฐ์ ์ธ๋์ ์ฝคํฉํธํ ์ ์ฌ ํํ์ผ๋ก ์ธ์ฝ๋ฉํ๋ ์ํ ์ถ์ ์คํด
- ์ ์ฌ์ด์ฆ ํด๋จธ๋
ธ์ด๋์์์ ์ค์ ๋ฐ์ค ์ด๋ฐ ์์
(depalletizing, transporting, placing)์ ๋ฌดํ๋ ๋ฐฐํฌ ๋ฌ์ฑ
Limitation & Further Study
- ๊ด์ธก๋์ง ์๋ ํ์ค ํ๋ผ๋ฏธํฐ์ ๋ํ ์ง์ ์ ์ถ์ ๋ฉ์ปค๋์ฆ์ด ์๊ณ ์์ ํ ์ ์ฌ ํํ์ ์์กดํ๋ ์
- ํ์ฌ ๋ฐ์ค ๊ฐ์ง ๋ฐ ์์ธ ์ถ์ ๋ชจ๋์ ์ ํ๋์ ์์กดํ๋ฉฐ, ๊ฐ์ง ์คํจ ์ ๋์ ๋ฐฉ์ ์ ํ
- ์ฐ์
ํ๊ฒฝ์ ์ถ๊ฐ ๋ณต์ก์ฑ(๊ณ ๋ฅด์ง ์์ ์ง๋ฉด, ๋์ ์ฅ์ ๋ฌผ, ๊ทน๋จ์ ํ์ค)์ ๋ํ ์ผ๋ฐํ ์ ๋ ๋ฏธ๋ช
ํ
- ํ์คํ ๋ฆฌ ๋ฒํผ ๊ธธ์ด์ ์ ์ฌ ํน์ฑ ์ฐจ์ ์ ํ์ ์ค๊ณ ์๋ฆฌ ์์ธ ๋ถ์ ๋ถ์กฑ
- ์ถ๋ก ์๊ฐ ๋ฐ ์ค์๊ฐ ์ฒ๋ฆฌ ๊ฐ๋ฅ์ฑ์ ๋ํ ๋ถ์ ๋ฏธํฌํจ
- ํ์ ์ฐ๊ตฌ: ์ ์ ํ์ค ์ถ์ ๊ธฐ ํตํฉ, ๋ค์ํ ํ๊ฒฝ์์์ ์ผ๋ฐํ ๊ฒ์ฆ, ๋น์ ์ ์ํฉ(์ฌ๋ฆฝ, ์ ์ด ์์ค) ๋์
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ์ฐ์
์ฉ ํด๋จธ๋
ธ์ด๋์ ์ค์ง์ ๊ณผ์ ์ธ ํ์ค ๋ณํ ์กฐ๊ฑด์์์ ๋ก์ฝ-๋งค๋ํฐ๋ ์ด์
์ ๋ถ๋ฆฌ-ํ์กฐ ๊ตฌ์กฐ์ ์ํ ์ถ์ ์ผ๋ก ์ฒด๊ณ์ ์ผ๋ก ํด๊ฒฐํ๋ฉฐ, ์๋ฎฌ๋ ์ด์
ํ์ต ํ ๋ฌดํ๋ ์ค๋ฐฐํฌ ์ฑ๊ณต์ ๋์ ์ค๋ฌด ๊ฐ์น๋ฅผ ์
์ฆํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์