HMC: Learning Heterogeneous Meta-Control for Contact-Rich Loco-Manipulation
์ ์: Lai Wei, Xuanbin Peng, Ri-Zhao Qiu, Tianshu Huang, Xuxin Cheng, Xiaolong Wang | ๋ ์ง: 2025-11-18 | DOI: 10.48550/arXiv.2511.14756 📄 PDF
Essence
Fig. 2: System overview. HMC-Controller accepts inputs from either a VR-based teleoperation system or HMC-Policy
๋ก๋ด์ ์ ์ด์ด ๋ง์ ์กฐ์ ์์
์ ์ํด ์์น, ์ํผ๋์ค, ํ์ด๋ธ๋ฆฌ๋ ํ-์์น ์ ์ด๋ฅผ ์ ์์ ์ผ๋ก ํผํฉํ๋ HMC(Heterogeneous Meta-Control) ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, mixture-of-experts ๋ผ์ฐํ
์ ํตํด ๋๊ท๋ชจ ์์น ๋ฐ์ดํฐ์ ๋ฏธ์ธํ ํ ์ธ์ ์์ฐ์ผ๋ก๋ถํฐ ํ์ตํ๋ค.
Motivation
- Known: ๊ธฐ์กด ์์น๋ง ๊ธฐ๋ฐ์ ์ ์ด๊ธฐ๋ ์ ์ด์ด ๋ง์ ์์
์์ ๋ถ์ ํํ๋ฉฐ, ์ ํต์ ์ํผ๋์ค ๋ฐ ํ์ด๋ธ๋ฆฌ๋ ํ-์์น ์ ์ด๋ ์๋ ํ๋์ด ํ์ํ๊ณ ์ผ๋ฐํ๊ฐ ์ด๋ ต๋ค.
- Gap: ๋ค์ํ ์ ์ด ๋ชจ๋ฌ๋ฆฌํฐ๋ฅผ ์ฐ์์ ์ผ๋ก ํผํฉํ๋ ํตํฉ ์ธํฐํ์ด์ค ๋ถ์ฌ, ์์น ์ ์ฉ ๋ฐ์ดํฐ ๋ถ๊ท ํ ๋ฌธ์ , ์ ์ด๊ธฐ ๊ฐ ๊ธ๊ฒฉํ ์ ํ์ผ๋ก ์ธํ ํ ํฌ ๋ถ์ฐ์์ฑ ํด๊ฒฐ ํ์.
- Why: ๋ก๋ด์ด ๊ฐ์ , ์ฐฝ๊ณ , ์ฌ๋ ํ์ฅ ๋ฑ ์ค์ ํ๊ฒฝ์์ ๊ฑท๊ธฐ์ ์กฐ์์ ๋์์ ์ํํด์ผ ํ๋๋ฐ, ์ ์ด ์ญํ์ ๋ฌด์ํ ์ ์ด๊ธฐ๋ ์ํํ ์ง๋๊ณผ ๊ณผ๋ํ ํ์ ์์ฑํ๊ธฐ ๋๋ฌธ์ด๋ค.
- Approach: HMC-Controller๋ฅผ ํตํด ํ ํฌ ๊ณต๊ฐ์์ ์ฌ๋ฌ ์ ์ด ํ๋กํ์ผ์ ์ฐ์์ ์ผ๋ก ํผํฉํ๊ณ , HMC-Policy๊ฐ soft mixture-of-experts ๋ผ์ฐํ
์ผ๋ก ์ฌ๋ฌ ์ ์ด๊ธฐ์ ์์ธก์ ๊ฐ์คํฉํ๋ ์ด์ง์ ์ํคํ
์ฒ๋ฅผ ํ์ตํ๋ค.
Achievement
Fig. 1: Rolling out HMC for contact-rich tasks on a humanoid robot. Compared to naยจฤฑve position-only policies [5, 26,
- HMC-Controller ์ธํฐํ์ด์ค: ์์น, ์ํผ๋์ค, ํ์ด๋ธ๋ฆฌ๋ ํ-์์น ์ ์ด๊ธฐ๋ก๋ถํฐ์ ํ ํฌ ๋ช
๋ น์ ํ ํฌ ๊ณต๊ฐ์์ ์ฐ์์ ์ผ๋ก ํผํฉํ์ฌ ์๊ฒฉ์กฐ์ข
๊ณผ ์ ์ฑ
๋ฐฐํฌ ๋ชจ๋ ์ง์
- HMC-Policy ์ด์ง์ ์ค๊ณ: soft MoE ๋ผ์ฐํ
์ ํตํด ๋๊ท๋ชจ ์์น ์ ์ฉ ์์ฐ๊ณผ ๋ฏธ์ธํ ํ ์ธ์ ์์ฐ์ ํตํฉ ํ์ตํ๋ฉฐ ์ ๋ฌธ๊ฐ ๋ถ๊ดด ๋ฐฉ์ง
- ์ค์ ๋ก๋ด ์ฑ๋ฅ: ํ
์ด๋ธ ๋ฆ๊ธฐ, ์๋ ์ด๊ธฐ ๋ฑ ์ ์ด ๋ง์ ์์
์์ ๊ธฐ์ค์ ๋๋น 50% ์ด์ ์๋์ ๊ฐ์ ๋ฌ์ฑ
How
Fig. 2: System overview. HMC-Controller accepts inputs from either a VR-based teleoperation system or HMC-Policy
- ์ธ ๊ฐ์ง primitive ์ ์ด๊ธฐ ๊ตฌํ: ํ์ค PD ์์น ์ ์ด๊ธฐ(์ 1), joint-space ์ํผ๋์ค ์ ์ด๊ธฐ(์ 2), Cartesian-space ์ํผ๋์ค ์ ์ด๊ธฐ
- soft routing ๋ฉ์ปค๋์ฆ์ผ๋ก ์์ธก๋ ๊ฐ์ค์น๋ฅผ ์ฌ์ฉํ์ฌ ์ฌ๋ฌ ์ ๋ฌธ๊ฐ ์ ์ด๊ธฐ์ ํ ํฌ ์ถ๋ ฅ์ ์ ํ ๊ฒฐํฉ
- ์ฌ์ ํ์ต-๋ฏธ์ธ์กฐ์ ํจ๋ฌ๋ค์: ๊ณต๊ฐ ์์น ์ ์ฉ ์์ฐ์ผ๋ก ์ฌ์ ํ์ต ํ ํ ์ธ์ ์์ฐ์ผ๋ก ๋ฏธ์ธ์กฐ์
- VR ๊ธฐ๋ฐ ์๊ฒฉ์กฐ์ข
์์คํ
๊ณผ ์ ์ฑ
์ถ๋ก ๊ฒฝ๋ก ๋ชจ๋์์ ๋์ผํ HMC-Controller ์ธํฐํ์ด์ค ์ฌ์ฉ
- ์ ์ฒด ๋ชธ ํด๋จธ๋
ธ์ด๋ ์ ์ด๊ธฐ์ ๊ฒฐํฉํ์ฌ ์์ฒด ์กฐ์๊ณผ ํ์ฒด ์ด๋์ฑ ๋์ ์คํ
Originality
- ํ ํฌ ๊ณต๊ฐ์์์ ์ฐ์์ ์ ์ด ํ๋กํ์ผ ํผํฉ์ ๊ธฐ์กด ์ด์ฐ์ ์ ์ด๊ธฐ ์ ํ ๋ฐฉ์๊ณผ ๊ตฌ๋ณ๋๋ฉฐ ์์ ์ฑ๊ณผ ํด์๊ฐ๋ฅ์ฑ ํฅ์
- ํผํฉ ๋ฐ์ดํฐ ์์ค(์์น ์ ์ฉ + ํ ์ธ์)๋ฅผ ์ฒ๋ฆฌํ๋ ์ด์ง์ ์ ์ฑ
์ํคํ
์ฒ๋ ๊ธฐ์กด ๋จ์ผ ์ ์ด ํ์
์์กด์ฑ ๊ทน๋ณต
- soft MoE ๋ผ์ฐํ
์ ์ ์ฉ์ผ๋ก ๋ค์ค ์ ์ด ์ ๋ฌธ๊ฐ ๊ฐ ๋ถ๋๋ฌ์ด ์ ํ๊ณผ ์ค์๊ฐ ํผ๋๋ฐฑ ๊ธฐ๋ฐ ์ ์ ์คํ
Limitation & Further Study
- ํ๊ฐ๊ฐ ๋จ์ผ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ๊ตญํ๋์ด ๋ค๋ฅธ ํํ์ ๋ก์ฝ-์กฐ์ ์์คํ
์ ๋ํ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ ๋ฏธ๋ถ๋ช
- force ์ผ์ ์๊ตฌ์ฌํญ๊ณผ ๊ฐ ์ ์ด๊ธฐ๋ณ calibration ๋ณต์ก๋์ ๋ํ ๋
ผ์ ๋ถ์กฑ
- soft routing ๊ฐ์ค์น์ ๋์ ์์ธก ๋ฉ์ปค๋์ฆ ํ์ต์ ํ์ํ ๋ฐ์ดํฐ๋ ๋ฐ ๊ณ์ฐ ๋น์ฉ์ ๋ํ ๋ถ์ ๋ถ์ฌ
- ํ์์ฐ๊ตฌ: ๋ค์ํ ํ๋ซํผ์ผ๋ก ํ์ฅ, force ์ผ์ ์๋ ์ ๊ทผ๋ฒ, ์จ๋ผ์ธ ์ ์ ๋ฅ๋ ฅ ๊ฐํ
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: HMC๋ ์ค์ ์ ์ด์ด ๋ง์ ์กฐ์ ์์
์ ๋์ ์ ์ฒด๊ณ์ ์ผ๋ก ํด๊ฒฐํ๋ ์ค์ฉ์ ์ด๊ณ ํ์ ์ ์ธ ํ๋ ์์ํฌ๋ก, ํตํฉ๋ ์ ์ด ์ธํฐํ์ด์ค์ ์ด์ง์ ์ ์ฑ
์ค๊ณ๊ฐ 50% ์ด์์ ์ฑ๋ฅ ํฅ์์ ๋ฌ์ฑํ๋ฉฐ ๋ก์ฝ-์กฐ์ ๋ถ์ผ์ ์๋ฏธ ์๋ ๊ธฐ์ฌ๋ฅผ ์ ์ํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์