SkillBlender: Towards Versatile Humanoid Whole-Body Loco-Manipulation via Skill Blending
์ ์: Yuxuan Kuang, Haoran Geng, Amine Elhafsi, Tan-Dzung Do, Pieter Abbeel, Jitendra Malik, Marco Pavone, Yue Wang | ๋ ์ง: 2025-06-11 | URL: https://arxiv.org/abs/2506.09366 📄 PDF
Essence
Figure 2: Overview of SkillBlender. We first pretrain goal-conditioned primitive expert skills that are
SkillBlender๋ ์ฌ์ ํ์ต๋ ๋ชฉํ์กฐ๊ฑด๋ถ ์์ ๊ธฐ์ ๋ค์ ๋์ ์ผ๋ก ํผํฉํ์ฌ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ด ๋ณต์กํ ์ ์ ์กฐ์-์ด๋ ์์
์ ์ต์ํ์ ๋ณด์ ์์ง๋์ด๋ง์ผ๋ก ์ํํ ์ ์๊ฒ ํ๋ ๊ณ์ธต์ ๊ฐํํ์ต ํ๋ ์์ํฌ์ด๋ค.
Motivation
- Known: ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ์ต์ ์ ์ด์ ๊ฐํํ์ต์ ํตํด ์ ์ ์ ์ด์ ์กฐ์-์ด๋์์ ์๋นํ ์ง์ ์ ์ด๋ฃจ์์ผ๋, ๊ฐ ์์
๋ง๋ค ๊ด๋ฒ์ํ ์์
๋ณ ๋ณด์ ํ๋์ด ํ์ํ์ฌ ํ์ฅ์ฑ์ด ์ ํ๋๋ค.
- Gap: ๊ธฐ์กด ๊ฐํํ์ต ๋ฐฉ๋ฒ๋ค์ ๋ฐฉํฅ, ๋ณดํ, ์ ์ด, ํธ๊ธฐ์ฌ ๋ฑ ๋ค์ํ ๋ณด์ํญ์ ๊ท ํ์๊ฒ ์กฐ์ ํด์ผ ํ๋ฏ๋ก ์ผ์์ ์๋๋ฆฌ์ค์ ๋ค์ํ ์์
์ ํ์ฅํ๊ธฐ ์ด๋ ต๋ค๋ ํ๊ณ๊ฐ ์๋ค.
- Why: ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ์ผ์์ ๋ฐฐํฌ๋ฅผ ์ํด์๋ ํ์ต๋ ๊ธฐ๋ณธ ๋ฅ๋ ฅ๋ค์ ํจ์จ์ ์ผ๋ก ์กฐํฉํ์ฌ ๋ค์ํ ์์
์ ์๋์ผ๋ก ์ํํ ์ ์๋ ํ์ฅ ๊ฐ๋ฅํ๊ณ ๋ค์ฉ๋์ ์ธ ์์คํ
์ด ํ์์ ์ด๋ค.
- Approach: ์ธ๊ฐ์ ์ด๋ ๊ธฐ์ ๋ฐ๋ฌ์์ ์๊ฐ์ ๋ฐ์, ์์
๋นํน์ด์ ์์ ๊ธฐ์ ๋ค์ ๋จผ์ ์ฌ์ ํ์ตํ ํ ๊ณ ์์ค ์ ์ด๊ธฐ๊ฐ ๋ถ๋ถ๋ชฉํ์ per-joint ๊ฐ์ค์น ๋ฒกํฐ๋ฅผ ํ์ตํ์ฌ ์ด๋ค ๊ธฐ์ ์ ํผํฉํ๋ ๋ฐฉ์์ ์ ์ํ๋ค.
Achievement
Figure 4: Qualitative comparison between different methods. Our SkillBlender not only achieves
- SkillBlender ํ๋ ์์ํฌ: ๋ชฉํ์กฐ๊ฑด๋ถ ์์ ๊ธฐ์ ๋ค์ ๋์ ์ผ๋ก ํผํฉํ๋ ๋
ํนํ ๋ฒกํฐํ ๊ฐ์ค์น ๋ฉ์ปค๋์ฆ์ผ๋ก ๋ ์ ์ฐํ๊ณ ์ ํํ ํด๋จธ๋
ธ์ด๋ ํ๋์ ์์ฑ
- SkillBench ๋ฒค์น๋งํฌ: ๋ณ๋ ฌํ ๊ฐ๋ฅํ๊ณ 3๊ฐ์ ์ ์ฒดํํ, 4๊ฐ์ ์์ ๊ธฐ์ , 8๊ฐ์ ๋์ ์ ๊ณผ์ ๋ฅผ ํฌํจํ๋ฉฐ ์ ํ๋์ ์คํ๊ฐ๋ฅ์ฑ์ ๋ชจ๋ ์ธก์ ํ๋ ํ๊ฐ ๋ฉํธ๋ฆญ ์ ๊ณต
- ์ต์ํ์ ๋ณด์ ์์ง๋์ด๋ง: ๊ธฐ์กด ๋ฐฉ๋ฒ์ ๋ค์ค ๋ณด์ํญ ๋์ ์์
๋น 1-2๊ฐ์ ๋ณด์ํญ์ผ๋ก ๊ฐ๊ฑดํ๊ณ ์์ฐ์ค๋ฌ์ด ์ ์ฑ
ํ์ต ๊ฐ๋ฅ
- ๊ด๋ฒ์ํ ์ฑ๋ฅ ํฅ์: ๋ชจ๋ ๊ธฐ์ค์ ์ ๋ฅ๊ฐํ๋ฉฐ ๋ณด์ ํดํน์ ์์ฐ์ค๋ฝ๊ฒ ๋ฐฉ์งํ์ฌ ๋ค์ํ ์ผ์์ ์กฐ์-์ด๋ ์์
์์ ๋ ์ ํํ๊ณ ์คํ๊ฐ๋ฅํ ์์ง์ ์คํ
How
Figure 2: Overview of SkillBlender. We first pretrain goal-conditioned primitive expert skills that are
- ์ฌ์ ํ์ต ๋จ๊ณ: ์ํน, ๋ฆฌ์นญ, ์กฐ์, ํธ์ฑ ๋ฑ 4๊ฐ์ ๋ชฉํ์กฐ๊ฑด๋ถ ์์ ๊ธฐ์ ์ task-agnosticํ๊ฒ ํ์ต
- ๊ณ ์์ค ์ ์ด๊ธฐ: ๋ถ๋ถ๋ชฉํ ์์ฑ๊ณผ per-joint ๊ฐ์ค์น ๋ฒกํฐ๋ฅผ ํ์ตํ์ฌ ์์ ๊ธฐ์ ๋ค์ ๋์ ์ผ๋ก ํผํฉ
- ์ ํ๋ ๋ฉํธ๋ฆญ: ์์
์๋ฃ ์ฑ๊ณต์ ์ธก์
- ์คํ๊ฐ๋ฅ์ฑ ๋ฉํธ๋ฆญ: ์ธ๊ฐ๋ค์๊ณผ ์์ฐ์ค๋ฌ์์ ํ๊ฐํ์ฌ ๋ณด์ ํดํน ๋ฐฉ์ง
- ํํ ์๋ฎฌ๋ ์ด์
: RL ํ์ต ํจ์จ์ฑ ํฅ์
Originality
- ๊ธฐ์กด HRL ๋ฐฉ๋ฒ๊ณผ ๋ฌ๋ฆฌ multiple reusable skills์ ๋ช
์์ ์ผ๋ก ๋ค๋ฃจ๊ณ , ํนํ per-joint ๋ฒกํฐํ ๊ฐ์ค์น๋ฅผ ํตํ ๊ณ ์ ํ ๊ธฐ์ ํผํฉ ์ ๋ต ์ ์
- ์ธ๊ฐ์ ์ด๋ ๊ธฐ์ ๋ฐ๋ฌ ๊ณผ์ (๊ธฐ์ด ๋ฅ๋ ฅ ๋จผ์ ์ต๋ โ ๋ณตํฉ ์์
์ํ)์์ ์ง์ ์๊ฐ์ ๋ฐ์ ๊ณ์ธต์ ๊ตฌ์กฐ
- ์ ํ๋์ ์คํ๊ฐ๋ฅ์ฑ์ ๋์์ ํ๊ฐํ๋ ์ด์ค ์ฐจ์์ ํ๊ฐ ๋ฉํธ๋ฆญ ๋์
์ผ๋ก ๋ณด์ ํดํน ๋ฌธ์ ์ฒด๊ณ์ ํด๊ฒฐ
- 3๊ฐ ์ ์ฒดํํ์ 8๊ฐ ๋ค์ํ ๊ณผ์ ๋ฅผ ์ง์ํ๋ ํฌ๊ด์ ์ด๊ณ ๋ณ๋ ฌํ๋ ๋ฒค์น๋งํฌ ์ ๊ณต
Limitation & Further Study
- ์๋ฎฌ๋ ์ด์
๊ธฐ๋ฐ ์คํ๋ง ์ ์๋์ด ์ค์ ํ๋์จ์ด ๋ก๋ด์์์ ๊ฒ์ฆ์ด ํ์
- ์ฌ์ ํ์ต๋ 4๊ฐ์ ์์ ๊ธฐ์ ์ผ๋ก ์ ํ๋์ด ์์ผ๋ฉฐ, ์๋ก์ด ๊ธฐ์ ์ถ๊ฐ ์ ์ฌํ์ต ํ์์ฑ ์กด์ฌ
- ํ๊ฐ ๋ฉํธ๋ฆญ์ '์คํ๊ฐ๋ฅ์ฑ' ์ ์๊ฐ ํด๋จธ๋
ธ์ด๋ ํน์ฑ์ ์ผ๋ง๋ ์ผ๋ฐํ๋๋์ง ๊ฒํ ํ์", '๋๊ท๋ชจ ์ผ์์ ์์
๋ค์์ฑ(์๋ฐฑ ๊ฐ ์ด์)์ ๋ํ ํ์ฅ์ฑ ๊ฒ์ฆ ๋ถ์กฑ
- ํ์์ฐ๊ตฌ๋ก ์ค์ ๋ก๋ด ๋ฐฐํฌ, ๋ค์ํ ์ ์ฒดํํ ๊ฐ ๊ธฐ์ ์ ์ด ํ์ต, ์ ์ํ ๊ธฐ์ ์ถ๊ฐ ํ์ต ๋ฉ์ปค๋์ฆ ๊ฐ๋ฐ ํ์
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: SkillBlender๋ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ๋ค์ฉ๋์ ์กฐ์-์ด๋ ๋ฅ๋ ฅ ๊ฐ๋ฐ์ ๋ํ ์ฐ์ํ๊ณ ์ค์ฉ์ ์ธ ํด๊ฒฐ์ฑ
์ ์ ์ํ๋ฉฐ, ํฌ๊ด์ ์ธ ๋ฒค์น๋งํฌ์ ํจ๊ป ํฅํ ํด๋จธ๋
ธ์ด๋ ์ฐ๊ตฌ์ ์ค์ํ ๊ธฐ์ด๊ฐ ๋ ๊ฐ๋ฅ์ฑ์ด ๋๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์