CHIP: Adaptive Compliance for Humanoid Control through Hindsight Perturbation
์ ์: Sirui Chen, Zi-ang Cao, Zhengyi Luo, Fernando Castaรฑeda, Chenran Li, Tingwu Wang, Ye Yuan, Linxi "Jim" Fan, C. Karen Liu, Yuke Zhu | ๋ ์ง: 2026-02-09 | DOI: 10.48550/arXiv.2512.14689 📄 PDF
Essence
Fig. 1: CHIP enables humanoid robots to perform manipulation tasks that require force control, such as wiping a whiteboa
CHIP๋ hindsight perturbation์ ํตํด humanoid robot์ด ๋ฏผ์ฒฉํ ์์ง์์ ์ ์งํ๋ฉด์๋ ์ ์์ compliance๋ฅผ ๊ฐ์ถ forceful manipulation์ ์ํํ ์ ์๊ฒ ํ๋ plug-and-play ๋ชจ๋์ด๋ค.
Motivation
- Known: Humanoid robot์ backflipping, running ๋ฑ์ agile locomotion์ ์ฑ๊ณตํ์ผ๋, forceful manipulation ๊ฐ์ ์ ์ด-ํ๋ถํ ์์
์์๋ ์ฌ์ ํ ์ ์ฝ์ด ์๋ค. RL ๊ธฐ๋ฐ motion tracking์ ๊ณ ์ ๋ stiffness๋ฅผ ๊ฐ์ ธ compliance ์ ์ด์ ์ด๋ ค์์ด ์๋ค.
- Gap: ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค(FACET, SoftMimic, GentleHumanoid)์ synthetic data augmentation์ด๋ offline reward tuning์ ์๊ตฌํ๋ฉฐ, humanoid์ ํ์ฅํ ๋ ์์ฐ์ค๋ฌ์ด human motion ๋ถํฌ ๋ฐ์ ํฉ์ฑ ๋ฐ์ดํฐ ์์ฑ์ด ์ด๋ ต๋ค.
- Why: Humanoid robot์ด agile motion๊ณผ safe contact-rich manipulation์ ๋์์ ์ํํ ์ ์์ผ๋ฉด ์ค์ ์ฐ์
์์ฉ(wiping, door opening, multi-robot collaboration)์์ ์ผ๋ฐ์ฉ ๋ก๋ด์ผ๋ก ํ์ฉ ๊ฐ๋ฅํด์ง๋ค.
- Approach: ์ฐธ๊ณ motion์ hindsight perturbation์ compliant response๋ก ํด์ํ์ฌ, reference trajectory๋ฅผ ์์ ํ์ง ์๊ณ sparse tracking goal๋ง ์กฐ์ ํจ์ผ๋ก์จ dense tracking reward๋ ๋ณด์กดํ๋ฉด์ adaptive compliance๋ฅผ ํตํฉํ๋ค.
Achievement
Fig. 1: CHIP enables humanoid robots to perform manipulation tasks that require force control, such as wiping a whiteboa
- Plug-and-play ๋ชจ๋: ๊ธฐ์กด humanoid tracking framework์ minimal modification์ผ๋ก ํตํฉ ๊ฐ๋ฅํ๋ฉฐ, data augmentation์ด๋ reward tuning ๋ถํ์
- ๋ค์ํ forceful manipulation ์ํ: Wiping, writing, cart pushing, door opening, multi-robot collaboration ๋ฑ์ ์ผ๋ฐํ๋ motion tracker๋ก ์ํ
- Agility ๋ณด์กด: Dancing, running, squatting ๊ฐ์ agile locomotion ์ฑ๋ฅ์ ์ ์งํ๋ฉด์ compliance control ๋ฌ์ฑ
- ๋ณตํฉ ์ ์ด ์ธํฐํ์ด์ค: Local 3-point tracking์ผ๋ก teleoperation๊ณผ VLA policy learning ์ง์, global 3-point tracking์ผ๋ก multi-robot coordination ๊ฐ๋ฅ
How
Fig. 2: Overview of training and deployment of CHIP: this general formulation takes tracking targets, end-effector compl
- Hindsight perturbation: ์๋ณธ reference motion์์ perturbation ํจ๊ณผ๋ฅผ ๋นผ์ tracking goal์ ์ ์ํ๋, dense reward ๊ณ์ฐ์ ์๋ณธ reference motion ์ฌ์ฉ
- Adaptive impedance control: ๊ฐ task์ ํ์ํ end-effector stiffness๋ฅผ ์ ์ฑ
์ด ํ์ตํ๋๋ก ํ์ฌ variable compliance ๋ฌ์ฑ
- Motion tracking framework ํตํฉ: ๊ธฐ์กด RL-based humanoid tracking ๊ตฌ์กฐ(reference trajectory, tracking reward)๋ฅผ ์ ์งํ๋ฉด์ input space์ tracking goal๋ง ์์
- 3-point keypoint control: Head์ ๋ ์(end-effectors)์ pose๋ฅผ tracking goal๋ก ์ฌ์ฉํ์ฌ whole-body control ๊ตฌํ
Originality
- Hindsight interpretation์ ํ์ : Reference motion์ compliant response๋ก ์ฌํด์ํ์ฌ ๊ธฐ์กด synthetic data augmentation ํจ๋ฌ๋ค์์ ํํผ
- Input space ์์ ์ ๋ต: Reference trajectory ์์ฒด๊ฐ ์๋ tracking goal๋ง ์์ ํ์ฌ reliable reward computation ๋ณด์ฅ
- ํ์ฅ์ฑ: ๊ธฐ์กด humanoid motion tracking framework(Deep-Mimic ๊ณ์ด)์ ์ง์ ์ ์ฉ ๊ฐ๋ฅํ๋ฉฐ, ๋๊ท๋ชจ diverse motion dataset ์ฒ๋ฆฌ์ ์ต์ ํ
- Multi-robot ์ ์ฉ: Global 3-point tracking์ ํตํด humanoid ๊ฐ world-space coordination ์คํ
Limitation & Further Study
- Simulation-to-reality gap: ๋
ผ๋ฌธ์ด ์ฃผ๋ก simulation ๊ฒฐ๊ณผ๋ฅผ ์ ์ํ๋ฉฐ, ์ค์ humanoid robot์์์ force control ์ ํ๋์ ์์ ์ฑ ๊ฒ์ฆ ๋ถ์กฑ
- Compliance ๋ฒ์์ ํ๊ณ: End-effector stiffness ๋ฒ์์ modulation ์๋์ ๋ํ ๊ตฌ์ฒด์ ๋ถ์์ด๋ ์ ์ฝ ์กฐ๊ฑด ๋ฏธ๋ช
์
- Contact force ์ถ์ : ์ค์ ์ ์ด๋ ฅ ์ ๋ณด ์์ด proprioceptive signal๋ง์ผ๋ก compliance ์ ์ดํ๋ฏ๋ก, high-precision force control์ด ํ์ํ ์์ฉ์ ์ ํ์
- ํ์ ์ฐ๊ตฌ: (1) ์ค์ humanoid robot(์: Tesla Bot, Boston Dynamics Atlas)์์์ ๊ฒ์ฆ, (2) Model-based impedance control๊ณผ์ fusion, (3) Tactile sensing ํตํฉ์ผ๋ก ์ ์ด ๊ฐ๊ฐ ๊ธฐ๋ฐ compliance ํฅ์
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: CHIP๋ humanoid์ agile motion๊ณผ compliant manipulation์ ์๋ฆฝ์ํค๋ ์ฐ์ํ ํด๊ฒฐ์ฑ
์ผ๋ก, hindsight perturbation์ด๋ผ๋ ํต์ฌ ์์ด๋์ด์ ๋จ์ํจ๊ณผ ๊ธฐ์กด framework์์ ํธํ์ฑ์ด ๊ฐ์ ์ด๋ค. ๋ค๋ง ์ค์ ๋ก๋ด ๊ฒ์ฆ๊ณผ force control์ ์ ๋์ ๋ถ์์ด ๋ณด์๋๋ฉด ๋์ฑ ์์ฑ๋ ์๋ ์ฐ๊ตฌ๊ฐ ๋ ๊ฒ์ด๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์