HAFO: A Force-Adaptive Control Framework for Humanoid Robots in Intense Interaction Environments

Essence

Fig 1: Overview of the HAFO model. (a) Policy Training. A dual-agent strategy with

HAFO는 dual-agent RL 프레임워크를 통해 humanoid robot의 하체 보행과 상체 조작을 동시에 최적화하여 강한 외력 상호작용 환경에서 안정적이고 정밀한 제어를 달성한다.

Known: RL 기반 humanoid locomotion과 경량 object manipulation은 진전했으나, 강한 외력 상호작용 환경에서의 견고하고 정밀한 제어는 미흡하다.
Gap: 기존 RL 방법들은 외력을 명시적으로 모델링하지 않아 인간 개입이나 환경 접촉 시 불안정성을 보이며, lower-RL-upper-IK 방식은 상체의 개루프 제어로 외력 적응이 어렵다.
Why: Humanoid robot의 고중심, 좁은 지지대 특성상 고하중 조작과 고도 작업(로프 현수) 같은 강한 외력 환경에서의 안정적 제어가 실제 응용에 필수적이다.
Approach: Spring-damper system으로 외력을 명시적으로 모델링하고, dual-agent(하체-상체) 구조에 constrained residual action space를 적용하며, curriculum learning으로 점진적으로 외력을 증가시킨다.

Fig 3: Unitree G1 Humanoid robot sim2sim results. We evaluate the model’s performance

Fig 2: Spring-damper model and performance analysis. (a) Spring-damper model schematic

Spring-damper 모델을 통한 명시적 외력 동적 모델링으로 기존의 암묵적 처리 방식 개선
Dual-agent 분리 전략과 constrained residual action space의 결합으로 훈련 안정성과 효율성 동시 달성
Curriculum learning과 randomization을 통한 progressive force adaptation으로 모드 전환의 자동 생성
Humanoid robot의 로프 현수 상태 제어라는 novel 응용 분야 개척

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

총평: HAFO는 spring-damper 모델과 dual-agent RL의 결합으로 humanoid robot의 강한 외력 적응 제어에서 새로운 기준을 제시하며, 특히 로프 현수라는 novel 응용에서 안정적 제어를 최초 달성한 의미 있는 연구다.