저자: John Z. Zhang, Maks Sorokin, Jan Brüdigam, Brandon Hung, Stephen Phillips, Dmitry Yershov, Farzad Niroui, Tong Zhao, Leonor Fermoselle, Xinghao Zhu, Chao Cao, Duy Ta, Tao Pang, Jiuguang Wang, Preston Culbertson, Zachary Manchester, Simon Le Cléac'h | 날짜: 2026-04-09 | URL: https://arxiv.org/abs/2604.08508 📄 PDF
Fig. 2: System overview: Our method takes a hierarchical
본 논문은 사전 학습된 전신 제어 정책과 테스트 시점 샘플 기반 계획을 계층적으로 결합하여 사족 로봇과 인형 로봇이 동적으로 대형 무거운 물체를 조작할 수 있게 하는 Sumo 프레임워크를 제시한다. 이 방법은 재학습 없이 다양한 물체와 작업에 일반화되며, 비용 함수만 변경하여 테스트 시점에 유연하게 적응할 수 있다.
Fig. 4: Comparing Sumo (ours, yellow) to end-to-end RL
Fig. 3: Illustrations comparing (a) standard dynamics rollouts
총평: 본 논문은 강화학습과 샘플 기반 MPC를 계층적으로 결합하는 우아한 방식으로 동적 전신 로코-조작을 처음 구현했으며, Spot 실제 로봇에서의 인상적인 결과와 일반화 가능성은 로봇 조작 분야에 의미 있는 기여를 한다. 테스트 시점 유연성과 훈련 없는 적응은 실무 적용에 큰 가치가 있다.