저자: | 날짜: 2026-04-08 | URL: https://arxiv.org/abs/2604.07517 📄 PDF
Fig. 1: GraspDreamer leverages human demonstrations syn-
Visual Generative Model (VGM)으로 생성한 인간 시연 비디오로부터 기능적 파지를 학습하여 실제 데이터 수집 없이 제로샷 로봇 파지를 가능하게 하는 GraspDreamer 방법을 제안한다. 인터넷 규모의 사전학습 데이터에 인코딩된 인간-물체 상호작용 프라이어를 활용하여 데이터 효율성과 일반화 성능을 동시에 달성한다.
Fig. 3: Qualitative results on the TaskGrasp dataset. The
Fig. 2: An overview of GraspDreamer. The pipeline consists of three stages: (a) Human demonstration generation with
총평: GraspDreamer는 VGM의 생성 능력을 창의적으로 활용하여 기능적 파지의 데이터 수집 부담을 획기적으로 감소시키면서도 다양한 로봇 플랫폼에 일반화되는 실용적 솔루션을 제시한다. 공개 벤치마크와 실세계 실험의 광범위한 검증으로 방법의 유효성을 충실히 입증하였다.