Humanoid — Paper Curation

543
리뷰 완료
9
MECE 카테고리
2026-06-14
큐레이션 일자

Research Timeline

Research Timeline

휴머노이드(Humanoid) 연구 분야는 2018년 DeepMimic(Peng et al., 2018)이 모션캡처 기반 예시 유도 강화학습(Example-Guided RL)을 정립하고, 2019년 ANYmal의 학습된 액추에이터 네트워크(Learned Actuator Nets)가 시뮬레이션-실물 전이(Sim-to-Real Transfer)의 표준 경로를 제시하면서 본격적으로 가속화되었다. 이후 2021년 적대적 모션 사전학습(Adversarial Motion Prior, AMP)이 수작업 보상 설계를 대체하였고, 2022년 PhysDiff는 디퓨전 샘플링에 물리 투영을 결합하며 생성 모델과 물리 기반 캐릭터 제어를 융합하는 패러다임 전환을 이끌었다. 2023~2024년에는 PHC가 단일 컨트롤러로 10K 모션 클립을 학습하는 규모 확장을 달성하였고, MaskedMimic(Tessler et al., 2024)이 전신 제어를 마스킹 기반 모션 인페인팅(Inpainting)으로 재정의하였으며, Apple Vision Pro 기반의 Open-TeleVision, Bunny-VisionPro, ARMADA 등이 동시다발적으로 등장하면서 VR 원격조작(Teleoperation)의 폭발적 확산이 일어났다. 같은 시기 HOVER는 15개 이상의 제어 모드를 단일 신경망으로 통합하는 행동 파운데이션 모델(Behavior Foundation Model)의 개념을 제시하였다. 2025년에 들어 GR00T N1, SONIC, FB-CPR, BeyondMimic과 같은 파운데이션급 전신 트래커가 등장하고, FALCON은 0~100N 외력 하 로코-매니퓰레이션(Loco-Manipulation)을 실현하였으며, FastTD3는 단일 GPU에서 15분 학습을 달성해 오프-폴리시 강화학습의 효율성을 극적으로 향상시켰다. 또한 VIRAL, VisualMimic은 RGB 픽셀-투-액션(Pixel-to-Action) 정책의 제로샷 전이를 입증하였고, iRonCub 3는 최초의 제트 추진 휴머노이드 수직 이륙을 시연하며 공중 휴머노이드라는 새로운 영역을 개척하였다. 저비용 의인형 손(RUKA, ORCA, CYJ Hand-0)과 5천 달러대 오픈 플랫폼(Berkeley Humanoid Lite, AGILOped)의 확산은 연구 진입 장벽을 크게 낮추었다. 2026년의 최근 흐름은 XHugWBC, H-Zero 등의 교차 형상(Cross-Embodiment) 일반화, Sentinel-VLA·PaCo-VLA의 메타인지적 안전 추론, Ψ0와 DreamGen 기반 비디오 월드 모델(Video World Model) 공동학습, 그리고 SafeVLA-Bench·SHIELD의 형식적 안전 보장으로 수렴하고 있다. 향후 연구는 에고센트릭 인간 영상 기반 VLA 사전학습, 물리적으로 안전한 언어 조건부 전신 제어, 촉각·시각·고유감각을 통합한 접촉 풍부(Contact-Rich) 매니퓰레이션, 그리고 하드웨어-제어 공동 설계(Co-Design)를 축으로 하여, 인터넷 규모 데이터로부터 실세계에 배포 가능한 범용 휴머노이드 정책을 구축하는 방향으로 진화할 것으로 전망된다.

🔗 Interactive Paper Network →

Research Insights 7 findings

융합
VLA·RL·모션합성 통합
Vision-Language-Action 모델과 물리 기반 강화학습, 대규모 모션 합성이 단일 파이프라인으로 통합되는 추세가 뚜렷하다. GR00T N1, Being-H0, SENTINEL, LeVERB 등 다수의 논문이 언어 명령→모션 생성→물리적 실행을 end-to-end로 연결하며, 시뮬레이션에서 학습한 정책을 실제 로봇에 zero-shot 배포하는 사례가 급증하고 있다. 이 수렴은 데이터 효율성을 10배 이상 향상시키고 특정 작업에 특화된 보상 함수 설계 필요성을 낮추고 있다.
Vision-Language Embodied Motion Control · Physics-Based Character Motion Synthesis · Reinforcement Learning Legged Robot Control [1412] [1814] [1670] [2050] [1847] [2081] [1772] [1937]
🏛 언어 기반 범용 제어 기반 모델 개발을 국가 핵심 과제로 지정하고 대규모 다양한 모션 데이터셋 공개 인프라 구축에 투자해야 한다.
융합
하드웨어-제어 공동설계
로봇 하드웨어 설계와 제어 정책을 독립적으로 최적화하던 기존 방식에서 벗어나 co-design 접근이 본격화되고 있다. EA-CoRL, RoboCraft, LEGO, 진화 알고리즘 기반 근골격 형태 진화 등 다수의 연구가 기어비, 링크 구조, 구동기 특성을 제어 정책과 동시에 최적화한다. 이는 특히 저비용 오픈소스 플랫폼(Berkeley Humanoid Lite, ORCA, RUKA 등)의 급증과 맞물려 접근성과 성능을 동시에 향상시키는 방향으로 수렴하고 있다.
Humanoid Locomotion Mechanism Design · Dexterous Hand Sensing and Actuation · Reinforcement Learning Legged Robot Control [1916] [2150] [2079] [2381] [1910] [3325] [1864] [2129]
🏛 하드웨어-소프트웨어 공동최적화 연구에 대한 별도 펀딩 트랙을 신설하고 오픈소스 플랫폼 표준화를 지원해야 한다.
신흥 트렌드
인간 영상 기반 제로샷 학습
로봇 데이터 수집 없이 인터넷 규모의 인간 egocentric 영상만으로 로봇 정책을 학습하는 패러다임이 빠르게 부상하고 있다. EgoNav, HumanEgo, Masquerade, ZeroWBC, MimicDroid 등의 연구가 5-30분 분량의 인간 영상만으로 실제 로봇에 zero-shot 배포 가능한 정책을 학습함을 보여준다. 이 접근은 데이터 수집 비용을 획기적으로 낮추고 embodiment gap 극복이 핵심 기술 과제로 부상하고 있음을 의미한다.
Vision-Language Embodied Motion Control · Physics-Based Character Motion Synthesis · Humanoid Teleoperation and Manipulation Interfaces [2057] [3315] [2093] [1763] [2099] [1901] [3317] [1900]
🏛 대규모 인간 행동 영상 데이터셋의 공개 수집·공유 플랫폼 구축을 국가 차원에서 지원하고 개인정보 보호 기준을 선제적으로 마련해야 한다.
신흥 트렌드
안전 제약 내재화 제어
기존의 성능 위주 제어에서 벗어나 Control Barrier Function, passivity shield, 확률적 안전 보장 등을 정책에 내재화하는 연구가 급증하고 있다. SHIELD, SafeFlow, PaCo-VLA, SafeVLA-Bench, ConstrainedMimic 등이 학습된 정책을 재훈련 없이 안전화하거나 안전 제약을 훈련 과정에 직접 임베딩하는 방법을 제시한다. 특히 의료·산업 현장 배포를 위한 규격화된 안전 벤치마크(SafeVLA-Bench, SPARK) 제안이 나타나기 시작했다.
Reinforcement Learning Legged Robot Control · Sim-to-Real Policy Transfer Methods · Vision-Language Embodied Motion Control [1671] [1662] [3320] [3323] [3309] [1686] [1954] [2385]
🏛 휴머노이드 로봇의 공공장소 및 의료 현장 배포 전 안전 인증 요건을 표준화하고, 안전 벤치마크 개발에 대한 정부 지원을 강화해야 한다.
연구 갭
장기 에너지 효율 연구 부족
대다수 연구가 단기 태스크 성공률과 동작 품질에 집중하고 있으며, 실세계 장시간 운용에서의 에너지 효율, 열 지속성, 배터리 소모를 정량적으로 연구하는 논문은 극히 소수이다. ECO, Human-Level Actuation Score(HLAS), PMSM 에너지 모델 등 일부 연구만이 에너지를 명시적 제약으로 다루며, 실외 장시간 자율 운용 시나리오에 대한 체계적 연구는 부재하다. 이는 산업 현장 실배포의 핵심 병목임에도 불구하고 연구 공동체의 주목을 받지 못하고 있다.
Humanoid Locomotion Mechanism Design · Reinforcement Learning Legged Robot Control · Dexterous Hand Sensing and Actuation [1894] [1990] [2155] [3348]
🏛 휴머노이드 로봇의 실용화를 위해 에너지 효율성과 연속 운용 시간을 성능 지표로 표준화하고 관련 연구에 별도 지원을 제공해야 한다.
연구 갭
비전문가 상호작용 연구 미흡
현재 연구의 대부분이 전문 연구자나 기술자를 대상으로 설계된 인터페이스에 집중하며, 노인·장애인·어린이 등 취약계층이나 비전문가 일반인이 휴머노이드와 자연스럽게 상호작용하는 시나리오는 거의 연구되지 않고 있다. SPARK, FIRA HuroCup GUI, Alter-Art 등 소수의 연구만이 비전문가 사용성을 다루며, 사회적 수용성·신뢰·윤리적 측면에 대한 실증적 연구는 거의 없다. 이는 의료 보조, 고령자 돌봄 등 고사회적 가치 응용에서 핵심 장벽이 되고 있다.
Humanoid Teleoperation and Manipulation Interfaces · Vision-Language Embodied Motion Control [1866] [3305] [2011] [1819]
🏛 휴머노이드 로봇의 사회적 수용성 및 취약계층 대상 상호작용 연구에 대한 인문사회과학 융합 연구비 지원을 확대하고 윤리 가이드라인을 선제적으로 제정해야 한다.
융합
지각-보행-조작 통합 제어
과거에는 지각(Perception), 이동(Locomotion), 조작(Manipulation)이 별도 모듈로 연구되었으나, PILOT, VisualMimic, ULTRA, EgoHumanoid, ResMimic 등에서 단일 정책으로 세 기능을 동시에 처리하는 통합 loco-manipulation 연구가 주류로 자리잡고 있다. 특히 egocentric vision을 공통 관찰 공간으로 활용하여 보행과 조작을 연결하는 접근이 빠르게 확산되며, 이를 위한 벤치마크(HumanoidBench, LeVERB, BiCoord)도 함께 성숙해지고 있다.
Perceptive Terrain-Aware Robot Navigation · Physics-Based Character Motion Synthesis · Humanoid Teleoperation and Manipulation Interfaces · Reinforcement Learning Legged Robot Control [1617] [1753] [2166] [1901] [1640] [2081] [1678] [2007]
🏛 통합 loco-manipulation 성능을 평가하는 표준 벤치마크 개발을 국가 R&D 과제로 지정하고, 관련 평가 인프라를 공공 연구기관에 구축해야 한다.
Dexterous Hand Sensing and Actuation 45편
Humanoid Locomotion Mechanism Design 173편
Humanoid Teleoperation and Manipulation Interfaces 265편
Perceptive Terrain-Aware Robot Navigation 66편
Physics-Based Character Motion Synthesis 207편
Reinforcement Learning Legged Robot Control 464편
Robot State Estimation and Mapping 34편
Sim-to-Real Policy Transfer Methods 146편
Vision-Language Embodied Motion Control 229편
Generated by Claude Code · Humanoid Paper Curation · 2026-06-14

🎧 Audio Overview

이 Deep Research 답변을 팟캐스트형 오디오로 생성합니다. (Gemini · 키는 브라우저에만 저장 · 완성본은 이메일로도 전송)
▸ 고급: 구성 방향(대본 작성 지침) 직접 수정
속도 1.0x
⬇ MP3 다운로드