PaCo-VLA: Passivity-Shielded Compliance Prior for Contact-Rich Vision-Language-Action Manipulation

저자: Haofan Cao, Zhaoyang Li, Zhichao You, Liang Guo, Tianrui Li | 날짜: 2026 | DOI: 10.48550/ARXIV.2606.00515 📄 PDF


Essence

Figure 2

Figure 2: Runtime shield mechanisms. (a) Box projection maps unfiltered proposals into Θbox;

본 논문은 Vision-Language-Action (VLA) 모델을 contact-rich manipulation 작업에 안전하게 적용하기 위해 PaCo-VLA라는 passivity-shielded compliance prior를 제안한다. VLA의 저주기 출력을 직접 모터 명령으로 사용하지 않고, 대신 high-frequency proposal-independent passivity shield를 통해 semantic proposal을 filtering하여 contact dynamics의 안전성을 보장한다.

Motivation

Achievement

Figure 2

Figure 2: Runtime shield mechanisms. (a) Box projection maps unfiltered proposals into Θbox;

1. PaCo-VLA framework: VLA-to-compliance 인터페이스를 제안하여 learned model의 semantic proposal과 low-level passivity shield를 명확히 분리한다. 2. Sampled-admittance passivity contract: Box projection, energy-tank accounting, force/torque monitoring을 결합한 proposal-independent runtime contract를 개발하여 zero passivity violation을 달성한다. 3. Causal evaluation protocol: Paired counterfactual trial을 통해 semantic value를 shield/recovery effect로부터 isolation하고, 다양한 perturbation 조건(shuffled language, masked images, wrong-object instruction 등)으로 robustness를 검증한다. 4. Experimental validation: Simulated/real-world connector-insertion 실험에서 unshielded VLA baseline 대비 superior precision을 달성하며, adversarial compliance shift 하에서도 passivity violation을 방지한다.

How

Figure 1

Figure 1: PaCo-VLA overview. Vanilla VLA sends low-rate action chunks directly toward the plant,

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

총평: 본 논문은 VLA의 semantic generalization과 contact-rich manipulation의 safety requirement를 reconcile하는 실질적이고 principled된 framework를 제시한다. Passivity-shielded interface와 paired counterfactual evaluation protocol은 methodologically 견고하며, zero passivity violation과 superior precision의 실험 결과는 접근법의 실효성을 입증한다. 다만 task diversity 제한과 보다 일반적인 compliance model에 대한 확장성 논의가 있으면 더욱 강화될 것이다.

← 목록으로 돌아가기

🎧 Audio Overview

이 논문 리뷰를 팟캐스트형 오디오로 생성합니다. (Gemini · 키는 브라우저에만 저장 · 완성본은 이메일로도 전송)
▸ 고급: 구성 방향(대본 작성 지침) 직접 수정
속도 1.0x
⬇ MP3 다운로드