RAPID Hand: A Robust, Affordable, Perception-Integrated, Dexterous Manipulation Platform for Generalist Robot Autonomy
์ ์: Zhaoliang Wan, Zetong Bi, Zida Zhou, Hao Ren, Yiming Zeng, Yihan Li, Lu Qi, Xu Yang, Ming-Hsuan Yang, Hui Cheng | ๋ ์ง: 2025-06-09 | URL: https://arxiv.org/abs/2506.07490 📄 PDF
Essence
Figure 1: RAPID Hand is an open-source, low-cost, fully direct-driven robotic hand platform with
RAPID Hand๋ ์ ๋น์ฉ์ 20-DoF ๋ค์งํ ๋ก๋ด ์์ผ๋ก, ์๊ฐ, ์ด๊ฐ, ๊ณ ์ ๊ฐ๊ฐ์ ํตํฉํ ๋ฉํฐ๋ชจ๋ฌ ์ธ์ง ์์คํ
๊ณผ ๊ณ -DoF ์๊ฒฉ์กฐ์ข
์ธํฐํ์ด์ค๋ฅผ ํจ๊ป ์ค๊ณํ์ฌ ๋ก๋ด ์์จ์ฑ์ ์ํ ๊ณ ํ์ง ์กฐ์ ๋ฐ์ดํฐ ์์ง์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
Motivation
- Known: ๊ธฐ์กด ๋ฉํฐํ๊ฑฐ ๋ก๋ด ์ ํ๋ซํผ๋ค(Shadow Hand, Allegro Hand, LEAP Hand ๋ฑ)์ ๋์ ๋น์ฉ, ์ ์ง๋ณด์ ์ด๋ ค์, ๋ฉํฐ์ผ์ ํตํฉ์ ๋ถ์์ ์ฑ ๋ฑ์ผ๋ก ์ธํด ๊ด๋ฒ์ํ ๋ฐฐํฌ๊ฐ ์ ํ๋์ด ์๋ค.
- Gap: ์ ๋น์ฉ์ด๋ฉด์๋ ๋์ ๊ธฐ์ ์ฑ์ ๊ฐ์ถ ๋ค์งํ ์กฐ์ ํ๋ซํผ์ ๋ถ์กฑ๊ณผ ๊ธฐ์กด ์๊ฒฉ์กฐ์ข
๋ฐฉ๋ฒ๋ค์ด ๋ณต์กํ ๋ฉํฐํ๊ฑฐ ์์คํ
์์ ์ ๋ฐ๋์ ์์ ์ฑ ์ธก๋ฉด์์ ์ด๋ ค์์ ๊ฒช๊ณ ์๋ค.
- Why: ์ผ๋ฐํ๋ ๋ก๋ด ์์จ์ฑ ๋ฌ์ฑ์ ์ํด์๋ VLM ๊ธฐ๋ฐ ํ์ต์ ํ์ํ ๊ณ ํ์ง์ ๋ค์งํ ์กฐ์ ๋ฐ์ดํฐ๊ฐ ํ์์ ์ด๋ฉฐ, ์ ๊ทผ ๊ฐ๋ฅํ ๊ณ -DoF ํ๋ซํผ์ด ์ฌํ์ฑ ์๋ ์ฐ๊ตฌ๋ฅผ ์ด์งํ ์ ์๋ค.
- Approach: ์์ ์จํจ๋ก์ง ์ค๊ณ(20-DoF, ๋ณ๋ ฌ MCP ๊ด์ , 20mm ํ๊ฑฐ ๋๊ป), ํ๋์จ์ด ์์ค์ ๋ฉํฐ๋ชจ๋ฌ ์ธ์ง ํ๋ ์์ํฌ(sub-7ms ์ง์ฐ์๊ฐ๊ณผ ๊ณต๊ฐ ์ ๋ ฌ), ๊ทธ๋ฆฌ๊ณ ๊ณ -DoF ์๊ฒฉ์กฐ์ข
์ธํฐํ์ด์ค๋ฅผ ๊ณต๋ ์ต์ ํํ์ฌ ํตํฉ๋ ํ๋ซํผ์ ๊ตฌํํ๋ค.
Achievement
Figure 2: Finger Size & Kinematics Comparison. Comparison of RAPID, LEAP, and Allegro
- ์ปดํฉํธํ ์ ์จํจ๋ก์ง: 20mm ํ๊ฑฐ ๋๊ป๋ก LEAP(59mm) ๋๋น ํ๊ธฐ์ ์ผ๋ก ์ฌ๋ฆผํํ๋ฉด์ ์์ฐ์ค๋ฌ์ด ์ธ๊ฐํ ์ด๋ํ์ ์ ์งํ 20-DoF ์์ ๊ตฌ๋ ์ ์ค๊ณ
- ์์ ์ ์ธ ๋ฉํฐ์ผ์ ํตํฉ: wrist-mounted vision, fingertip tactile sensing, proprioception์ sub-7ms ์ง์ฐ์๊ฐ๊ณผ ๊ณต๊ฐ ์ ๋ ฌ ์กฐ๊ฑด์์ ์์ ์ ์ผ๋ก ํตํฉํ์ฌ ์ผ์ ๊ฐ์ญ๊ณผ ๋๋กญ์์ ์ ๊ฑฐ
- ๊ณ ํ์ง ๋ฐ์ดํฐ ์์ง: ๋ง์ถคํ ๊ณ -DoF ์๊ฒฉ์กฐ์ข
์ธํฐํ์ด์ค๋ฅผ ํตํด in-hand translation, rolling ๋ฑ ๋ณต์กํ ์ ์ด ๊ธฐ๋ฐ ์กฐ์ ์์
์ ๋ค์ํ ์์ฐ ๋ฐ์ดํฐ ์์ง
- ์ฐ์ํ ์ ์ฑ
์ฑ๋ฅ: diffusion policy๋ก ํ์ตํ ๊ฒฐ๊ณผ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค(TILDE, concurrent work)์ ๋นํด ๋ฉํฐํ๊ฑฐ retrieval ๋ฐ ์กฐ์ ์์ ์ฑ์์ ์ ์๋ฏธํ ์ฑ๋ฅ ํฅ์ ๋ฌ์ฑ
- ์คํ์์ค ์ ๊ทผ์ฑ: ์ ๋น์ฉ ํ์ค ๋ถํ๊ณผ 3D-ํ๋ฆฐํ
๋ ๋ชจ๋ ์ค๊ณ๋ก ๊ตฌ์ฑ๋ ์์ ๊ณต๊ฐ ํ๋ซํผ์ผ๋ก ์ฌํ์ฑ๊ณผ ๊ด๋ฒ์ํ ์ฑํ ๊ฐ๋ฅ์ฑ ์ ๊ณต
How
Figure 3: RAPID Hand with universal multi-phalangeal actuation scheme. The DIP and PIP
- universal multi-phalangeal actuation scheme ์ ์ฉ: ์์ ๊ด์ (DIP, PIP)์ ์ง์ ๊ตฌ๋, ๊ทผ์ ๊ด์ (MCP, CMC)์ ๋ณ๋ ฌ ๋ฉ์ปค๋์ฆ์ผ๋ก ๊ตฌ๋ํ์ฌ ํจ์จ์ ์ธ ๋
๋ฆฝ ์ ์ด ๋ฌ์ฑ
- segment-mounted motors์ ์ต์ ํ๋ ๋ ์ด์์์ผ๋ก ํ๊ฑฐ ๋๊ป ์ต์ํ
- ํ๋์จ์ด ์์ค ์ธ์ง ํ๋ ์์ํฌ: ์ปค์คํ
์ธ์ง ์ ์์ฅ๋น๋ฅผ ํตํด ๋ฉํฐ๋ชจ๋ฌ ์ผ์์ ์๊ฐ ๋๊ธฐํ์ ๊ณต๊ฐ ์ ๋ ฌ์ ์ ๋ฐํ๊ฒ ๊ตฌํ
- ๋ฉํฐ๋ชจ๋ฌ ์ธ์ง ํ์ฉ: vision, touch, proprioception ์ ๋ณด๋ฅผ ๊ฒฐํฉํ์ฌ ์ ์ด ๊ธฐ๋ฐ ์กฐ์ ํ์ต
- ๋ ๊ฐ์ง retargeting constraints๋ฅผ ์ ์ฉํ ๊ณ -DoF ์๊ฒฉ์กฐ์ข
์ธํฐํ์ด์ค ์ค๊ณ๋ก ๋ณต์กํ ์ ์ด๋ ์ ์ด ๊ฐ์ํ
- diffusion policy ํ์ต: ์์ง๋ ๊ณ ํ์ง ์์ฐ ๋ฐ์ดํฐ๋ก ์กฐ๊ฑด๋ถ ํ์ฐ ๋ชจ๋ธ ํ๋ จ
Originality
- ๊ธฐ์กด ์ ์ค๊ณ์ ๋ฌ๋ฆฌ ์ ์จํจ๋ก์ง, ์ธ์ง ํตํฉ, ์๊ฒฉ์กฐ์ข
์ธํฐํ์ด์ค๋ฅผ ๊ณต๋ ์ต์ ํํ ํตํฉ ์ค๊ณ ์ฒ ํ ๋์
- ํ๋์จ์ด ์์ค์์ ๋ฉํฐ๋ชจ๋ฌ ์ผ์๋ฅผ ์๊ฐ๊ณผ ๊ณต๊ฐ์ ์ผ๋ก ์ ๋ฐํ๊ฒ ๋๊ธฐํํ๋ ํ๋ ์์ํฌ์ ํ์ ์ ์ ์๋ก ๊ธฐ์กด 15-100ms ์ง์ฐ์๊ฐ์ sub-7ms๋ก ๋จ์ถ
- 20mm ํ๊ฑฐ ๋๊ป ๋ฌ์ฑ์ ์ค๊ณ์ ์ฐ์์ฑ๊ณผ ๋ณ๋ ฌ MCP ๋ฉ์ปค๋์ฆ์ robustํ๋ฉด์๋ ์์ฐ์ค๋ฌ์ด ๊ตฌํ
- ๋ฉํฐํ๊ฑฐ ์๊ฒฉ์กฐ์ข
์ ๊ณ ์ง์ ์ธ ์ ๋ฐ๋ยท์์ ์ฑ ๋ฌธ์ ๋ฅผ ๋ ๊ฐ์ง retargeting constraints๋ก ์ฒด๊ณ์ ์ผ๋ก ํด๊ฒฐ
Limitation & Further Study
- ํ์ฌ ์ธ ๊ฐ์ง in-hand manipulation ์์
์๋ง ๊ฒ์ฆ๋์์ผ๋ฏ๋ก ๋ค๋ฅธ ์กฐ์ ์นดํ
๊ณ ๋ฆฌ(๋๊ตฌ ์ฌ์ฉ, ๋ฌผ๊ฑด ์กฐ๋ฆฝ ๋ฑ)์ ๋ํ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ด ๋ถ๋ช
ํํจ
- diffusion policy ๊ธฐ๋ฐ ํ์ต ์ธ ๋ค๋ฅธ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉ ๊ฐ๋ฅ์ฑ๊ณผ ์ฑ๋ฅ ๋น๊ต๊ฐ ๋ถ์ฌํจ
- ๋๊ท๋ชจ ๋ฉํฐ๋ก๋ด ์์คํ
์์์ ์ค์๊ฐ ์ฑ๋ฅ, ๊ฐํํ์ต ๊ธฐ๋ฐ ์์ฒด ๊ฐ์ ๋ฅ๋ ฅ ๋ฑ์ด ํ๊ฐ๋์ง ์์
- ํ์ ์ฐ๊ตฌ๋ก๋ ๋ ๋ค์ํ ์กฐ์ ์์
์ ๋ํ ๋๊ท๋ชจ ๋ฐ์ดํฐ์
์์ง, ๋ค๋ฅธ ๊ณ ๊ธ ์ ์ฑ
ํ์ต ๋ฐฉ์์ ํตํฉ, ๊ทธ๋ฆฌ๊ณ ์ค์ ์ฐ์
์์ฉ ํ๊ฒฝ์์์ ์ฅ๊ธฐ ๋ด๊ตฌ์ฑ ํ๊ฐ ํ์
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: RAPID Hand๋ ์ ๋น์ฉ ๋ค์งํ ๋ก๋ด ์ ์ค๊ณ, ๊ณ ์ ๋ฐ ๋ฉํฐ๋ชจ๋ฌ ์ธ์ง ํตํฉ, ๊ทธ๋ฆฌ๊ณ ํจ๊ณผ์ ์ธ ์๊ฒฉ์กฐ์ข
์ธํฐํ์ด์ค๋ฅผ ํ์ ์ ์ผ๋ก ํตํฉํ ์คํ์์ค ํ๋ซํผ์ผ๋ก, ์ผ๋ฐํ๋ ๋ก๋ด ์์จ์ฑ ์ฐ๊ตฌ์ ํ์ํ ๊ณ ํ์ง ๋ฐ์ดํฐ ์์ง์ ๊ฐ๋ฅํ๊ฒ ํ๋ ์ค์ํ ๊ธฐ์ฌ์ด๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์