Dexterous Teleoperation of 20-DoF ByteDexter Hand via Human Motion Retargeting
์ ์: Ruoshi Wen, Jiajun Zhang, Guangzeng Chen, Zhongren Cui, Min Du, Yang Gou, Zhigang Han, Junkai Hu, Liqun Huang, Hao Niu, Wei Xu, Haoxiang Zhang, Zhengming Zhu, Hang Li, Zeyu Ren | ๋ ์ง: 2025-07-04 | URL: https://arxiv.org/abs/2507.03227 📄 PDF
Essence
Figure 2 An overview of the proposed hand-arm teleoperation system. The teleoperation interface consists of a Meta
ByteDexter๋ผ๋ 20-DoF ๋งํฌ๊ตฌ๋ ๋ก๋ด ์๊ณผ optimization ๊ธฐ๋ฐ motion retargeting์ ์ด์ฉํ์ฌ ์ธ๊ฐ์ ์ ์์ง์์ ์ค์๊ฐ์ผ๋ก ๋ก๋ด์ ์ฌํํ๋ ์๊ฒฉ์กฐ์ข
์์คํ
์ ์ ์ํ๋ค.
Motivation
- Known: Imitation learning์ ์ธ๊ฐ์ ์์ฌ์ฃผ๋ฅผ ๋ก๋ด์ ์ ์ดํ ์ ์๋ ์ ๋งํ ๋ฐฉ์์ด๋, ๊ณ ํ์ง์ ์ธ๊ฐ ์์ฐ ๋ฐ์ดํฐ ํ๋์ด ๊ณผ์ ์ด๋ค. ๊ธฐ์กด teleoperation ์์คํ
์ ์ธ๊ฐ-๋ก๋ด ๊ฐ kinematic ๋ถ์ผ์น๋ก ์ธํด operator์ ์ธ์ง ๋ถ๋ด์ด ํฌ๊ณ ์ค๋ฅ๊ฐ ๋ฐ์ํ๊ธฐ ์ฝ๋ค.
- Gap: ๊ณ -DoF ๋ก๋ด ์์ ์ ์ด์ ์ค์๊ฐ motion retargeting ๊ธฐ์ ์ด ์ถฉ๋ถํ ๋ฐ๋ฌํ์ง ์์, ์ธ๊ฐ ์์ค์ ์ฌ์ธํ ์์ฌ์ฃผ๋ฅผ ๋ก๋ด์ด ์ ํํ ์ฌํํ๊ธฐ ์ด๋ ต๊ณ , ๊ณ ํ์ง์ demonstration ๋ฐ์ดํฐ ์์ฑ์ด ์ ํ์ ์ด๋ค.
- Why: ๋ก๋ด์ด ์ธ๊ฐ์ ์ํ ํ๊ฒฝ์์ ์ผ์์ ์ธ ์กฐ์ ์์
์ ์ํํ๋ ค๋ฉด ๋์ ์์ค์ ์์ฌ์ฃผ๊ฐ ํ์์ ์ด๋ฉฐ, ๊ณ ํ์ง์ demonstration data๋ imitation learning ์ ์ฑ
์ ํจ๊ณผ๋ฅผ ๊ฒฐ์ ํ๋ ํต์ฌ ์์์ด๋ค.
- Approach: ByteDexter ์๊ณผ Meta Quest 3 + Manus Quantum Metaglove๋ฅผ ํตํด human hand pose๋ฅผ ์ถ์ ํ๊ณ , optimization ๊ธฐ๋ฐ motion retargeting์ผ๋ก human-robot kinematic ์ฐจ์ด๋ฅผ ํด๊ฒฐํ์ฌ ์ค์๊ฐ ๊ณ ์ถฉ์ค๋ ์ฌํ์ ๋ฌ์ฑํ๋ค.
Achievement
Figure 1 Our hand-arm teleoperation system achieves dexterous in-hand manipulation, including multi-object grasping,
- 20-DoF ๋งํฌ๊ตฌ๋ ๋ก๋ด ์ ์ค๊ณ: ์๋ก์ด thumb mechanism์ผ๋ก ์ธ๊ฐ ๊ฐ์ decoupled thumb mobility๋ฅผ ๊ตฌํํ๊ณ , ์ปดํฉํธํ ํํ(255ร118ร77 mmยณ, 1.3 kg)์์ 20 DoF๋ฅผ ๋ฌ์ฑ
- ์ค์๊ฐ kinematics solver: Ceres Solver๋ฅผ ์ด์ฉํ์ฌ forward/inverse kinematics๋ฅผ microsecond ์์ค์์ ๊ณ์ฐํ์ฌ 100 Hz ์ ์ด ๋ฃจํ ์ง์
- Motion retargeting ํ๋ ์์ํฌ: Human hand pose๋ก๋ถํฐ ByteDexter joint position์ optimization์ผ๋ก ๊ณ์ฐํ์ฌ kinematic ๋ถ์ผ์น๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐ
- ํตํฉ hand-arm system: 27 DoF(์ 20 + ํ 7)์ seamless coordination์ผ๋ก ์ฅ์๊ฐ ๋ณต์กํ ์กฐ์ ์์
์ํ
- ์ค์ฆ์ ์ฑ๋ฅ: 9๊ฐ ๋ฌผ์ฒด๊ฐ ์๋ ๋ณต์กํ ๋ฉ์ดํฌ์
ํ
์ด๋ธ ์ ๋ฆฌ ์์
์ ํฌํจํ in-hand manipulation ๋ฐ multi-object grasping ์ฑ๊ณต
How
Figure 4 Hand keypoint vectors.
- Meta Quest 3๋ก wrist pose ์ถ์ , Manus Quantum Metaglove๋ก hand motion ์ถ์ (120 Hz sampling)
- Human hand pose๋ฅผ 25๊ฐ landmarks๋ก ํํํ๊ณ keyvector ๊ธฐ๋ฐ optimization formulation ์ ์ฉ
- Keyvector discrepancy๋ฅผ ์ต์ํํ๋ constrained nonlinear equations๋ฅผ Ceres Solver๋ก ํด๊ฒฐ
- ByteDexter์ parallel-serial finger topology์ novel thumb mechanism์ผ๋ก human-like dexterity ๊ตฌํ
- Dynamic joint position limit ์กฐ์ ์ผ๋ก feasible joint command๋ง motor drivers๋ก ์ ๋ฌ
- Franka FR3 arm๊ณผ ํตํฉํ์ฌ wrist pose๋ ์ง์ ๋งคํ, hand motion์ retargeting์ผ๋ก ์ฒ๋ฆฌ
Originality
- ๊ธฐ์กด parallel-serial topology๋ฅผ ๊ฐ์ ํ ์๋ก์ด thumb mechanism: ์ธ ๊ฐ actuator๋ก ๋ค ๊ฐ DoF๋ฅผ ๊ตฌ๋ํ๋ฉฐ MCP/PIP flexion๊ณผ abduction-adduction์ decoupled๋ก ๋ฌ์ฑ
- Explicit frame-to-frame transformation ๊ธฐ๋ฐ kinematics: ๊ธฐ์กด์ frame-specific trigonometric expansion ๋์ ์ฒด๊ณ์ ์ธ forward/inverse kinematics ์ ๋๋ก broader applicability ํ๋ณด
- Keyvector ๊ธฐ๋ฐ motion retargeting: Hand keypoint ๊ฐ 3D vector๋ฅผ ์ต์ํํ์ฌ ๊ธฐ์กด one-to-one joint mapping์ ํ๊ณ๋ฅผ ๊ทน๋ณต
- Integrated teleoperation + high-DoF control: Quest์ Manus glove๋ฅผ ๊ฒฐํฉํ์ฌ natural, intuitive interface ์ ๊ณตํ๋ฉด์ 27 DoF seamless coordination ๋ฌ์ฑ
Limitation & Further Study
- Glove ๊ธฐ๋ฐ ์ถ์ ์ ํ๊ณ: ์ฌ์ฉ์ ํธ์์ฑ ์ ํ, calibration ์ค๋ฒํค๋ ์กด์ฌ (vision ๊ธฐ๋ฐ์ occlusion ๋ฌธ์ ๋ ํํผํ๋ ๋ค๋ฅธ ์ ์ฝ)
- Motion retargeting์ ์ผ๋ฐํ ํ๊ณ: Hand size ์ฐจ์ด์ ๋ํ scaling ๋ฉ์ปค๋์ฆ์ด ๊ตฌ์ฒด์ ์ผ๋ก ๊ธฐ์ ๋์ง ์์. ๋ค์ํ ์ธ๊ฐ ์ ํฌ๊ธฐ์ ๋ํ robustness ํ๊ฐ ๋ถ์กฑ
- ์คํ ๋ฒ์์ ์ ํ์ฑ: Makeup table organization ๋ฑ ์ ํ๋ task์์๋ง ํ๊ฐ. ๋ค์ํ object property(material, mass, shape)์ ์กฐ์์ ๋ํ systematic evaluation ๋ถ์ฌ
- Contact-rich manipulation์ ์์ ์ฑ: Optimization ๊ธฐ๋ฐ retargeting์ด ํญ์ stable grasp๋ฅผ ๋ณด์ฅํ๋์ง, collision risk handling์ explicit mechanism ๋ถ๋ช
ํ
- ํ์ ์ฐ๊ตฌ: (1) Vision-based hand tracking๊ณผ์ fusion์ผ๋ก glove์์กด๋ ๊ฐ์, (2) Imitation learning๊ณผ์ integration์ผ๋ก demonstration data ํ์ฉ ์ค์ฆ, (3) ๋ค์ํ object์ ํ๊ฒฝ์์์ robustness ํ๊ฐ, (4) ํ ์ ์ด(force feedback) ํตํฉ์ผ๋ก ์๊ฒฉ์กฐ์ข
๋ชฐ์
๊ฐ ๊ฐํ
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ByteDexter ์์คํ
์ linkage-driven ์์ mechanical design, fast kinematics solver, ๊ทธ๋ฆฌ๊ณ optimization ๊ธฐ๋ฐ motion retargeting์ ์ ๊ตํ๊ฒ ํตํฉํ์ฌ ๊ณ -DoF ๋ก๋ด ์์ ์๊ฒฉ์กฐ์ข
์ ์คํํ๋ ์๋ฏธ ์๋ ๊ธฐ์ฌ๋ฅผ ์ ์ํ๋ค. ์ค์๊ฐ ์ ์ด์ ๊ณ ํ์ง demonstration data ์์ฑ์ด๋ผ๋ ์ค์ฉ์ ๊ฐ์น๊ฐ ๋์ง๋ง, ๋ค์ํ task ํ๊ฒฝ์์์ general robustness์ imitation learning ๊ฒฐ๊ณผ์ ์ค์ฆ์ด ํ์ํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์