ACE: A Cross-Platform Visual-Exoskeletons System for Low-Cost Dexterous Teleoperation
์ ์: Shiqi Yang, Minghuan Liu, Yuzhe Qin, Runyu Ding, Jialong Li, Xuxin Cheng, Ruihan Yang, Sha Yi, Xiaolong Wang | ๋ ์ง: 2024-08-21 | URL: https://arxiv.org/abs/2408.11805 📄 PDF
Essence
Figure 1: An Overview of the Proposed ACE System. The system consists of two bimanual ex-
ACE๋ 3D ํ๋ฆฐํ
๋ ์ด์คํ exoskeleton๊ณผ hand-facing ์นด๋ฉ๋ผ๋ฅผ ๊ฒฐํฉํ ์ ๋น์ฉ cross-platform ์๊ฐ ๊ธฐ๋ฐ ์๊ฒฉ ์กฐ์ข
์์คํ
์ผ๋ก, ๋ค์ํ ๋ก๋ด ํ๋ซํผ๊ณผ end-effector์ ๋ํด ์ ๋ฐํ ์๊ณผ ์๋ชฉ ์์ธ ์ถ์ ์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
Motivation
- Known: VR ์์คํ
, motion capture, wearable glove ๋ฑ ๋ค์ํ ์๊ฒฉ ์กฐ์ข
๋ฐฉ์๊ณผ ALOHA, GELLO ๋ฑ ๋ก๋ด ๊ธฐ๋ฐ ๋ฐ์ดํฐ ์์ง ์์คํ
์ด ๊ฐ๋ฐ๋์์ผ๋ฉฐ, ์ต๊ทผ teleoperation์ ํตํ ๋๊ท๋ชจ ๋ก๋ด ๋ฐ์ดํฐ ์์ง์ด ๊ฐ์กฐ๋๊ณ ์๋ค.
- Gap: ๊ธฐ์กด ์์คํ
๋ค์ ๋์ ๋น์ฉ, ํน์ ๋ก๋ด์๋ง ๋ง์ถ hardware customization ํ์, ๋๋ ์ ํ๋ ์ ํ๋์ ๋ฌธ์ ๋ฅผ ๊ฐ์ง๊ณ ์์ด์ ๋ค์ํ end-effector์ ํ๋ซํผ์ ๊ฑธ์ณ ์๋ํ๋ ์ ๋น์ฉ์ ์ฌ์ฉ์ ์นํ์ ์์คํ
์ด ๋ถ์กฑํ๋ค.
- Why: ๋ก๋ด ์ฌ๋จ ๋ชจ๋ธ ํ์ต์ ์ํ ๋๊ท๋ชจ ์ค์ธ๊ณ ๋ฐ์ดํฐ ์์ง์ ํจ์จ์ ์ด๊ณ cross-platform ํธํ์ฑ์ ๊ฐ์ถ ์๊ฒฉ ์กฐ์ข
์์คํ
์ด ํ์์ ์ด๋ฉฐ, ์ด๋ฅผ ํตํด ๋ค์ํ ๋ก๋ด ํ๋ซํผ์์์ ๋ณต์กํ ์กฐ์ ์์
ํ์ต์ด ๊ฐ๋ฅํด์ง๋ค.
- Approach: Hand-facing ์นด๋ฉ๋ผ๋ก 3D ์ ์์ธ๋ฅผ ์ถ์ ํ๊ณ exoskeleton์ forward kinematics๋ก end-effector ์์น๋ฅผ ์ธก์ ํ ํ, inverse kinematics๋ฅผ ํตํด ๋ก๋ด ํ์ end-effector์ ๋งคํํ๋ ๋ชจ๋์ ์ค๊ณ ๊ธฐ๋ฐ์ ์๊ฐ-kinematics ํ์ด๋ธ๋ฆฌ๋ ์ ๊ทผ๋ฒ์ ์ฌ์ฉํ๋ค.
Achievement
Figure 4: Details of Cross-Platform Teleoperation. This figure showcases various control modes
- Cross-platform ํธํ์ฑ: ๋จ์ผ ์์คํ
์ผ๋ก humanoid hands, arm-hands, arm-gripper, quadruped-gripper ๋ฑ ๋ค์ํ end-effector์ fixed/mobile base ๋ก๋ด ํ๋ซํผ์ ์ง์
- ์ ๋น์ฉ ์ค๊ณ: 3D ํ๋ฆฐํ
exoskeleton๊ณผ ์ ๋น์ฉ ์น์บ ์ ์ฌ์ฉํ์ฌ ์ฝ $0.6k์ ๋น์ฉ์ผ๋ก ALOHA($20k), Mobile-ALOHA($32k), DexCap($4k)๋ณด๋ค ํจ์ฌ ์ ๋ ดํ ์์คํ
๊ตฌํ
- ๋์ ์ ํ๋: Hand pose ์ถ์ ์ vision๊ณผ kinematics๋ฅผ ๊ฒฐํฉํ์ฌ vision ๋จ๋
๋ฐฉ์(AnyTeleop)๋ณด๋ค ์ ํํ hand root end-effector ์์น ์ธก์
- ์ฌ์ฉ์ ์นํ์ฑ: ์ต์ํ์ calibration์ผ๋ก ์๋ก ๋ค๋ฅธ ์ฒดํ์ ์ฌ์ฉ์๊ฐ ์ง๊ด์ ์ผ๋ก ์กฐ์ ๊ฐ๋ฅํ๋๋ก ์ค๊ณ
- ์ค์ฆ๋ ์ฑ๋ฅ: Imitation learning ์คํ์ ํตํด ๋ค์ํ ์ ๋ฐ๋์ workspace ์๊ตฌ์ฌํญ์ ๊ฐ์ง ์์
์์ ํจ์จ์ ์ธ ๋ฐ์ดํฐ ์์ง ๋ฐ ํ์ต ๋ฅ๋ ฅ ์
์ฆ
How
Figure 2: Architecture of the ACE Teleoperation System. Our system reads the joint angles from
- Hand detection algorithm์ ํตํ 3D ์ ์์ธ ์ถ์ (hand-facing ์นด๋ฉ๋ผ๋ก occlusion ๋ฌธ์ ํด๊ฒฐ)
- Exoskeleton์ motor joint angles๋ฅผ ์ฝ์ด forward kinematics์ผ๋ก ์๋ชฉ(wrist) ์์ธ ๊ณ์ฐ
- Hand Mode์ Gripper Mode๋ฅผ ํตํด anthropomorphic hands์ parallel-jaw grippers ๋ชจ๋ ์ง์
- Inverse kinematics ๊ธฐ๋ฐ motion retargeting์ผ๋ก ์ธ๊ฐ์ ์ end-effector ์์น๋ฅผ ๋ก๋ด arm end-effector์ ๋งคํ
- Modular base design์ผ๋ก fixed desktop base์ mobile base ๊ฐ ์ฌ์ด ์ ํ ๊ฐ๋ฅ
- 3D ํ๋ฆฐํ
๊ธฐ๋ฐ exoskeleton์ผ๋ก ๋น์ฉ ์ ๊ฐ ๋ฐ ์ ์ง๋ณด์ ์ฉ์ด์ฑ ํ๋ณด
Originality
- Vision-kinematics ํ์ด๋ธ๋ฆฌ๋ ์ ๊ทผ: ๊ธฐ์กด์ ์์ vision ๊ธฐ๋ฐ(AnyTeleop)์ด๋ ์์ kinematics ๊ธฐ๋ฐ(ALOHA, GELLO) ์์คํ
๊ณผ ๋ฌ๋ฆฌ, hand pose tracking์ vision์ผ๋ก, end-effector ์์น๋ exoskeleton์ forward kinematics๋ก ์ธก์ ํ์ฌ ๋ ์ฅ์ ์ ๊ฒฐํฉ
- Camera-on-exoskeleton design: Hand-facing ์นด๋ฉ๋ผ๋ฅผ exoskeleton end-effector์ ํ์ฌํ์ฌ vision ๊ธฐ๋ฐ ์์คํ
์ ๊ทผ๋ณธ์ ์ธ occlusion ๋ฌธ์ ํด๊ฒฐ
- Cross-platform motion retargeting: ์ธ๊ฐ์ ์ morphology์ ๋ก๋ด ์์ morphology๊ฐ ์ผ์นํ์ง ์์๋ inverse kinematics๋ฅผ ํตํด ์ ๋ฐํ control ๊ฐ๋ฅํ๋๋ก ์ค๊ณ
- ๋น์ฉ-์ ํ๋-์ ์ฐ์ฑ์ ์ต์ ์กฐํฉ: ๊ธฐ์กด ์์คํ
๋ค์ด ๋น์ฉ, ์ ํ๋, ์ ์ฐ์ฑ ์ค ์ผ๋ถ๋ฅผ ํฌ๊ธฐํ๋ค๋ฉด, ACE๋ ์ธ ๊ฐ์ง ๋ชจ๋๋ฅผ ๋์์ ๋ฌ์ฑ
Limitation & Further Study
- Hand pose estimation ์๊ณ ๋ฆฌ์ฆ์ ์ ํ๋ ํ๊ณ๋ก ์ธํ finger-level control ์ค๋ฅ ๊ฐ๋ฅ์ฑ
- Mobile base ์ํฉ์์์ wrist pose ์ถ์ ์์ ์ฑ ๋ฐ latency์ ๋ํ ์์ธํ ๋ถ์ ๋ถ์กฑ
- ๋งค์ฐ ๋ณต์กํ ์๊ฐ๋ฝ ์ํธ์์ฉ์ด ํ์ํ ์์
(์: ์ธ๋ฐํ ์กฐ์)์์์ ์ฑ๋ฅ ๊ฒ์ฆ ์ ํ์
- Different robot morphology๋ก์ motion transfer ์ ์์ค๋๋ ์ ๋ณด์ ๊ทธ์ ๋ฐ๋ฅธ ๋ฐ์ดํฐ ํ์ง ์ํฅ ๋ถ์ ํ์
- ํ์ ์ฐ๊ตฌ: (1) ๋ ์ ๊ตํ hand pose estimation ๋ชจ๋ธ ์ ์ฉ, (2) Force feedback์ ํฌํจํ haptic teleoperation์ผ๋ก ํ์ฅ, (3) ๋ ๋ค์ํ robot platform๊ณผ ์์
์ ๋ํ large-scale ๊ฒ์ฆ
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ACE๋ ๊ธฐ์กด ์๊ฒฉ ์กฐ์ข
์์คํ
์ ๋น์ฉ-์ ํ๋-์ ์ฐ์ฑ trade-off๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ ์ค์ฉ์ ์ธ ์๋ฃจ์
์ผ๋ก, ์ ๋น์ฉ์ 3D ํ๋ฆฐํ
exoskeleton๊ณผ vision-kinematics ํ์ด๋ธ๋ฆฌ๋ ๋ฐฉ์์ ํตํด ๋ค์ํ ๋ก๋ด ํ๋ซํผ์์์ ๋๊ท๋ชจ ๋ฐ์ดํฐ ์์ง์ ๊ฐ๋ฅํ๊ฒ ํ๋ค๋ ์ ์์ ๋์ ๊ฐ์น๋ฅผ ์ ๊ณตํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์