HITTER: A HumanoId Table TEnnis Robot via Hierarchical Planning and Learning
์ ์: Zhi Su, Bike Zhang, Nima Rahmanian, Yuman Gao, Qiayuan Liao, Caitlin Regan, Koushil Sreenath, S. Shankar Sastry | ๋ ์ง: 2025-09-04 | DOI: 10.48550/arXiv.2508.21043 📄 PDF
Essence
Fig. 2: System overview. (a) The racket is mounted on the robotโs right wrist using a 3D-printed connector, and the ball
ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ด ํ๊ตฌ๋ฅผ ํ๊ธฐ ์ํ ๊ณ์ธต์ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, model-based planner์ RL ๊ธฐ๋ฐ whole-body controller๋ฅผ ํตํฉํ์ฌ sub-second ๋ฐ์ ์๊ฐ ๋ด์ ์ด๋น 5 m/s ์ด์์ ๋ณผ์ ์ฒ๋ฆฌํ๋ค.
Motivation
- Known: ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ๋ณดํ ๋ฐ whole-body control์์ ์ง์ ์ ์ด๋ฃจ์์ผ๋, ๋น ๋ฅธ ๋์ ํ๊ฒฝ์์์ ์กฐ์ ์์
์ด ์ ํ์ ์ด๋ค. ๋ก๋ด ํ๊ตฌ๋ ๊ณ ์ ์ธ์, ๊ณํ, ์ ์ด์ ํ
์คํธ๋ฒ ๋๋ก ํ์ฉ๋์ด ์๋ค.
- Gap: ๊ธฐ์กด ํด๋จธ๋
ธ์ด๋๋ ์ ์ ํ๊ฒฝ์์์ ์ ์ด์ ์ง์คํ์ผ๋ฉฐ, ์ ํ ์ฐ๊ตฌ๋ ์ ์๋ฆฌ์์๋ง ํ๋ ์ดํ์ฌ ํจ๊ณผ์ ์ธ ํ๊ฒฉ ๋ฒ์๊ฐ ์ ํ๋์๋ค. ๋ฏผ์ฒฉํ ๋ณดํ๊ณผ ํจ๊ป ์ธ๊ฐ๋ค์ด striking motion์ ๋ณด์ด๋ humanoid table tennis์ด ๋ถ์ฌํ๋ค.
- Why: ํ๊ตฌ๋ ๊ทน๋๋ก ์งง์ ๋ฐ์ ์๊ฐ, ์ ์ ํ๋ ฅ ์ ์ด, ์ฐ์ ๋ ๋ฆฌ์์์ ๊ท ํ ํ๋ณต์ด ํ์ํ๋ฏ๋ก ๋ฏผ์ฒฉํ๊ณ ์ํธ์์ฉ์ ์ธ ๋ก๋ด ํ๋์ ์คํํ๋ ๋ฐ ์ด์์ ์ธ ํ
์คํธ๋ฒ ๋์ด๋ค.
- Approach: ๊ณ์ธต์ ๊ตฌ์กฐ๋ก ์ค๊ณํ์ฌ, ์์ ๊ณํ ๋จ๊ณ์์ model-based planner๊ฐ ๋ณผ ๊ถค์ ์์ธก ๋ฐ striking position/velocity/timing์ ๊ฒฐ์ ํ๊ณ , ํ์ ์ ์ด ๋จ๊ณ์์ RL ๊ธฐ๋ฐ WBC policy๊ฐ human motion references๋ฅผ ํฌํจํ์ฌ human-likeํ ์ ์ ๋์์ ์์ฑํ๋ค.
Achievement
Fig. 1: Humanoid table tennis rallies. Our system enables both humanoid-humanoid (left) and humanoid-human (right) match
- ๊ณ์ธต์ ํ๋ ์์ํฌ: model-based planner์ RL ๊ธฐ๋ฐ whole-body controller๋ฅผ ํตํฉํ์ฌ ๋น ๋ฅธ ๊ถค์ ์์ธก, ์์ ์ ์ธ ์ธํฐํ์ด์ค ์ ๊ณต, ํจ์จ์ ์ธ ํ๋ จ์ ๋ฌ์ฑ
- Human-like Striking Skills: ํ์ ํ๋ ฅ์ ๋์๊ณผ ๋ค๋ฆฌ์ ๋ฏผ์ฒฉํ ์์ง์์ ๊ฒฐํฉํ์ฌ ์ธ๊ฐ๋ค์ด ์ ์ ํ๊ฒฉ ๋ฅ๋ ฅ ๊ฐ๋ฐ
- ์ค์ ์ธ๊ณ ๊ฒ์ฆ: ์ต๋ 106๊ฐ์ ์ฐ์ ์ท์ ์ธ๊ฐ ์๋๋ก ๋ฌ์ฑํ๊ณ , humanoid-humanoid ๋ฐ humanoid-human ๋ ๋ฆฌ ๋ชจ๋ ์์ฐ
How
Fig. 2: System overview. (a) The racket is mounted on the robotโs right wrist using a 3D-printed connector, and the ball
- Motion capture ์์คํ
(360 Hz, millimeter-level accuracy)์ผ๋ก ๋ณผ ์์น ์ถ์
- Least-squares fitting์ ํตํด ball velocity ์ถ์ (31๊ฐ position measurements ์ฌ์ฉ)
- Hybrid dynamics model (aerodynamic drag + gravity)์ ์ฌ์ฉํ ball trajectory prediction
- Model-based planner์์ striking position, velocity, timing ๊ณ์ฐ
- RL์ ํตํ WBC policy ํ๋ จ (human motion references ํฌํจ, simulation์์ ์ค์)
- Unitree G1 humanoid์ 29๊ฐ joint๋ฅผ 50 Hz๋ก ์ ์ด (PD controller๋ก ํ ํฌ ๋ณํ)
- ์ฐ์ strikes๋ฅผ ํฌํจํ ํ๋ จ์ผ๋ก agile motions๊ณผ balance recovery ํ์ต
Originality
- General-purpose humanoid robot์์ agile locomotion์ ํฌํจํ table tennis play์ ์ฒซ ์์ฐ
- Model-based planner์ RL-based whole-body controller์ ์๋ก์ด hierarchical integration
- Minimum human motion references (2๊ฐ์ง)๋ง์ผ๋ก natural movements๋ฅผ ์ ๋ํ๋ ๋ฐฉ๋ฒ๋ก
- Sub-second perception-action loop๋ฅผ ๊ฐ์ถ fully autonomous humanoid interactive control
Limitation & Further Study
- Motion capture system์ ์์กด์ฑ: ์ค์ ๋ฐฐํฌ ์ onboard vision์ผ๋ก ๋์ฒด ํ์
- Ball trajectory prediction์ด spin effect๋ฅผ ๋ฌด์ํ๋ค๋ ๊ฐ์ (์ถฉ๋ถํ ์์ spin๋ง ์ฒ๋ฆฌ ๊ฐ๋ฅ)
- ํน์ ํ๋์จ์ด(Unitree G1, 9 OptiTrack cameras)์ ์์กด์ ์ธ ์ค๊ณ
- Opponent modeling ๋ฐ ์ ๋ต์ ํ๋ ์ด ๋ถ์ฌ: ํ์ฌ๋ ๋ฐ์์ ํ๋ ์ด๋ง ๊ฐ๋ฅ
- ์ผ๋ฐํ์ฑ: ๋ค๋ฅธ ๋์ ์ํธ์์ฉ ์์
(์: ๋ฐฐ๋๋ฏผํด, ํ
๋์ค)์ผ๋ก์ ํ์ฅ์ฑ ๋ฏธ๊ฒ์ฆ
- ํ์ ์ฐ๊ตฌ: onboard perception ๋์
, spin ๊ณ ๋ ค ํ์ฅ, opponent intent ์์ธก ํตํฉ, ๋ ๋ค์ํ striking techniques ํ์ต
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ humanoid table tennis๋ฅผ ํตํด ๊ณ ์ ๋์ ํ๊ฒฝ์์์ ์ ์ ์ ์ด ๋ฐ ์ํธ์์ฉ์ ์ฒ์์ผ๋ก ์ฑ๊ณต์ ์ผ๋ก ์์ฐํ์์ผ๋ฉฐ, ๊ณ์ธต์ planning-control ํตํฉ๊ณผ minimal human references๋ฅผ ํตํ ์ฐ์ํ ์ ๊ทผ๋ฒ์ด ์ธ์์ ์ด๋ค. ์ค์ ์ธ๊ณ ๊ฒ์ฆ(106 ์ฐ์ ์ท)์ ๋ฐฉ๋ฒ๋ก ์ ์ค์ฉ์ฑ์ ๊ฐ๋ ฅํ ์
์ฆํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์