PHUMA: Physically-Grounded Humanoid Locomotion Dataset
์ ์: Kyungmin Lee, Sibeen Kim, Minho Park, Hyunseung Kim, Dongyoon Hwang, Hojoon Lee, Jaegul Choo | ๋ ์ง: 2025-10-30 | URL: https://arxiv.org/abs/2510.26236 📄 PDF
Essence
Figure 1: Physical reliability of Humanoid-X vs. PHUMA. Each column illustrates four failure
PHUMA๋ ๋๊ท๋ชจ ์ธํฐ๋ท ๋น๋์ค๋ก๋ถํฐ ์ธ๊ฐ๋ค์ด ๋ณดํ์ ์ํ ๋ฌผ๋ฆฌ์ ์ผ๋ก ํ๋นํ ํด๋จธ๋
ธ์ด๋ ๋ชจ์
๋ฐ์ดํฐ์
์ ๊ตฌ์ถํ๋ฉฐ, ๋ฐ์ดํฐ ํ๋ ์ด์
๊ณผ physics-constrained retargeting์ ํตํด floating, penetration, foot skating ๋ฑ์ ๋ฌผ๋ฆฌ์ artifacts๋ฅผ ์ ๊ฑฐํ๋ค.
Motivation
- Known: AMASS ๊ฐ์ ๋ชจ์
์บก์ฒ ๋ฐ์ดํฐ์
์ ๋ฌผ๋ฆฌ์ ์ผ๋ก ์ ๋ขฐ์ฑ ์์ผ๋ ๊ท๋ชจ๊ฐ ์๊ณ ๋ค์์ฑ์ด ๋ถ์กฑํ๋ฉฐ, Humanoid-X๋ ์ธํฐ๋ท ๋น๋์ค๋ฅผ ๋๊ท๋ชจ๋ก ํ์ฉํ์ง๋ง ์ฌ๊ฐํ ๋ฌผ๋ฆฌ์ artifacts๋ฅผ ํฌํจํ๋ค.
- Gap: ๊ธฐ์กด ๋น๋์ค ๊ธฐ๋ฐ ๋ชจ์
๋ฐ์ดํฐ์
๋ค์ video-to-motion ๋ณํ ๊ณผ์ ์์ ๋ฐ์ํ๋ joint violations, floating, penetration ๋ฌธ์ ์ retargeting ๋จ๊ณ์ ๋ฌผ๋ฆฌ์ ๋ถ์ ํ์ฑ์ผ๋ก ์ธํ foot skating์ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ์ง ๋ชปํ๋ค.
- Why: ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ์์ ์ ์ด๊ณ ์ธ๊ฐ๋ค์ด ๋ณดํ์ ์ํด์๋ ๋๊ท๋ชจ์ด๋ฉด์๋ ๋ฌผ๋ฆฌ์ ์ผ๋ก ์ ๋ขฐ์ฑ ์๋ ๋ชจ์
๋ฐ์ดํฐ๊ฐ ํ์์ ์ด๋ฉฐ, ์ด๋ motion imitation ๊ธฐ๋ฐ์ reinforcement learning ์ ์ฑ
ํ์ต์ ์ฑ๋ฅ์ ํฌ๊ฒ ์ข์ฐํ๋ค.
- Approach: Humanoid-X ๋ฐ์ดํฐ์
์ ๊ธฐ๋ฐ์ผ๋ก ๋ ๋จ๊ณ ํ์ดํ๋ผ์ธ์ ์ ์ฉํ๋ค: (1) ๋ฌผ๋ฆฌ์ ์ผ๋ก ๋ถ์ ํํ ๋ชจ์
์ ํํฐ๋งํ๋ physics-aware curation, (2) joint limits, ground contact, anti-skating constraints๋ฅผ ์ ์ฉํ๋ PhySINK (Physically-grounded Shape-adaptive Inverse Kinematics)๋ฅผ ํตํ ๋ฌผ๋ฆฌ ์ ์ฝ retargeting.
Achievement
Figure 2: Overview of datasets and performance. PHUMA is both large-scale and physically
- ๋ฐ์ดํฐ์
๊ท๋ชจ์ ํ์ง์ ๊ท ํ: AMASS๋ณด๋ค 349.9% ๋ ๋ง์ ๋ฌผ๋ฆฌ์ ์ผ๋ก ํ๋นํ ๋ชจ์
์ ์ ๊ณตํ๋ฉด์ Humanoid-X์ ๊ท๋ชจ๋ฅผ ์ ์งํ์ฌ 27.4์๊ฐ์์ 69.1์๊ฐ์ผ๋ก ํ์ฅ
- ๋ฌผ๋ฆฌ์ ์ ๋ขฐ์ฑ ํฅ์: joint feasibility, non-floating, non-penetration, non-skating ๋ชจ๋ ์งํ์์ ๊ธฐ์กด ๋ฐ์ดํฐ์
์ ์ด๊ณผํ๋ฉฐ ํนํ skating ์ ๊ฑฐ์์ Humanoid-X ๋๋น 5.5% ๊ฐ์
- ๋ชจ์
๋ชจ๋ฐฉ ์ฑ๋ฅ: ๋ฏธํ์ต ๋ชจ์
์ ๋ํด AMASS ๋๋น 1.2๋ฐฐ, Humanoid-X ๋๋น 2.1๋ฐฐ ๋์ ์ฑ๊ณต๋ฅ ๋ฌ์ฑ
- ๊ฒฝ๋ก ์ถ์ข
์ฑ๋ฅ: pelvis-only guidance ๊ธฐ๋ฐ ๊ฒฝ๋ก ์ถ์ข
์์ AMASS ๋๋น 1.4๋ฐฐ, ์์ง ์์ง์์์ 1.6๋ฐฐ, ์ํ ์์ง์์์ 2.1๋ฐฐ ์ฑ๊ณต๋ฅ ๊ฐ์
How
Figure 3: Overview of the PHUMA pipeline. Our four-stage pipeline for motion imitation learning
- Physics-aware motion curation: Humanoid-X์์ root jitter, ์์ ์๊ธฐ ๋ฑ ์ธ๋ถ ๊ฐ์ฒด ์ํธ์์ฉ์ด ํฌํจ๋ ์ฝ 70%์ ๋ถ์ ํํ ๋ชจ์
ํํฐ๋ง
- PhySINK ์ต์ ํ: joint alignment fidelity๋ฅผ ์ ์งํ๋ฉด์ soft joint limit loss, ground contact height loss, velocity-based anti-skating loss๋ฅผ ๊ฒฐํฉํ ๋ชฉ์ ํจ์ ๊ตฌ์ฑ
- Shape-adaptive inverse kinematics: ์ธ๊ฐ ์ ์ฒด ๋ชจ๋ธ์ ํ๊ฒ ํด๋จธ๋
ธ์ด๋์ ํํ์ ํ๋ค๋ฆฌ ๋น์จ์ ์ ์์ํจ ํ global joint positions ์ ๋ ฌ
- MaskedMimic ํ๋ ์์ํฌ ํ์ฉ: ๊ธฐ์กด RL ํ์ต ๊ธฐ๋ฐ motion imitation ํ์ดํ๋ผ์ธ์ PHUMA ๋ฐ์ดํฐ์
์ ์ฉ
- ํ๊ฐ: Unitree G1 ๋ฐ H1-2 ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์์ 504๊ฐ์ ์๊ธฐ-๋
นํ ํ
์คํธ ๋น๋์ค (11๊ฐ์ง ๋ชจ์
ํ์
)๋ก ๊ฒ์ฆ
Originality
- ๊ธฐ์กด SINK ๋ฐฉ๋ฒ๋ค๊ณผ ๋ฌ๋ฆฌ joint limits, ground contact constraints, anti-skating loss๋ฅผ ๊ฒฐํฉํ์ฌ ๋ฌผ๋ฆฌ์ ์ผ๋ก ์ ์ฝ๋ retargeting์ ์ฒ์ ์ฒด๊ณ์ ์ผ๋ก ์ ์
- ๋๊ท๋ชจ ๋น๋์ค ๋ฐ์ดํฐ์ ๋ฌผ๋ฆฌ์ artifacts๋ฅผ ์๋ณํ๊ณ ์ ๊ฑฐํ๋ physics-aware curation pipeline ๊ฐ๋ฐ
- Motion imitation ์ฑ๋ฅ์ด ๋ฌผ๋ฆฌ์ ์ ๋ขฐ์ฑ๊ณผ ๊ฐํ ์๊ด๊ด๊ณ๊ฐ ์์์ ์ค์ฆ์ ์ผ๋ก ์
์ฆํ๋ ๋ฒค์น๋งํน
- ๋จ์ํ ๋ฐ์ดํฐ์
๊ตฌ์ถ์ ๋์ด ๊ณต๊ฐ ๋ฆฌ์์ค๋ก ์ ๊ณตํ์ฌ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ์ ๊ธฐ์ฌ
Limitation & Further Study
- ํํฐ๋ง ๊ณผ์ ์์ ์๋ณธ Humanoid-X์ 70%๋ฅผ ์ ๊ฑฐํ๋ฏ๋ก ์ค์ ํ์ฉ ๊ฐ๋ฅํ ๋ฐ์ดํฐ ๋น์จ์ด ๋ฎ์ ์ ์์
- PhySINK์ ๋ค์ํ loss term์ ๊ฐ์ค์น ์ค์ ์ด ํด๋จธ๋
ธ์ด๋์ ํํ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง ๊ฐ๋ฅ์ฑ์ด ์์ผ๋ฉฐ ์ผ๋ฐํ ์ฑ๋ฅ ๊ฒํ ํ์
- ํ๊ฐ๊ฐ Unitree G1, H1-2 ๋ฑ ์ ํ๋ ๋ก๋ด ๋ชจ๋ธ์์๋ง ์ํ๋์ด ๋ค๋ฅธ ํด๋จธ๋
ธ์ด๋ ํํ๋ก์ ์ ์ด ๊ฐ๋ฅ์ฑ ๋ถ๋ช
ํ
- ํ์์ฐ๊ตฌ: (1) ๋ ์ ๊ตํ ์๋ํ๋ curation ๋ฐฉ๋ฒ ๊ฐ๋ฐ์ผ๋ก ํํฐ๋ง ๋น์จ ๊ฐ์ , (2) ๋ค์ํ ์ ์ฒด ํํ์ ํด๋จธ๋
ธ์ด๋์ ๋ํ PhySINK ์ ์์ฑ ๊ฐํ, (3) ์ค์ ๋ก๋ด ํ๋ซํผ์์์ in-the-wild ๋น๋์ค ๊ธฐ๋ฐ ๋ชจ์
๊ฒ์ฆ
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: PHUMA๋ ๋๊ท๋ชจ ๋น๋์ค ๊ธฐ๋ฐ ๋ชจ์
๋ฐ์ดํฐ์ ๋ฌผ๋ฆฌ์ ์ ๋ขฐ์ฑ ๋ฌธ์ ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ํด๊ฒฐํ๋ ์ค์ฉ์ ์ธ ๋ฐ์ดํฐ์
์ด๋ฉฐ, physics-constrained retargeting ๋ฐฉ๋ฒ๋ก ๊ณผ ์ค์ฆ์ ์ฑ๋ฅ ํฅ์์ ํตํด ํด๋จธ๋
ธ์ด๋ ๋ณดํ ํ์ต ๋ถ์ผ์ ๋ช
ํํ ๊ธฐ์ฌ๋ฅผ ์ ์ํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์