PDF-HR: Pose Distance Fields for Humanoid Robots
์ ์: Yi Gu, Yukang Gao, Yangchen Zhou, Xingyu Chen, Yixiao Feng, Mingle Zhao, Yunyang Mo, Zhaorui Wang, Lixin Xu, Renjing Xu | ๋ ์ง: 2026-02-04 | DOI: 10.48550/arXiv.2602.04851 📄 PDF
Essence
Fig. 1: We present PDF-HR, which learns the manifold of plausible G1 poses as a zero-level set. Left: The fฯ is trained
Humanoid ๋ก๋ด์ ์ํ pose distance field์ธ PDF-HR์ ์ ์ํ์ฌ, ํ์ต๋ ๋ก๋ด ํฌ์ฆ ๋ถํฌ๋ฅผ ์ฐ์ ๋ฏธ๋ถ ๊ฐ๋ฅํ manifold๋ก ํํํ๊ณ ํฌ์ฆ์ plausibility๋ฅผ ํ๊ฐํ๋ค.
Motivation
- Known: Human motion recovery ๋ถ์ผ์์๋ pose์ motion prior๊ฐ ๊ด๋ฒ์ํ๊ฒ ์ฐ๊ตฌ๋์ด ์์ผ๋ฉฐ, ์ต๊ทผ NRDF ๋ฐ NRMF ๊ฐ์ implicit manifold representation ๋ฐฉ์์ด ํจ๊ณผ์ ์ผ๋ก ์
์ฆ๋์๋ค. Physics-based imitation learning๊ณผ motion retargeting๋ humanoid robotics์์ ์ค์ํ ๊ณผ์ ๋ก ํ๋ฐํ ์ฐ๊ตฌ๋๊ณ ์๋ค.
- Gap: Humanoid ๋ก๋ด์ ์ ์ฉ ๊ฐ๋ฅํ ๊ณ ํ์ง์ ์ผ๋ฐ์ ์ธ pose prior๊ฐ ๋ถ์กฑํ๋ฉฐ, ๊ณ ๊ฐ์ ๋ฐ์ดํฐ ์์ง๊ณผ robot morphology์ ๋ค์์ฑ์ผ๋ก ์ธํด human motion prior๋ฅผ ์ง์ ์ ์ดํ๊ธฐ ์ด๋ ต๋ค. ๊ธฐ์กด ๋ฐฉ์๋ค์ task-specific ๋๋ controller-specific constraints์ ์์กดํ์ฌ ์ฌ์ฌ์ฉ์ฑ๊ณผ ์ผ๋ฐํ์ฑ์ด ์ ํ๋๋ค.
- Why: Humanoid ๋ก๋ด์ motion generation์ joint limit, self-collision, contact feasibility, balance ๋ฑ ๋ณต์กํ ์ ์ฝ์ ๋์์ ๋ง์กฑํด์ผ ํ๋ฉฐ, ์์ ์ค๋ฅ๋ ๋ถ์์ฐ์ค๋ฝ๊ฑฐ๋ ๋ถ์์ ํ configuration์ผ๋ก ์ด์ด์ง ์ ์์ผ๋ฏ๋ก robustํ pose prior๊ฐ ํ์์ ์ด๋ค.
- Approach: MLP ๊ธฐ๋ฐ์ lightweight prior๋ก ์์์ ๋ก๋ด ํฌ์ฆ๋ฅผ ํ์ต๋ retargeted ํฌ์ฆ corpus์ nearest pose๊น์ง์ ๊ฑฐ๋ฆฌ๋ก ๋งคํํ๋ continuous distance field๋ฅผ ํ์ตํ๋ค. ์ด๋ฅผ reward shaping, regularizer, ๋๋ standalone plausibility scorer๋ก ๋ค์ํ pipeline์ plug-and-play ๋ฐฉ์์ผ๋ก ํตํฉํ ์ ์๋๋ก ์ค๊ณํ๋ค.
Achievement
- PDF-HR ๋ชจ๋ธ ์ ์: Riemannian geometry์ product manifold ๊ตฌ์กฐ๋ฅผ ํ์ฉํ์ฌ SO(3) configuration space์์ continuousํ๊ณ differentiableํ pose distance field๋ฅผ ๊ตฌํ
- Plug-and-play ํตํฉ ๋ฉ์ปค๋์ฆ: Motion tracking (reward shaping term)๊ณผ motion retargeting (regularizer)์ ํฌํจํ diverse humanoid task์ ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ prior ์ ๊ณต
- ๊ด๋ฒ์ํ ์คํ ๊ฒ์ฆ: Single-trajectory motion tracking, general motion tracking, style-based motion mimicry, motion retargeting ๋ฑ 4๊ฐ์ง humanoid task์์ ๊ฐ๋ ฅํ baseline์ ์ผ๊ด๋๊ฒ ํฅ์
How
Fig. 2: Visualization of joint orientation distributions of Sideflip at early
- Retargeted robot pose์ ๋๊ท๋ชจ corpus๋ฅผ ์์ฑํ์ฌ pose space๋ฅผ ์ปค๋ฒํ๋ฉด์ near-manifold samples๋ฅผ ๊ฐ์กฐํ๋ training distribution ์ค๊ณ
- Cross-validation์ ํตํด reliable positive samples๋ฅผ ์ ํํ๊ณ , low-rank metric approximation๊ณผ Riemannian geometry๋ฅผ ํ์ฉํ์ฌ manifold ๊ทผ์ฒ ๋ฐ ์๊ฑฐ๋ฆฌ์์ ๋ชจ๋ ์๋ฏธ ์๋ gradient ์ ๊ณต
- Pose distance๋ฅผ RL tracking์์๋ reward term์ผ๋ก, motion retargeting์์๋ regularization objective๋ก ํตํฉ
- MLP ๊ธฐ๋ฐ์ compact model๋ก ๊ณ์ฐ ํจ์จ์ฑ์ ๋ณด์ฅํ๊ณ ๊ธฐ์กด ์์คํ
์ ์ฝ๊ฒ ๋ฐฐํฌ ๊ฐ๋ฅํ๋๋ก ์ค๊ณ
Originality
- Human motion prior์ implicit manifold representation ํจ๋ฌ๋ค์์ humanoid robot์ ์ฒ์์ผ๋ก ํ์ฅํ์ฌ robot morphology์ ํน์์ฑ์ ๋ฐ์
- Distance field ๊ธฐ๋ฐ์ ์ ๊ทผ์ผ๋ก full generative model ๋์ pose plausibility scoring์ ์ง์คํ์ฌ sparse humanoid data ๋ฌธ์ ๋ฅผ ์ฐํ
- Riemannian gradient descent์ product manifold ๊ตฌ์กฐ๋ฅผ ํ์ฉํ ๊ธฐํํ์ ์ผ๋ก ์ผ๊ด๋ optimization ์ ๊ณต
- Task-agnosticํ๊ณ data collection ์์ด ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ modular prior ์ ๊ณต์ผ๋ก generalization ํฅ์
Limitation & Further Study
- Retargeted robot pose corpus์ ํ์ง๊ณผ ๋ค์์ฑ์ ํฌ๊ฒ ์์กดํ๋ฉฐ, corpus์ ๋ถ์กฑํ pose ์์ญ์์๋ prior์ ํจ๊ณผ ์ ํ ๊ฐ๋ฅ
- Distance field์ training distribution ์ค๊ณ์ positive sample selection์ด ํต์ฌ์ด๋ ์ด ๊ณผ์ ์ ์๋ํ ๋ฐ ์ต์ ํ ๋ฐฉ๋ฒ์ด ๋ฏธํกํ ์ ์์
- ํ์ฌ pose prior๋ง ๋ค๋ฃจ๋ฏ๋ก motion continuity๋ dynamic feasibility๋ฅผ ์ง์ ์ ์ฝํ์ง ๋ชปํ๋ฉฐ, ์ด๋ฅผ ์ํด์๋ temporal extension ํ์
- Real-world deployment ๊ฒ์ฆ์ด ์ ํ์ ์ด๋ฏ๋ก sim-to-real transfer์์์ ์ฑ๋ฅ ์ ํ ๊ฐ๋ฅ์ฑ๊ณผ ๊ทน๋จ์ out-of-distribution ์ํฉ์์์ robustness ์ถ๊ฐ ๊ฒ์ฆ ํ์
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ์ด ๋
ผ๋ฌธ์ humanoid robotics์ implicit manifold representation์ ์ฒ์ ์ ์ฉํ์ฌ scarce data ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ๊ณ , lightweightํ๋ฉด์๋ ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ pose prior๋ฅผ ์ ์ํ ์ ์์ ๋์ ํ์ ์ ๊ธฐ์ฌ๋ฅผ ํ๋ค. ๋ค์ํ task์์ ์ผ๊ด๋ ์ฑ๋ฅ ํฅ์์ ๋ณด์ด๋ฉฐ ์ค์ฉ์ ๊ฐ์น๋ ์ฐ์ํ๋, corpus ์์กด์ฑ๊ณผ temporal modeling์ ๋ฏธํก์ด ํฅํ ๊ฐ์ ๊ณผ์ ์ด๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์