์ ์: Mingqi Yuan, Tao Yu, Haolin Song, Bo Li, Xin Jin, Hua Chen, Wenjun Zeng | ๋ ์ง: 2026-03-11 | DOI: 10.48550/arXiv.2512.13093 📄 PDF
Figure 1. (a) PvP employs contrastive learning between proprioceptive and privileged states to learn compact and task-re
PvP๋ ๊ณ ์ ๊ฐ๊ฐ(proprioceptive)๊ณผ ํน๊ถ ์ํ(privileged state) ์ฌ์ด์ ๋์กฐ ํ์ต์ ํ์ฉํ์ฌ ํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ ์ ์ ์ ์ด(WBC) ํ์ต์ ์ํ ํจ์จ์ฑ์ ํฌ๊ฒ ํฅ์์ํจ๋ค.
Figure 1. (a) PvP employs contrastive learning between proprioceptive and privileged states to learn compact and task-re
Figure 2. An overview of the PvP approach. (a) The components
์ดํ: PvP๋ proprioceptive-privileged ๋์กฐ ํ์ต์ด๋ผ๋ ์ง๊ด์ ์ด๋ฉด์๋ ํจ๊ณผ์ ์ธ ๋ฐฉ๋ฒ์ผ๋ก ํด๋จธ๋ ธ์ด๋ ๋ก๋ด ํ์ต์ ์ํ ํจ์จ์ฑ์ ํฌ๊ฒ ํฅ์์ํค๋ฉฐ, SRL4Humanoid ํ๋ ์์ํฌ๋ ํด๋น ๋ถ์ผ์ ํ์ค ๋๊ตฌ๋ก์ ์๋นํ ๊ธฐ์ฌ๋ฅผ ํ๋ค.