์ ์: David Mรผller, Agon Serifi, Sammy Christen, Ruben Grandia, Espen Knoop, Moritz Bรคcher | ๋ ์ง: 2026-05-07 | DOI: 10.1145/3811378 📄 PDF
Fig. 1. Physics-aware retargeting of human motion (left) onto two humanoid robots (middle) and a quadruped (right) with
๋ณธ ๋ ผ๋ฌธ์ ์ธ๊ฐ์ ๋ชจ์ ์บก์ฒ ๋ฐ์ดํฐ๋ฅผ ์์ดํ ํํ์ ํด๋จธ๋ ธ์ด๋ ๋ฐ ์ฌ์กฑ๋ก๋ด์ผ๋ก ๋ฆฌํ๊ฒํ ํ๊ธฐ ์ํ ์ด์ค์์ค ์ต์ ํ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. ์๋จ ์์ค์์๋ ๋ฆฌํ๊ฒํ ๋งค๊ฐ๋ณ์๋ฅผ ์ต์ ํํ๊ณ , ํ๋จ ์์ค์์๋ reinforcement learning์ ํตํด tracking policy๋ฅผ ํ์ตํ์ฌ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ์ artifact-freeํ ๋ชจ์ ์ ์์ฑํ๋ค.
Fig. 2. Bilevel Optimization for Motion Retargeting.
์ด์ค์์ค ์ต์ ํ ํ๋ ์์ํฌ: ๋ฆฌํ๊ฒํ ๋งค๊ฐ๋ณ์์ tracking policy๋ฅผ ๋์์ ์ต์ ํํ๋ bilevel formulation์ ๋์ ํ์ผ๋ฉฐ, ์๋จ ์์ค loss์ ๋ํ ๊ทผ์ฌ gradient๋ฅผ ์ ๋ํ์ฌ tractableํ๊ฒ ํด๊ฒฐํจ. ๋ฌผ๋ฆฌ์ ํ๋น์ฑ ๋ณด์ฅ: Physics simulation ํตํฉ์ผ๋ก foot sliding, self-collision, abrupt joint movement ๋ฑ์ artifact๋ฅผ ๊ทผ๋ณธ์ ์ผ๋ก ์ ๊ฑฐ. sparse correspondence ๊ธฐ๋ฐ: ์ฌ์ฉ์๊ฐ nominal configuration์์๋ง semantic rigid-body correspondence๋ฅผ ์ ์ํ๋ฉด ๋๋ฏ๋ก ์ฌ์ฉ์ ๊ฐ์ ์ ์ต์ํ. ๊ด๋ฒ์ํ ์ ์ฉ์ฑ: ๋ ์ข ๋ฅ์ ํด๋จธ๋ ธ์ด๋ ๋ฐ ์ฌ์กฑ๋ก๋ด๊น์ง ํฌํจํ ๋ค์ํ morphology์ ์ ์ฉ ๊ฐ๋ฅํ๋ฉฐ, SIGGRAPH 2026 ์ฑํ.
Fig. 2. Bilevel Optimization for Motion Retargeting.
โข Physics simulation ํ๊ฒฝ์์์ bilevel ์ต์ ํ: ์๋จ์์๋ ๋ฆฌํ๊ฒํ ๋งค๊ฐ๋ณ์ p๋ฅผ ์ต์ ํ, ํ๋จ์์๋ reward function R์ ์ต๋ํํ๋ policy ฯ* ํ์ต\nโข ์๋จ ์์ค loss ํจ์๋ reference motion๊ณผ ์ค์ ์คํ๋ ๋ชจ์ ๊ฐ์ tracking error์ ํจ๊ป ๋ฌผ๋ฆฌ ์ ์ฝ์ ํฌํจ\nโข ํ๋จ ์์ค์์๋ residual force control์ ํ์ฉํ์ฌ diverse motion dataset ์ ์ฒด์ ๊ฑธ์ณ ๋จ์ผ policy ํ์ต ๊ฐ๋ฅ\nโข Implicit function theorem์ ๊ธฐ๋ฐ์ผ๋ก ํ๋, retargeting ๋ฌธ์ ์ ๊ตฌ์กฐ๋ฅผ ํ์ฉํ์ฌ simplified gradient estimate ๋์ถ\nโข User-defined sparse semantic correspondences๋ก๋ถํฐ parameterized reference motion ์์ฑ
โข Bilevel optimization์ motion retargeting์ ์ฒ์ ์ ์ฉ: ๊ธฐ์กด ์ฐ๊ตฌ์์๋ ์ฃผ๋ก optimization-based ๋๋ learning-based ๋จ์ผ ์์ค ์ ๊ทผ๋ง ์ฌ์ฉํ์ผ๋ฉฐ, RL์ ํ๋จ ์์ค์ผ๋ก ํ๋ stochastic bilevel optimization์ retargeting์์ ๋ฏธ์คํ๋จ\nโข Physics-aware retargeting์ RL ๋ฌธ์ ๋ก ์ฌ์ ์: ๋จ์ kinematic optimization์ ๋์ด ๋์ ํ๋น์ฑ์ ์ง์ ๋ณด์ฅํ๋ ์๋ก์ด ๊ด์ \nโข Sparse semantic correspondence ๊ธฐ๋ฐ parameterization: ๋ณต์กํ paired training data๋ ์ ์ฒด skeleton matching ์์ด ์ต์ํ์ ์ฌ์ฉ์ ์ ๋ ฅ์ผ๋ก ์๋\nโข ์ฌ์กฑ๋ก๋ด๊น์ง ํฌํจํ ๊ด๋ฒ์ํ morphology ์ง์: ๊ธฐ์กด ๋๋ถ๋ถ์ retargeting ๋ฐฉ๋ฒ์ humanoid ์ค์ฌ
โข Bilevel optimization์ ๋์ ๊ณ์ฐ ๋น์ฉ: ์ฌ๋ฌ ๋ฒ์ RL training iteration์ด ํ์ํ๋ฏ๋ก ๋จ์ kinematic optimization ๋๋น ํจ์ฌ ๋๋ฆผ. โข Approximate gradient ์ฌ์ฉ: ์๋จ ์์ค์ gradient๋ฅผ ๊ทผ์ฌํ๋ฏ๋ก global optimum ๋ณด์ฅ์ด ์์ผ๋ฉฐ, local minima์ ๋น ์ง ๊ฐ๋ฅ์ฑ. โข Sparse correspondence์ ์ ์ ํ ์ ์ ์๊ตฌ: ์ฌ์ฉ์๊ฐ ์๋ฏธ ์๋ rigid-body pair๋ฅผ ์ ํํด์ผ ํ๋ฏ๋ก, ๋งค์ฐ ์ด์ง์ ์ธ morphology์์๋ ์ด ์ ํ์ด ๊น๋ค๋ก์ธ ์ ์์. โข Hardware ๊ฒ์ฆ์ ์ ํ์ฑ: ๋ ผ๋ฌธ์์๋ ํ๋์ ํด๋จธ๋ ธ์ด๋์์๋ง hardware result๋ฅผ ๋ณด์์ผ๋ฏ๋ก, ๋ค๋ฅธ ํ๋ซํผ์์์ sim-to-real transfer ํจ๊ณผ๋ ๋ฏธ๊ฒ์ฆ. ํ์ ์ฐ๊ตฌ: (1) ๋ ํจ์จ์ ์ธ bilevel ์๊ณ ๋ฆฌ์ฆ ๊ฐ๋ฐ๋ก ๊ณ์ฐ ์๊ฐ ๋จ์ถ, (2) correspondence ์ ํ ์๋ํ, (3) ๋ ๋ง์ ์ค์ ๋ก๋ด ํ๋ซํผ์์์ hardware validation.
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ motion retargeting์ bilevel optimization๊ณผ RL์ ์กฐํฉ์ผ๋ก ์ฌ์ ์ํ์ฌ ๋ฌผ๋ฆฌ์ ์ผ๋ก ํ๋นํ๊ณ artifact-freeํ ๋ชจ์ ์ ์์ฑํ๋ ๊ฐ๋ ฅํ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. Sparse correspondence๋ง์ผ๋ก ๋ค์ํ morphology๋ฅผ ์ง์ํ๋ฉฐ, ์๋ฎฌ๋ ์ด์ ๊ธฐ๋ฐ ๊ฒ์ฆ๊ณผ ์ ํ์ hardware ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํ๋ค. ๊ณ์ฐ ํจ์จ์ฑ๊ณผ hardware ๊ฒ์ฆ์ ํ์ฅ์ด ํฅํ ๊ณผ์ ์ด์ง๋ง, ๋ก๋ณดํฑ์ค์ ์ ๋๋ฉ์ด์ ๋ถ์ผ์ motion retargeting ๋ฌธ์ ์ ๋ํ ์ค์ํ ๊ธฐ์ฌ๋ก ํ๊ฐ๋๋ค.