์ ์: Shuai Liu, Meng Cheng Lau | ๋ ์ง: 2025-09-23 | URL: https://arxiv.org/abs/2509.19023 📄 PDF
Figure 1: Overview of the ROM-GRL framework. In Stage 1, a 4-DOF ROM policy is trained in Box2D: the policy
ROM-GRL์ ๋ชจ์ ์บก์ฒ ๋ฐ์ดํฐ ์์ด 4-DOF reduced-order model๋ก ์์ฑํ gait template์ ์ด์ฉํด full-body humanoid ์ ์ฑ ์ ํ์ตํ๋ 2๋จ๊ณ ๊ฐํํ์ต ํ๋ ์์ํฌ์ด๋ค. Adversarial discriminator๋ฅผ ํตํด ROM์ 5-dimensional gait feature ๋ถํฌ๋ฅผ ๋ฐ๋ฅด๋๋ก ์ ๋ํ์ฌ ์์ฐ์ค๋ฌ์ด ๋ณดํ์ ์คํํ๋ค.
Figure 3 visualizes pelvis and foot trajectories for the ROM-GRL policy (blue) and the pure-reward baseline (orange),
Figure 2: Schematic of the planar ROM used to generate reference walking trajectories. The ROM consists of a central
์ดํ: ROM-GRL์ reduced-order model์ creativeํ๊ฒ ํ์ฉํด motion capture ์์กด์ฑ์ ์ ๊ฑฐํ๋ฉด์ ์์ฐ์ค๋ฝ๊ณ ์์ ์ ์ธ humanoid ๋ณดํ์ ๋ฌ์ฑํ๋ novel ํ๋ ์์ํฌ์ด๋ค. ๋ณด์ ์ค๊ณ์ ๋ชจ๋ฐฉ ํ์ต ๊ฐ ๊ฐ๊ฒฉ์ ํจ๊ณผ์ ์ผ๋ก ์ค์์ผ๋, ์ ํ๋ ์๋ ๋ฒ์์ ์ค์ ๋ก๋ด ๊ฒ์ฆ ๋ถ์ฌ๊ฐ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ ์๋ฌธ์ ๋จ๊ธด๋ค.