์ ์: Chenhao Li, Marco Hutter, Andreas Krause | ๋ ์ง: 2025-07-08 | URL: https://arxiv.org/abs/2507.05906 📄 PDF
Figure 1: DeepMimic-style feature-based methods. The policy receives dense, per-frame rewards
Feature-based์ GAN-based ํ์ต ๋ฐฉ๋ฒ๋ก ์ ๋น๊ต ๋ถ์ํ์ฌ, ๊ฐ ์ ๊ทผ๋ฒ์ ์ฅ๋จ์ ์ ๋ช ํํ ํ๊ณ ์์ ๋ณ ์ฐ์ ์์์ ๋ฐ๋ฅธ ๋ฐฉ๋ฒ ์ ํ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค.
Figure 1: DeepMimic-style feature-based methods. The policy receives dense, per-frame rewards
์ดํ: ์ด survey๋ ์์ฐ ํ์ต์ ๋ ์ฃผ์ ํจ๋ฌ๋ค์์ ์์น์ ์ผ๋ก ๋น๊ตํ๊ณ , ์ค๋ฌด์๋ค์ด ์์ ํน์ฑ์ ๋ง๋ ๋ฐฉ๋ฒ์ ์ ํํ ์ ์๋๋ก ํ๋ ๊ฐ๋ ์ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ๋ ๊ฐ์น ์๋ ๊ธฐ์ฌ์ด๋ค. ๊ตฌ์กฐํ๋ ๋ชจ์ ํํ์ ์๋ ด์ ์ ๊ฐ์กฐํจ์ผ๋ก์จ ํฅํ ์ฐ๊ตฌ์ ๋ฐฉํฅ์ฑ์ ์ ์ํ๋ค.