์ ์: Xue Bin Peng, Yunrong Guo, Lina Halper, Sergey Levine, Sanja Fidler | ๋ ์ง: 2022-05-04 | URL: https://arxiv.org/abs/2205.01906 📄 PDF
Fig. 1. Our framework enables physically simulated characters to learn versatile and reusable skill embeddings from larg
๋๊ท๋ชจ ๋น์ ํ ๋ชจ์ ๋ฐ์ดํฐ์ ์ผ๋ก๋ถํฐ adversarial imitation learning๊ณผ unsupervised reinforcement learning์ ๊ฒฐํฉํ์ฌ ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ด์ ์บ๋ฆญํฐ์ ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ ์คํฌ ์๋ฒ ๋ฉ์ ํ์ตํ๋ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. ํ์ต๋ ์คํฌ ์๋ฒ ๋ฉ์ ๋ค์ํ ์๋ก์ด ๊ณผ์ ์ ํจ๊ณผ์ ์ผ๋ก ์ ์ด๋๋ฉฐ ์์ฐ์ค๋ฌ์ด ํ๋์ ํฉ์ฑํ๋ค.
Fig. 4. Our framework is used to learn skill embeddings for a 37 degrees-of-
Fig. 2. The ASE framework consists of two stages: pre-training and transfer.
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ adversarial imitation learning๊ณผ information maximization์ ๊ฒฐํฉํ์ฌ ๋๊ท๋ชจ ๋น์ ํ ๋ชจ์ ๋ฐ์ดํฐ๋ก๋ถํฐ ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ ์คํฌ ์๋ฒ ๋ฉ์ ํ์ตํ๋ ํ์ ์ ์ธ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. ์ญ ๋ ๊ท๋ชจ์ ๋๊ท๋ชจ ์ฌ์ ํ์ต๊ณผ ํ์ํ ์ ์ด ์ฑ๋ฅ์ผ๋ก ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ์บ๋ฆญํฐ ์ ๋๋ฉ์ด์ ๋ถ์ผ์ significant contribution์ ์ ๊ณตํ๋ค.