์ ์: Taylor Howell, Nimrod Gileadi, Saran Tunyasuvunakool, Kevin Zakka, Tom Erez, Yuval Tassa | ๋ ์ง: 2022-12-01 | URL: https://arxiv.org/abs/2212.00541 📄 PDF
Figure 3 | Graphical User Interface. The left tab includes modules for Tasks and the Agent. In the
MuJoCo ๋ฌผ๋ฆฌ ์์ง ๊ธฐ๋ฐ์ ์ค์๊ฐ ์์ธก ์ ์ด ํ๋ ์์ํฌ MJPC๋ฅผ ์๊ฐํ๊ณ , ๊ฐ๋จํ ์ํ๋ง ๊ธฐ๋ฐ ์๊ณ ๋ฆฌ์ฆ์ธ Predictive Sampling์ด ๊ธฐ์กด์ ๋ ๋ณต์กํ ์๊ณ ๋ฆฌ์ฆ๋ค๊ณผ ๊ฒฝ์๋ ฅ ์์์ ๋ณด์ฌ์ค๋ค.
Figure 4 | Behaviours generated with MuJoCo MPC. Time progresses left to right.
Figure 2 | Time-indexed spline representation of
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ์๋ก์ด ์๊ณ ๋ฆฌ์ฆ์ ๊ธฐ์ฌ๋ณด๋ค๋ ์ค์ฉ์ ์ด๊ณ ์ ๊ทผ ๊ฐ๋ฅํ ๋๊ตฌ์ ๊ฐ๋ฐ๊ณผ ์ ๊ณต์ ์ค์ ์ ๋๋ฉฐ, ์์ธก ์ ์ด์ ๋์คํ์ ์ฐ๊ตฌ ์์ฐ์ฑ ํฅ์์ด๋ผ๋ ์ค์ํ ๋ชฉํ๋ฅผ ๋ฌ์ฑํ๋ค. Predictive Sampling์ ์คํ์ ๊ฒฝ์๋ ฅ์ ํฅ๋ฏธ๋ก์ฐ๋ ์ด๋ก ์ ๋ถ์์ด ๋ณด์๋๋ฉด ๋์ฑ ๊ฐ๋ ฅํ ๊ธฐ์ฌ๊ฐ ๋ ๊ฒ์ด๋ค.