์ ์: Danijar Hafner, Jurgis Pasukonis, Jimmy Ba, Timothy Lillicrap | ๋ ์ง: 2023-01-10 | URL: https://arxiv.org/abs/2301.04104 📄 PDF
Figure 1: Benchmark summary. a, Using fixed hyperparameters across all domains, Dreamer
DreamerV3๋ world model์ ํ์ตํ์ฌ ๊ณ ์ ๋ ํ์ดํผํ๋ผ๋ฏธํฐ๋ก 150๊ฐ ์ด์์ ๋ค์ํ ๋๋ฉ์ธ์์ ์ ๋ฌธํ๋ ์๊ณ ๋ฆฌ์ฆ์ ๋ฅ๊ฐํ๋ ๋ฒ์ฉ RL ์๊ณ ๋ฆฌ์ฆ์ด๋ค. normalization, balancing, transformation ๊ธฐ๋ฐ์ robustness ๊ธฐ๋ฒ์ผ๋ก ๋๋ฉ์ธ ๊ฐ ์์ ์ ํ์ต์ ์คํํ๋ค.
Figure 1: Benchmark summary. a, Using fixed hyperparameters across all domains, Dreamer
์ดํ: DreamerV3๋ world model ๊ธฐ๋ฐ RL์ robustness ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ์ฌ ๋จ์ผ ์ค์ ์ผ๋ก ๋ค์ค ๋๋ฉ์ธ์ ๋ง์คํฐํ๋ ์ค์ง์ ์ฑ๊ณผ๋ฅผ ๋ฌ์ฑํ๋ค. ํนํ Minecraft diamond ์์ง์ ์ด ๋ถ์ผ์ ์ค๋ ๋ฏธํด๊ฒฐ ๊ณผ์ ๋ฅผ ์ฒ์์ผ๋ก ์ ๋ณตํ ๊ฒ์ผ๋ก, RL์ ์ค์ฉ์ ์ ์ฉ ๋ฒ์๋ฅผ ํฌ๊ฒ ํ์ฅํ ์ค์ํ ๊ธฐ์ฌ๋ค.