์ ์: Wenhao Yu, Greg Turk, C. Karen Liu | ๋ ์ง: 2018-01-24 | URL: https://arxiv.org/abs/1801.08093 📄 PDF
Fig. 1. Locomotion Controller trained for different creatures. (a) Biped walking. (b) Quadruped galloping. (c) Hexapod W
Deep Reinforcement Learning์ ๋ฏธ๋ฌ ๋์นญ ์์ค ํจ์์ ์ปค๋ฆฌํ๋ผ ํ์ต์ ์ ์ฉํ์ฌ ๋ชจ์ ์บก์ฒ ๋ฐ์ดํฐ ์์ด ์์ฐ์ค๋ฝ๊ณ ์ ์๋์ง์ ๋์นญ์ ์ธ ๋ก์ฝ๋ชจ์ ์ ํ์ตํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค.
Fig. 2. (a) The learner-centered curriculum determines the lessons adap-
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ๋ฏธ๋ฌ ๋์นญ ์์ค๊ณผ adaptive curriculum learning์ ๊ฒฐํฉํ์ฌ DRL ๊ธฐ๋ฐ ๋ก์ฝ๋ชจ์ ํ์ต์ ์ค๋๋ ๋ฌธ์ (๋ถ์์ฐ์ค๋ฌ์, ๊ณ ์๋์ง)๋ฅผ ์ฐ์ํ๊ฒ ํด๊ฒฐํ๋ฉฐ, ๋ค์ํ ํํ์ ์ผ๋ฐํ ๊ฐ๋ฅํ ์ ์์ ๋์ ๋ ์ฐฝ์ฑ๊ณผ ์ค์ฉ์ฑ์ ๊ฐ์ถ ์ฐ์ํ ์ฐ๊ตฌ์ด๋ค.