์ ์: Wenhao Yu, Greg Turk, C. Karen Liu | ๋ ์ง: 2018-01-24 | URL: https://arxiv.org/abs/1801.08093 📄 PDF
Fig. 1. Locomotion Controller trained for different creatures. (a) Biped walking. (b) Quadruped galloping. (c) Hexapod W
๋ณธ ๋ ผ๋ฌธ์ ์ฌ์ธต ๊ฐํํ์ต(DRL)์ ์ฌ์ฉํ์ฌ motion capture๋ finite state machine ์์ด ๋์นญ์ ์ด๊ณ ์ ์๋์ง์ ์์ฐ์ค๋ฌ์ด ๋ก์ฝ๋ชจ์ ์ ํ์ตํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค. ์์ค ํจ์์ ๋ฏธ๋ฌ ๋์นญ์ฑ ์์คํญ์ ์ถ๊ฐํ๊ณ , ์ ์ง์ ์ผ๋ก ๋ฌผ๋ฆฌ์ ๋ณด์กฐ๋ฅผ ์ํํ๋ curriculum learning ๋ฐฉ๋ฒ์ ํตํด ๋ค์ํ ํํ์ ์บ๋ฆญํฐ(์ด์กฑ, ์ฌ์กฑ, ์ก์กฑ)์์ ํจ๊ณผ์ ์ธ ๋ณดํ ์ ์ด๊ธฐ๋ฅผ ์๋์ผ๋ก ์์ฑํ ์ ์์์ ๋ณด์ฌ์ค๋ค.
Fig. 1. Locomotion Controller trained for different creatures. (a) Biped walking. (b) Quadruped galloping. (c) Hexapod W
Fig. 2. (a) The learner-centered curriculum determines the lessons adap-
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ๊ฐํํ์ต ๊ธฐ๋ฐ ๋ก์ฝ๋ชจ์ ํ์ต์์ ๋ฏธ๋ฌ ๋์นญ์ฑ ์์ค๊ณผ curriculum learning์ด๋ผ๋ ๋ ๊ฐ์ง ๊ฐ๋จํ๋ฉด์๋ ํจ๊ณผ์ ์ธ ๊ธฐ๋ฒ์ ํตํด ์์ฐ์ค๋ฝ๊ณ ์๋์ง ํจ์จ์ ์ธ ๋ณดํ์ ๋ฌ์ฑํ ์ฐ์ํ ์ฐ๊ตฌ์ด๋ค. ํนํ motion capture๋ ํํ ํน์ ์ง์ ์์ด ๋ค์ํ ์บ๋ฆญํฐ์ ์ ์ฉ ๊ฐ๋ฅํ ์ผ๋ฐ์ฑ๊ณผ ์๋ฌผํ์ ์ผ๋ก ํ๋นํ ๊ฒฐ๊ณผ๋ ์๋ฏธ์๋ ๊ธฐ์ฌ์ด๋, ์ด๋ก ์ ๊ทผ๊ฑฐ์ ๋ ๋ณต์กํ ์ด๋์ ๋ํ ๊ฒ์ฆ์ด ๋ณด์๋๋ค๋ฉด ๋์ฑ ๊ฐ๋ ฅํ ์ฐ๊ตฌ๊ฐ ๋ ๊ฒ์ด๋ค.