์ ์: Lingfan Bao, Joseph Humphreys, Tianhu Peng, Chengxu Zhou | ๋ ์ง: 2024-04-25 | URL: https://arxiv.org/abs/2404.17070 📄 PDF
๋ณธ ๋ ผ๋ฌธ์ bipedal robot์ locomotion์ ์ํ Deep Reinforcement Learning(DRL) ๊ธฐ๋ฐ ํ๋ ์์ํฌ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ๋ถ๋ฅ, ๋น๊ต, ๋ถ์ํ๋ survey์ด๋ฉฐ, end-to-end์ hierarchical ์ ์ด ๋ฐฉ์์ผ๋ก ๊ตฌ๋ถํ์ฌ ๊ฐ ํ๋ ์์ํฌ์ ๊ตฌ์ฑ, ๊ฐ์ , ํ๊ณ๋ฅผ ํ๊ฐํ๋ค.
Fig. 1: Representative bipedal and humanoid robots illustrat-
์ดํ: ๋ณธ survey๋ DRL ๊ธฐ๋ฐ bipedal locomotion ๋ถ์ผ์ fragmented ์ฐ๊ตฌ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ๊ณ unified framework์ ํฅํ ๋ช ํํ research agenda๋ฅผ ์ ์ํ๋ ๊ฐ์น ์๋ ์ข ํฉ ๋ถ์์ด๋ค. End-to-end์ hierarchical ๋ถ๋ฅ ์ฒด๊ณ, learning paradigm ๋น๊ต, hybrid ์ํคํ ์ฒ ํ๊ฐ๋ ์ด ๋ถ์ผ์ ์ข ์ฌ์๋ค์๊ฒ ์ค์ง์ ์ธ guidance๋ฅผ ์ ๊ณตํ๋ฉฐ, ํฅํ generalisable bipedal locomotion ๊ฐ๋ฐ์ ๊ธฐ์ด๋ฅผ ๋ง๋ จํ๋ค.