์ ์: Jeremy Dao, Helei Duan, Alan Fern | ๋ ์ง: 2023-10-04 | URL: https://arxiv.org/abs/2310.03191 📄 PDF
Fig. 1: We learn box loco-manipulation policies in simulation
๋ณธ ์ฐ๊ตฌ๋ ์ธ๊ฐํ ๋ก๋ด Digit์ ๋ฐ์ค ์ง๊ธฐ ๋ฐ ์ด๋ฐ ์์ ์ ์ํด ๊ฐํํ์ต ๊ธฐ๋ฐ์ sim-to-real ์ ๊ทผ๋ฒ์ ์ ์ํ๋ฉฐ, 5๊ฐ์ง ๋ถ๋ฆฌ๋ ์ ์ฑ (๊ฑท๊ธฐ, ์๊ธฐ, ์ง๊ธฐ, ๋ฐ์ค ๋ค๊ณ ๊ฑท๊ธฐ, ๋ฐ์ค ๋ค๊ณ ์๊ธฐ)์ ํ์ตํ์ฌ ์ค์ ํ๋์จ์ด์์ ์ฑ๊ณต์ ์ผ๋ก ์ ์ดํ๋ค.
Fig. 1: We learn box loco-manipulation policies in simulation
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ์ธ๊ฐํ ์ด์กฑ ๋ก๋ด์ ๋ณตํฉ์ ์ธ loco-manipulation ์์ ์ ๋ํ ์ฒซ sim-to-real RL ์ฑ๊ณต ์ฌ๋ก๋ฅผ ์ ์ํ๋ฉฐ, ์ค์ฉ์ ์ธ ๋ณด์ ํจ์ ์ค๊ณ์ action space ์ ํ์ ํตํด ์์ฐ์ค๋ฌ์ด ๋์์ ํ์ตํ๋ค๋ ์ ์์ ์์๊ฐ ์๋ค. ๋ค๋ง phase ๊ด๋ฆฌ์ ๊ฒฝ์ง์ฑ๊ณผ ๋ฐ์ค pose ์ถ์ ์ค์ฐจ ๋ฑ ๊ฐ์ ์ ์ฌ์ง๊ฐ ์์ด ๊ธฐ์ ์ ์ผ๋ก๋ ์ค๊ฐ ์์ค์ด์ง๋ง ์ค์ ํ๋์จ์ด ์ ์ฉ์ด๋ผ๋ ์ค์ํ ์ฑ๊ณผ์ ๋ช ํํ ๊ธฐ์ฌ๋ก ๋์ ๊ฐ์น๋ฅผ ๊ฐ์ง๋ค.