์ ์: Minku Kim, Brian Acosta, Pratik Chaudhari, Michael Posa | ๋ ์ง: 2025-08-09 | URL: https://arxiv.org/abs/2508.06779 📄 PDF
Fig. 2.
๋ณธ ๋ ผ๋ฌธ์ ๋จ์ผ ๊น์ด ์นด๋ฉ๋ผ์ reinforcement learning ๊ธฐ๋ฐ์ ๊ณ์ธต์ ์ ์ด ํ๋ ์์ํฌ๋ฅผ ํตํด ์์กฑ ๋ก๋ด์ด ๋น์ ํ ์งํ์์ ์ค์๊ฐ ๋ฐ๊ฑธ์ ๊ณํ์ ์ํํ๋๋ก ํ๋ ์๊ฐ ๊ธฐ๋ฐ ๋ฐ๊ฑธ์ ๊ณํ๊ธฐ๋ฅผ ์ ์ํ๋ค. Angular Momentum Linear Inverted Pendulum ๋ชจ๋ธ์ ํ์ฉํ์ฌ ์ ์ฐจ์ ์ํ ํํ์ ๊ตฌ์ฑํ๊ณ ์์ ๋ ๋ฒจ์ RL ๋ฐ๊ฑธ์ ๊ณํ๊ธฐ์ ํ์ ๋ ๋ฒจ์ Operational Space Controller๋ฅผ ํตํฉํ๋ค.
Fig. 1.
Fig. 2.
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ RL ๊ธฐ๋ฐ ๋ฐ๊ฑธ์ ๊ณํ์ ALIP ๋ชจ๋ธ๊ณผ ๊น์ด ์นด๋ฉ๋ผ vision์ผ๋ก ํตํฉํ ์ค์ง์ ์ธ ๊ณ์ธต์ ์ ์ด ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, ์ค์ ๋ก๋ด ํ๋์จ์ด์์์ ๊ฒ์ฆ์ ํตํด ์ค์ฉ์ฑ์ ์ ์ฆํ๋ค. ๋ค๋ง ALIP ๋ชจ๋ธ์ ํํ๋ ฅ ํ๊ณ์ ๋ณต์กํ ์งํ์์์ ์ฑ๋ฅ ์ ํ๊ฐ ๋ช ํํ๊ฒ ๋๋ฌ๋ ํฅํ ๋ ์ ๊ตํ ๋ชจ๋ธ์ด๋ end-to-end ํ์ต ์ ๊ทผ์ ํ์์ฑ์ ์์ฌํ๋ค.