์ ์: Tomoya Kamimura, Haruka Washiyama, Akihito Sano | ๋ ์ง: 2026-04-16 | URL: https://arxiv.org/abs/2604.14565 📄 PDF
๋ณธ ์ฐ๊ตฌ๋ ์๋์ ์ ์ฒด ์ญํ(์คํ๋ง, ๋์ ๋ฐฑ๋๋ผ์ด๋ฒ๋น๋ฆฌํฐ ๋ฑ)์ ๊ฐ์ง ์ด์กฑ ๋ก๋ด์ด Model-Based Deep Reinforcement Learning์ ํตํด ๊ณ ์ฑ๋ฅ ๋ณดํยท์ฃผํ ์ด๋์ ํจ์จ์ ์ผ๋ก ์ต๋ํ ์ ์์์ ๋ณด์ฌ์ค๋ค. ์๋ ์์๊ฐ ์์คํ ์ ์ดํธ๋ํฐ๋ฅผ ํ์ฉํ์ฌ ์์ ์ ์ด๊ณ ์๋์ง ํจ์จ์ ์ธ ์ด๋์ ์์ฑํ๋ค.
Figure 3: Learning curves of passive model and torque model in 10 trials. (A)
Figure 1: Biped robot and model. (A) Lower body model based on muscu-
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ embodied AI์ ํต์ฌ์ธ ์๋ ์ ์ฒด ์ญํ์ ํ์ต ํจ์จ์ฑ์ ์๋ฐํ๊ฒ ์ ์ฆํ ์ค์ํ ์ฐ๊ตฌ๋ก, Model-Based RL๊ณผ ์์ฒด์ญํ ์ค๊ณ์ ์๋์ง๋ฅผ ๋ช ํํ ๋ณด์ฌ์ค๋ค. ์๋ฎฌ๋ ์ดํฐ ๊ธฐ๋ฐ ๊ฒ์ฆ์ด๋ผ๋ ํ๊ณ๊ฐ ์์ง๋ง, ๋ฏธ๋ ๋ก๋ด ์ค๊ณ ์์น์ ์ ์๋ฏธํ ํต์ฐฐ์ ์ ๊ณตํ๋ค.