์ ์: Kaiyan Xiao, Zihan Xu, Cheng Zhe, Chengju Liu, Qijun Chen | ๋ ์ง: 2025-11-26 | DOI: 10.48550/arXiv.2511.21169 📄 PDF
Fig. 1. System architecture of the proposed training pipeline. The diagram illustrates the integration of the upper-body
๋ณธ ๋ ผ๋ฌธ์ ํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ ๊ณ ๋ถํ ์ฐ์ ์์ ์ํ์ ์ํด kinematics ์ฌ์ ์ ๋ณด๋ฅผ ํ์ฉํ ํด๋ฆฌ์คํฑ ๋ณด์ํจ์, force-based curriculum learning, delta-command ์ ์ฑ ์ ํตํฉํ 3๋จ๊ณ RL ๊ธฐ๋ฐ loco-manipulation ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค.
Fig. 5. Position and orientation errors of the left end-effector during training
Fig. 1. System architecture of the proposed training pipeline. The diagram illustrates the integration of the upper-body
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ ๊ณ ๋ถํ loco-manipulation์ ์ํด kinematics ์ ๋ณด ํ์ฉ, curriculum learning, modular ์ ์ฑ ์กฐ์ ์ ๊ฒฐํฉํ ์ฒด๊ณ์ ์ด๊ณ ์ค์ฉ์ ์ธ RL ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, ์ค์ ๋ก๋ด ์คํ์ผ๋ก ๊ฐ๋ ฅํ ์ฑ๋ฅ์ ์ ์ฆํ๋ค. ๋ค๋ง ๋จ์ผ ํ๋ซํผ ๊ฒ์ฆ๊ณผ ์ค์ ์ฐ์ ํ๊ฒฝ ์ ์์ฑ ํ๊ฐ ๋ณด๊ฐ์ด ํ์ํ๋ค.