์ ์: Pei Xu, Zhen Wu, Ruocheng Wang, Vishnu Sarukkai, Kayvon Fatahalian, Ioannis Karamouzas, Victor Zordan, C. Karen Liu | ๋ ์ง: 2025-09-26 | URL: https://arxiv.org/abs/2509.22442 📄 PDF
Fig. 1. We introduce a novel policy integration framework to enable the composition of drastically different motor skill
๋๊ตฌ ๋์๊ณผ ๊ฐ์ ๋ค๋จ๊ณ ์ฅ๊ธฐ ๊ณผ์ ์์ ์ ์๋์ง ์์ ์ค๊ฐ ์ํ๋ฅผ ๊ฐ์ง ์ด์ง์ ์ธ ์คํฌ๋ค์ seamlessly ํฉ์ฑํ๊ธฐ ์ํด policy integration framework์ soft routing์ ์ ์ํ๋ค.
Figure 4 shows our system architecture for primitive policy learn-
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ill-defined ์ค๊ฐ subtask๋ฅผ ๋ค๋ฃจ๊ธฐ ์ํ ํ์ ์ ์ธ policy integration framework๋ฅผ ์ ์ํ๋ฉฐ, soft routing๊ณผ adaptive fine-tuning์ ํตํด ๋ค๋จ๊ณ ์ฅ๊ธฐ ๊ณผ์ ์์ ์ด์ง ์คํฌ์ seamless ํฉ์ฑ์ ์คํํ๋ค. ์ค์๊ฐ ์ฌ์ฉ์ ๋ช ๋ น ๊ธฐ๋ฐ์ ์์ ๋ก์ด ๋๊ตฌ ํ๋ ์ด์ ๋์ ์ํ ์ ํ๋๋ ์ ์ ๋ฐฉ๋ฒ์ ์ ํจ์ฑ์ ๊ฐ๋ ฅํ ์ ์ฆํ๋, ์๋ฎฌ๋ ์ด์ ํ๊ฒฝ ํ์ ๊ณผ ๋ฐฉ๋ฒ์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ด ํฅํ ๊ณผ์ ์ด๋ค.