์ ์: Yulai Zhang, Yinrong Zhang, Ting Wu, Linqi Ye | ๋ ์ง: 2026-04-21 | URL: https://arxiv.org/abs/2604.19104 📄 PDF
Fig. 3: Multi-Task RL Control Architecture for Tinker.
์ด ๋ ผ๋ฌธ์ ์ด์กฑ ๋ก๋ด ์ถ๊ตฌ์์ ๊ธฐ๋ณธ ๋ณดํ๊ณผ ๋ณต์กํ ์์ (๊ณต ์ฐพ๊ธฐ, ํฅ, ๋์ ํ๋ณต)์ ๊น์ ๊ฒฐํฉ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด CPG ๊ธฐ๋ฐ feedforward oscillator์ RL ๊ธฐ๋ฐ residual action์ ๊ฒฐํฉํ ๋ชจ๋์ ๊ฐํํ์ต ์ ์ด ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค.
Fig. 5: Cumulative Reward for Fall Recovery Network.
์ดํ: ์ด ๋ ผ๋ฌธ์ ์ด์กฑ ๋ก๋ด ์ถ๊ตฌ์ ํต์ฌ ๊ณผ์ ๋ค์ ์ฒด๊ณ์ ์ผ๋ก ํด๊ฒฐํ๋ ํจ๊ณผ์ ์ธ ๋ชจ๋์ ์ ์ด ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, CPG-residual ํ์ด๋ธ๋ฆฌ๋ ์ ์ด์ posture ๊ธฐ๋ฐ ์ํ ์ ํ ๋ฉ์ปค๋์ฆ์ ๋์ ๋ ์ฐฝ์ฑ์ ๋ณด์ฌ์ค๋ค. ๋ค๋ง ์ค์ ํ๋์จ์ด ๊ฒ์ฆ ๋ถ์ฌ์ ํ ๋ฐฉ๋ฒ๋ก ๊ณผ์ ๋น๊ต ๋ถ์ ๋ถ์กฑ์ด ์ํฅ๋ ฅ์ ์ ํํ๋ฉฐ, ์ด๋ค์ด ๋ณด์ถฉ๋๋ค๋ฉด ์ด์กฑ ๋ก๋ด ์ ์ด ๋ถ์ผ์์ ์ค์ง์ ๊ธฐ์ฌ๋ฅผ ํ ์ ์์ ๊ฒ์ผ๋ก ํ๋จ๋๋ค.