์ ์: Nico Bohlinger, Jan Peters | ๋ ์ง: 2026 | DOI: 10.48550/ARXIV.2606.00702 📄 PDF
Figure 1: Shape Your Body. We first train an embodiment-aware policy and value function with
๋ณธ ๋ ผ๋ฌธ์ ๋ค์ค ์ฒดํ์ ํ์ตํ ๊ฐ์นํจ์๋ฅผ ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ ์ค๊ณ ๋ชจ๋ธ๋ก ๋ณํํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค. ์ฌ์ ํ์ต๋ embodiment-aware value function์์ gradient๋ฅผ ๊ณ์ฐํ์ฌ ์๋ก์ด ๋ก๋ด ์ค๊ณ๋ฅผ ์ต์ ํํจ์ผ๋ก์จ ๋งค๋ฒ ์๋ก์ด RL ํ์ต ๋ฃจํ๋ฅผ ์คํํ ํ์๋ฅผ ์ ๊ฑฐํ๋ค.
Figure 2:
Figure 1: Shape Your Body. We first train an embodiment-aware policy and value function with
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ๋ค์ค ์ฒดํ ๊ฐ์นํจ์๋ฅผ ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ ์ค๊ณ ๋๊ตฌ๋ก ๋ณํํ๋ ์ค์ฉ์ ์ด๊ณ ํ์ ์ ์ธ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค. ๋๊ท๋ชจ embodiment ๊ณต๊ฐ์์์ ํจ์จ์ ์ต์ ํ, ๊ฐ๋ ฅํ ์คํ ๊ฒ์ฆ, ๊ทธ๋ฆฌ๊ณ ์ค๊ณ ๋ถ์ ๊ธฐ๋ฅ์ด ์ฃผ์ ๊ฐ์ ์ด๋ค. ๋ค๋ง ํ์ค ๋ก๋ด ๊ฒ์ฆ๊ณผ ๊ทน๋จ์ ์ฒดํ ์ธ์ฝ์ ๋ํ ๋ถ์์ด ๋ณด์๋๋ค๋ฉด ๋์ฑ ์์ฑ๋ ์๋ ์์ ์ด ๋ ๊ฒ์ด๋ค.