์ ์: Buqing Nie, Yang Zhang, Rongjun Jin, Zhanxiang Cao, Huangxuan Lin, Xiaokang Yang, Yue Gao | ๋ ์ง: 2025-08-02 | URL: https://arxiv.org/abs/2508.01247 📄 PDF
Figure 1: The overall architecture of SE-Policy. (a) Left: the architecture of the actor and critic model. (b) upper rig
์ธ๊ฐ์ ์ ๊ฒฝ๊ณ์์ ์๊ฐ์ ๋ฐ์ Symmetry Equivariant Policy (SE-Policy)๋ฅผ ์ ์ํ์ฌ, ํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ ํํ์ ๋์นญ์ฑ์ DRL ํ๋ ์์ํฌ์ ์๊ฒฉํ๊ฒ ์๋ฒ ๋ฉํจ์ผ๋ก์จ ์กฐ์ ๋๊ณ ๊ท ํ์กํ ๋ณดํ์ ์คํํ๋ค.
Figure 2: The tracking errors in terms of position (TE-P) and
Figure 1: The overall architecture of SE-Policy. (a) Left: the architecture of the actor and critic model. (b) upper rig
์ดํ: SE-Policy๋ ํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ ํํ์ ๋์นญ์ฑ์ ์๊ฒฉํ ๋คํธ์ํฌ ์ ์ฝ์ผ๋ก ๊ตฌํํ์ฌ ์ถ๊ฐ ํ์ดํผํ๋ผ๋ฏธํฐ ์์ด 40% ์ฑ๋ฅ ํฅ์์ ๋ฌ์ฑํ ํ์ ์ ์ธ ๋ฐฉ๋ฒ์ด๋ฉฐ, ์ค์ ๋ก๋ด ๋ฐฐํฌ๋ฅผ ํตํด ์ค์ฉ์ฑ์ ์ ์ฆํ๋ค๋ ์ ์์ ๋์ ๊ธฐ์ฌ๋๋ฅผ ๊ฐ์ง๋ค.