์ ์: Romerik Lokossou, Birhanu Shimelis Girma, Ozan K. Tonguz, Ahmed Biyabani | ๋ ์ง: 2025-09-14 | URL: https://arxiv.org/abs/2509.11388 📄 PDF
Fig. 4. Return of Classical SAC versus Quantum SAC in the Walker2d-v4
์ด ๋ ผ๋ฌธ์ Soft Actor-Critic(SAC) ์๊ณ ๋ฆฌ์ฆ์ parameterized quantum circuit์ผ๋ก ๊ตฌํํ quantum deep reinforcement learning(QDRL)์ humanoid robot navigation ์์ ์ ์ ์ฉํ์ฌ, ๊ณ ์ฐจ์ ์ํ-ํ๋ ๊ณต๊ฐ์์ ๊ณ ์ ์ RL๋ณด๋ค 92% ๋ ์ ์ ์คํ ์ผ๋ก 8% ๋์ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค.
Fig. 4. Return of Classical SAC versus Quantum SAC in the Walker2d-v4
Fig. 3. Quantum deep learning model with parametrized quantum circuit
์ดํ: ์ด ๋ ผ๋ฌธ์ humanoid robot navigation์ด๋ผ๋ ๋์ ์ ๊ณ ์ฐจ์ ๋ฌธ์ ์ QDRL์ ์ฒ์ ์ ์ฉํ ์๋ฏธ ์๋ ์ฐ๊ตฌ๋ก, ์์ ์ปดํจํ ์ ์ค์ฉ์ ์ ์ฌ๋ ฅ์ ๋ณด์ฌ์ฃผ์ง๋ง, ์๋ฎฌ๋ ์ด์ ํ๊ฒฝ ์ ํ๊ณผ ์ค์ ์์ ํ๋์จ์ด ๋ถ์ฌ๋ก ์ธํด ๊ทผ๋ณธ์ ์ธ ์์ ์ด์ ์ ์ฆ๋ช ์ ์์ง ๋ถ์์ ํ๋ค.