์ ์: Cheng Chi, Zhenjia Xu, Siyuan Feng, Eric Cousineau, Yilun Du, Benjamin Burchfiel, Russ Tedrake, Shuran Song | ๋ ์ง: 2023-03-07 | URL: https://arxiv.org/abs/2303.04137 📄 PDF
Figure 1. Policy Representations. a) Explicit policy with different types of action representations. b) Implicit policy
Robot ์กฐ์ ์์ ์ ์ํ visuomotor policy๋ฅผ conditional denoising diffusion process๋ก ํํํ๋ Diffusion Policy๋ฅผ ์ ์ํ๋ฉฐ, 4๊ฐ ๋ฒค์น๋งํฌ์ 15๊ฐ ์์ ์์ ํ๊ท 46.9% ์ฑ๋ฅ ํฅ์์ ๋ฌ์ฑํ๋ค.
Figure 2. Diffusion Policy Overview a) General formulation. At time step t, the policy takes the latest To steps of obse
Figure 2. Diffusion Policy Overview a) General formulation. At time step t, the policy takes the latest To steps of obse
์ดํ: Diffusion model์ ๊ฐ๋ ฅํ ์์ฑ ๋ฅ๋ ฅ์ robot policy learning์ ์ฐฝ์์ ์ผ๋ก ๋์ ํ์ฌ multimodality, scalability, training stability ๋ฌธ์ ๋ฅผ ๋์์ ํด๊ฒฐํ ํ๊ธฐ์ ์ฐ๊ตฌ๋ก, ๊ด๋ฒ์ํ ์คํ๊ณผ ๊ธฐ์ ์ ๊ธฐ์ฌ๋ฅผ ํตํด robot learning ๋ถ์ผ์ ์๋ก์ด ํจ๋ฌ๋ค์์ ์ ์ํ๋ค.