์ ์: Mohit Shridhar, Lucas Manuelli, Dieter Fox | ๋ ์ง: 2022-09-12 | URL: https://arxiv.org/abs/2209.05451 📄 PDF
Figure 2. PERACT Overview. PERACT is a language-conditioned behavior-cloning agent trained with supervised learning to d
๋ณธ ๋ ผ๋ฌธ์ Perceiver Transformer๋ฅผ ์ฌ์ฉํ์ฌ voxelized 3D ๊ด์ฐฐ๊ณผ ์ด์ฐํ๋ ํ๋์ผ๋ก 6-DoF ๋ก๋ด ์กฐ์์ ์ํํ๋ ์ธ์ด ์กฐ๊ฑดํ ํ๋ ๋ณต์ ์์ด์ ํธ PerAct๋ฅผ ์ ์ํ๋ค. ์ด formulation์ 2D ์ด๋ฏธ์ง ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ๋ณด๋ค ํจ์ฌ ํจ์จ์ ์ด๊ณ ๊ฐ๋ ฅํ ๊ตฌ์กฐ์ prior๋ฅผ ์ ๊ณตํ๋ค.
Figure 1. Language-Conditioned Manipulation Tasks: PERACT is a language-conditioned multi-task agent capable of imitatin
Figure 2. PERACT Overview. PERACT is a language-conditioned behavior-cloning agent trained with supervised learning to d
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ์ ํ๋ ๋ก๋ด ์กฐ์ ๋ฐ์ดํฐ์์ Transformer์ ๊ฐ๋ ฅํจ์ ํ์ฉํ๊ธฐ ์ํ ํจ๊ณผ์ ์ธ formulation์ ์ ์ํ๋ฉฐ, voxel ๊ธฐ๋ฐ ํํ๊ณผ action-centric learning์ ํตํด ๋ฐ์ดํฐ ํจ์จ์ฑ์ ๋ํญ ๊ฐ์ ํ๋ค. ์๋ฎฌ๋ ์ด์ ๊ณผ ์ค์ ๋ก๋ด์์ ๊ฒ์ฆ๋ ๊ฒฐ๊ณผ๋ ๋ค์ค ์์ ๋ก๋ด ํ์ต์ ์ค์ฉ์ ๊ฐ๋ฅ์ฑ์ ์ ๋ณด์ฌ์ค๋ค.