์ ์: Ankit Goyal, Jie Xu, Yijie Guo, Valts Blukis, Yu-Wei Chao, Dieter Fox | ๋ ์ง: 2023-06-26 | URL: https://arxiv.org/abs/2306.14896 📄 PDF
Figure 2: Overview of RVT. Given RGB-D from sensor(s), we first construct a point cloud of the
RVT๋ 3D ๋ฌผ์ฒด ์กฐ์์ ์ํด multi-view transformer๋ฅผ ์ฌ์ฉํ์ฌ ๋ช ์์ 3D ํํ์ ๊ณ์ฐ ๋น์ฉ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ฉด์ ๋์ ์ ํ๋์ ํ์ฅ์ฑ์ ๋์์ ๋ฌ์ฑํ๋ค.
Figure 1: RVT scales and performs better
Figure 2: Overview of RVT. Given RGB-D from sensor(s), we first construct a point cloud of the
์ดํ: RVT๋ voxel ๊ธฐ๋ฐ์ ๋์ ์ฑ๋ฅ๊ณผ view ๊ธฐ๋ฐ์ ํ์ฅ์ฑ์ ํจ๊ณผ์ ์ผ๋ก ๊ฒฐํฉํ ํ์ ์ ๋ฐฉ๋ฒ์ผ๋ก, ์ค์ง์ ์ธ ํ๋ จ ์๊ฐ ๋จ์ถ๊ณผ ์ฑ๋ฅ ํฅ์์ ๋์์ ๋ฌ์ฑํ์ฌ ๋ก๋ด ์กฐ์ ์ฐ๊ตฌ์ ๋ฐ์ ์ ์๋นํ ๊ธฐ์ฌ๋ฅผ ํ๋ค.