์ ์: Suraj Nair, Aravind Rajeswaran, Vikash Kumar, Chelsea Finn, Abhinav Gupta | ๋ ์ง: 2022-03-23 | URL: https://arxiv.org/abs/2203.12601 📄 PDF
Figure 1: Pre-Training Reusable Representations for Robot Manipulation (R3M): We pre-train a visual
Ego4D ์ธ๊ฐ ๋น๋์ค ๋ฐ์ดํฐ์ ์์ pre-trainํ R3M ์๊ฐ ํํ์ ์ ์ํ์ฌ, ๋ก๋ด ์กฐ์ ์์ ์ data-efficient ํ์ต์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
Figure 4: Data Ef๏ฌcient Imitation Learning in Unseen Environments/Tasks. We report the success rates
Figure 2: Ego4D [16] Video and Language (left). Sample frames and associated language from Grauman
์ดํ: R3M์ ์ธ๊ฐ ๋น๋์ค pre-training์ ํตํด ๋ก๋ด ์กฐ์์ data-efficient ํ์ต์ ๋ฌ์ฑํ ์ค์ํ ์ค์ฆ ์ฐ๊ตฌ๋ก, ์ค์ ๋ก ๋ค์ด๋ก๋ ๊ฐ๋ฅํ artifact๋ฅผ ์ ๊ณตํจ์ผ๋ก์จ ๋ก๋ด ํ์ต ์ปค๋ฎค๋ํฐ์ standard tool ์ญํ ๊ฐ๋ฅ์ฑ์ด ๋๋ค. ๋ค๋ง ์ค์ ๋ก๋ด ๊ฒ์ฆ์ ํ์ฅ์ฑ๊ณผ ํํ ํด์๊ฐ๋ฅ์ฑ ๊ฐ์ ์ด ํฅํ ๊ณผ์ ์ด๋ค.