์ ์: Konstantinos Bousmalis, Giulia Vezzani, Dushyant Rao, Coline Devin, Alex X. Lee, Maria Bauza, Todor Davchev, Yuxiang Zhou, Agrim Gupta, Akhil Raju, Antoine Laurens, Claudio Fantacci, Valentin Dalibard, Martina Zambelli, Murilo Martins, Rugile Pevceviciute, Michiel Blokzijl, Misha Denil, Nathan Batchelor, Thomas Lampe, Emilio Parisotto, Konrad ลปoลna, Scott Reed, Sergio Gรณmez Colmenarejo, Jon Scholz, Abbas Abdolmaleki, Oliver Groth, Jean-Baptiste Regli, Oleg Sushkov, Tom Rothรถrl, Josรฉ Enrique Chen, Yusuf Aytar, Dave Barker, Joy Ortiz, Martin Riedmiller, Jost Tobias Springenberg, Raia Hadsell, Francesco Nori, Nicolas Heess | ๋ ์ง: 2023-06-20 | URL: https://arxiv.org/abs/2306.11706 📄 PDF
Figure 1: The self-improvement process. RoboCat is a multi-task, multi-embodiment visual goal-conditioned
RoboCat๋ ์๋ก ๋ค๋ฅธ ๋ก๋ด๊ณผ ์์ ๊ฒฝํ์ ํ์ฉํ์ฌ ๋ค์ค embodiment๊ณผ ๋ค์ค ์์ ์ ์ฒ๋ฆฌํ ์ ์๋ ์๊ฐ ๊ธฐ๋ฐ goal-conditioned decision transformer ๊ธฐ๋ฐ์ ์๊ฐ ๊ฐ์ ๋ก๋ด ์กฐ์ ์์ด์ ํธ์ด๋ค. 100-1000๊ฐ์ ์์ ๋ง์ผ๋ก ์๋ก์ด ์์ ๊ณผ ๋ก๋ด์ ์ ์ํ๋ฉฐ, ์์ฒด ์์ฑ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ ๋ฐ๋ณต์ ๊ฐ์ ์ด ๊ฐ๋ฅํ๋ค.
Figure 5: RoboCat compared to VFM baselines on training tasks. RoboCat performs better on the vast
Figure 1: The self-improvement process. RoboCat is a multi-task, multi-embodiment visual goal-conditioned
์ดํ: RoboCat๋ foundation model ํจ๋ฌ๋ค์์ ๋ก๋ด ์กฐ์์ ์ฑ๊ณต์ ์ผ๋ก ์ ์ฉํ์ฌ ์ด์ง์ embodiment ์ฒ๋ฆฌ, ํจ์จ์ ์ ์, ์๊ฐ ๊ฐ์ ์ ๋์์ ๋ฌ์ฑํ ํ๊ธฐ์ ์ฐ๊ตฌ์ด๋ค. ๊ด๋ฒ์ํ ์คํ ๊ฒ์ฆ๊ณผ ๋ช ํํ presentation์ด ๊ฐ์ ์ด๋, ๋ณต์ก๋ ์ฆ๊ฐ์ ์ฅ๊ธฐ scaling์ ๋ํ ๋ถ์์ด ํฅํ ๊ณผ์ ์ด๋ค.