์ ์: Scott Reed, Konrad Zolna, Emilio Parisotto, Sergio Gomez Colmenarejo, Alexander Novikov, Gabriel Barth-Maron, Mai Gimenez, Yury Sulsky, Jackie Kay, Jost Tobias Springenberg, Tom Eccles, Jake Bruce, Ali Razavi, Ashley Edwards, Nicolas Heess, Yutian Chen, Raia Hadsell, Oriol Vinyals, Mahyar Bordbar, Nando de Freitas | ๋ ์ง: 2022-05-12 | URL: https://arxiv.org/abs/2205.06175 📄 PDF
Figure 1: A generalist agent. Gato can sense and act with di๏ฌerent embodiments across a wide range of
Gato๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ์ ๊ทผ ๋ฐฉ์์ ์ผ๋ฐํํ์ฌ ํ ์คํธ๋ฅผ ๋์ด ๋ค์ํ ๋ชจ๋ฌ๋ฆฌํฐ์ ๊ตฌ์ฒดํ(embodiment)๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ ๋จ์ผ ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ์ ๋ฒ์ฉ ์ ์ฑ ์์ด์ ํธ์ด๋ค. ๋์ผํ ๊ฐ์ค์น๋ฅผ ๊ฐ์ง ํ๋์ ๋ชจ๋ธ๋ก Atari ๊ฒ์, ์ด๋ฏธ์ง ์บก์ ๋, ๋ํ, ๋ก๋ด ์ ์ด ๋ฑ 604๊ฐ์ ์๋ก ๋ค๋ฅธ ์์ ์ ์ํํ ์ ์๋ค.
Figure 1: A generalist agent. Gato can sense and act with di๏ฌerent embodiments across a wide range of
Figure 2: Training phase of Gato. Data from di๏ฌerent tasks and modalities is serialized into a ๏ฌat sequence of
์ดํ: Gato๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ์ค์ผ์ผ๋ง ์๋ฆฌ๋ฅผ ๋ค์ค ๋ชจ๋ฌ๋ฆฌํฐ ์ ์ด ๋ฌธ์ ๋ก ํ์ฅํ์ฌ ๋จ์ผ ๋ฒ์ฉ ์์ด์ ํธ์ ๊ฐ๋ฅ์ฑ์ ์ค์ฆ์ ์ผ๋ก ๋ณด์ฌ์ฃผ๋ ํ๊ธฐ์ ์ฐ๊ตฌ์ด๋ค. ๊ธฐ์ ์ ๊ตฌ์ฑ์ ์๋์ ์ผ๋ก ๋จ์ํ์ง๋ง, 604๊ฐ ์์ ๊ท๋ชจ์์์ ํตํฉ ๋ฐ ์ค์ ๋ก๋ด ์ ์ด ์ฑ๊ณต์ ๋์ ์ค๋ฌด์ ๊ฐ์น์ ์ฅ๊ธฐ์ ์ํฅ๋ ฅ์ ๊ฐ์ง๋ค.