์ ์: Corey Lynch, Mohi Khansari, Ted Xiao, Vikash Kumar, Jonathan Tompson, Sergey Levine, Pierre Sermanet | ๋ ์ง: 2019-03-05 | URL: https://arxiv.org/abs/1903.01973 📄 PDF
Figure 1: Play-LMP: A single model that self-supervises control from play data, then generalizes to a wide
์ธ๊ฐ์ ๋น์ง๋ ์๊ฒฉ์กฐ์ข ํ๋ ์ด ๋ฐ์ดํฐ๋ก๋ถํฐ ์๊ธฐ๊ฐ๋ ํ์ต์ ํตํด ์ ์ฌ ๊ณํ ๊ณต๊ฐ์์ ํ๋์ ์กฐ์งํํ๊ณ ์ฌ์ฌ์ฉํ์ฌ ๋ค์ํ ์กฐ์ ์์ ์ ์ํํ ์ ์๋ Play-LMP ๋ฐฉ๋ฒ์ ์ ์ํ๋ค.
Figure 2: The continuum of skills and its coverage. We advocate for learning the full continuum of skills
Figure 1: Play-LMP: A single model that self-supervises control from play data, then generalizes to a wide
์ดํ: ํ๋ ์ด ๋ฐ์ดํฐ๋ผ๋ ์๋ก์ด ๊ฐ๋ ์ ํธ๋ฅผ ํตํด ๋ก๋ด ํ์ต์ ํ์ฅ์ฑ ๋ฌธ์ ๋ฅผ ํ์ ์ ์ผ๋ก ์ ๊ทผํ์ผ๋ฉฐ, ์ด์ ์ธ์ฝ๋ ๊ตฌ์กฐ์ ์๊ธฐ๊ฐ๋ ํ์ต์ ๊ฒฐํฉ์ ๋ค์ค์์ ์ ์ด ๋ฌธ์ ๋ฅผ ์ฐ์ํ๊ฒ ํด๊ฒฐํ๋ค. ์๋ฎฌ๋ ์ด์ ํ๊ฒฝ์์์ ๊ฐ๋ ฅํ ์ค์ฆ์ ๊ฒฐ๊ณผ์ ๋ช ํํ ์ ์์๋ ๋ถ๊ตฌํ๊ณ , ์ค์ ๋ก๋ด ์ ์ฉ์ ํตํ ๊ฒ์ฆ์ด ์ค์ฉ์ ์ํฅ๋ ฅ์ ํ๋จํ๋ ๋ฐ ์ค์ํ ๊ฒ์ผ๋ก ๋ณด์ธ๋ค.