์ ์: Anthony Liang, Pavel Czempin, Matthew Hong, Yutai Zhou, Erdem Biyik, Stephen Tu | ๋ ์ง: 2025-05-08 | URL: https://arxiv.org/abs/2505.04999 📄 PDF
Figure 1: Overview of CLAM. CLAM consists of a latent inverse dynamics model, fฯ, which in-
CLAM์ ๋ผ๋ฒจ์ด ์๋ ๊ด์ฐฐ ๋ฐ์ดํฐ๋ก๋ถํฐ ๋ก๋ด ์ ์ฑ ์ ํ์ตํ๊ธฐ ์ํด continuous latent action space๋ฅผ ์ฌ์ฉํ๋ฉฐ, action decoder๋ฅผ jointly trainingํ์ฌ ์ค์ ํ๊ฒฝ ์ก์ ์ผ๋ก์ grounding์ ๋ณด์ฅํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค.
Figure 3: MetaWorld Image-Based Experiments. Task success rate over 50 evaluation rollouts
Figure 1: Overview of CLAM. CLAM consists of a latent inverse dynamics model, fฯ, which in-
์ดํ: CLAM์ continuous latent action space์ joint decoder training์ด๋ผ๋ ๋ช ํํ ๊ธฐ์ ์ ํ์ ์ผ๋ก unlabeled ๋ฐ์ดํฐ ๊ธฐ๋ฐ ๋ก๋ด ์ ์ฑ ํ์ต์ ์ค์ง์ ์ฑ๋ฅ์ ํ๊ธฐ์ ์ผ๋ก ํฅ์์ํค๋ฉฐ, ๋น์ฉ์ด ๋ง์ด ๋๋ expert ๋ฐ์ดํฐ ์์ง์ ํ์์ฑ์ ํฌ๊ฒ ๊ฐ์์ํค๋ highly significant contribution์ ์ ์ํ๋ค.