์ ์: Marcelino Julio Fernando, Miguel Altamirano Cabrera, Jeffrin Sam, Yara Mahmoud, Konstantin Gubernatorov, Dzmitry Tsetserukou | ๋ ์ง: 2026-04-21 | URL: https://arxiv.org/abs/2604.19522 📄 PDF
Fig. 3.
GenerativeMPC๋ Vision-Language Model๊ณผ Retrieval-Augmented Generation์ ํ์ฉํ์ฌ ์๋ฏธ๋ก ์ ์ฅ๋ฉด ์ดํด๋ฅผ ๋ฌผ๋ฆฌ์ ์ ์ด ํ๋ผ๋ฏธํฐ๋ก ๋ณํํ๊ณ , Whole-Body MPC์ ํตํฉ ์ํผ๋์ค-์ด๋๋ฏธํด์ค ์ ์ด๊ธฐ๋ฅผ ํตํด ์ํ ์ด๋ํ ์กฐ์ ๋ก๋ด์ ์์ ํ๊ณ ๋งฅ๋ฝ์ธ์์ ์ธ ์ ์ด๋ฅผ ์คํํ๋ค.
Fig. 2. Bimanual manipulation in IsaacSim. Left: the robot performs a pick-
Fig. 3.
์ดํ: GenerativeMPC๋ ์๋ฏธ๋ก ์ ์ดํด์ ๋ฌผ๋ฆฌ์ ์์ ์ฑ์ ์ฒด๊ณ์ ์ผ๋ก ํตํฉํ๋ ์ฐฝ์์ ์ ๊ทผ์ผ๋ก, VLM-RAG ๊ธฐ๋ฐ ํ๋ผ๋ฏธํฐ ์์ฑ๊ณผ ๊ฒฝํ ๋ฉ๋ชจ๋ฆฌ์ ์ ๊ท ํ์ฉ์ ํตํด ์ํ ์ด๋ํ ์กฐ์ ๋ก๋ด์ ์ธ๊ฐ์ค์ฌ ์์จ์ฑ์ ํฌ๊ฒ ํฅ์์ํจ๋ค. ๊ด๋ฒ์ํ ์๋ฎฌ๋ ์ด์ ๋ฐ ์ค์ ๊ฒ์ฆ์ผ๋ก ์ ๋ขฐ์ฑ์ ์ ์ฆํ์ผ๋, ์ค์ ํ๋ซํผ ์คํ ํ๋์ ๋ถํฌ ์ธ robustness ๋ถ์์ด ์ถ๊ฐ ํ์ํ๋ค.