์ ์: Justin Yu, Yide Shentu, Di Wu, Pieter Abbeel, Ken Goldberg, Philipp Wu | ๋ ์ง: 2025-10-31 | URL: https://arxiv.org/abs/2511.00153 📄 PDF
Fig. 1: Overview of the EgoMI framework. EgoMI captures egocentric human demonstrations with synchronized head and hand
EgoMI๋ ์ธ๊ฐ์ ๋์ํ๋ ๋จธ๋ฆฌ ๋ฐ ์ ์์ง์์ ํฌ์ฐฉํ๋ egocentric ๋ฐ์ดํฐ ์์ง ํ๋ ์์ํฌ๋ก, SPARKS ๋ฉ๋ชจ๋ฆฌ ๋ฉ์ปค๋์ฆ์ ํตํด ๊ธ์ํ ์์ ๋ณํ๋ฅผ ์ฒ๋ฆฌํ์ฌ ๋ฐ์ธ๊ฐํ ๋ก๋ด์ผ๋ก zero-shot ์ ์ด๋ฅผ ๋ฌ์ฑํ๋ค.
Fig. 4: Tabletop Task Rollout Sequence: (Left). The images show a real 29D policy evaluation rollout where the robot (1)
Fig. 1: Overview of the EgoMI framework. EgoMI captures egocentric human demonstrations with synchronized head and hand
์ดํ: EgoMI๋ ์ธ๊ฐ์ active vision๊ณผ manipulation์ ๋์์ ํฌ์ฐฉํ๋ ์ฐฝ์์ ํ๋ ์์ํฌ๋ก, SPARKS ๋ฉ์ปค๋์ฆ์ ํตํด ๊ธ์ํ ์์ ๋ณํ๋ฅผ ์ฐ์ํ๊ฒ ์ฒ๋ฆฌํ๋ฉฐ zero-shot transfer๋ฅผ ๋ฌ์ฑํด imitation learning์ embodiment gap ๋ฌธ์ ์ ์ค์ง์ ์๋ฃจ์ ์ ์ ์ํ๋ค.