์ ์: Lik Hang Kenny Wong, Xueyang Kang, Kaixin Bai, Jianwei Zhang | ๋ ์ง: 2025-05-01 | URL: https://arxiv.org/abs/2505.01458 📄 PDF
Fig. 2. A taxonomy of this survey, focusing on two main tasks of Embodied AI: Navigation and Manipulation. We discuss th
๋ณธ ๋ ผ๋ฌธ์ Embodied AI ์๋์ ๋ก๋ด์ ๋ค๋น๊ฒ์ด์ ๊ณผ ์กฐ์ ์์ ์ ์ํ Physics Simulator์ ์ญํ ์ ์ข ํฉ์ ์ผ๋ก ๋ถ์ํ๊ณ , sim-to-real ์ ์ด์ ๊ฐ๊ทน์ ์ขํ๊ธฐ ์ํ ์๋ฎฌ๋ ์ดํฐ ์์ฑ, ๋ฒค์น๋งํฌ, ํ๊ฐ ์งํ ๋ฐ ์ต์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ค.
Fig. 1. Timeline illustrating the evolution of navigation (top) and manipulation (bottom) research in Embodied AI from
Fig. 3. This diagram outlines the four key steps in navigation tasksโPerception, Memory Building, Decision-Making, and
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ Embodied AI ์๋์ navigation๊ณผ manipulation ์ฐ๊ตฌ๋ฅผ ํฌ๊ด์ ์ผ๋ก ์ ๋ฆฌํ ์์์ ์ ํ ์ค๋ฌธ์กฐ์ฌ๋ก, ํ๋์ simulator ๊ธฐ์ ๊ณผ ์ต์ ๋ฐฉ๋ฒ๋ก (world model, geometric equivariance, VLA)์ ์ฒด๊ณ์ ์ผ๋ก ๋ถ์ํ์ฌ ์ฐ๊ตฌ์๋ค์ ๋๊ตฌ ์ ํ๊ณผ ๋ฐฉ๋ฒ๋ก ์ค๊ณ์ ์ค์ง์ ๊ฐ์ด๋๋ฅผ ์ ๊ณตํ๋ค.