์ ์: Shoubin Chen, Zehao Wu, Kai Zhang, Chunyu Li, Baiyang Zhang, Fei Ma, Fei Richard Yu, Qingquan Li | ๋ ์ง: 2025-02-21 | URL: https://arxiv.org/abs/2502.15336 📄 PDF
Figure 1: A timeline of research progress in the field of Embodied Perception, Navigation
Embodied Multimodal Large Models (EMLMs)๋ Large Language Models, Large Vision Models ๋ฑ์ ๊ธฐ์ด ๋ชจ๋ธ๋ค์ ๊ฒฐํฉํ์ฌ ์ง๊ฐ, ์ธ์ง, ํ๋์ ๋ฌผ๋ฆฌ์ ํ๊ฒฝ์์ ํตํฉํ๋ ์ฒด๊ณ์ ์ธ ์ข ํฉ ๋ฆฌ๋ทฐ์ด๋ค. ๋ณธ ๋ ผ๋ฌธ์ 300๊ฐ ๋ ผ๋ฌธ์ ๋ถ์ํ์ฌ EMLMs์ ๋ฐ์ , ๋ฐ์ดํฐ์ , ๋ฐ ๋ฏธ๋ ๋ฐฉํฅ์ ๋ํ ์ฒซ ๋ฒ์งธ ์ฒด๊ณ์ ๋ถ์์ ์ ๊ณตํ๋ค.
Figure 1: A timeline of research progress in the field of Embodied Perception, Navigation
Figure 1: A timeline of research progress in the field of Embodied Perception, Navigation
์ดํ: ๋ณธ ๋ฆฌ๋ทฐ๋ EMLMs ๋ถ์ผ์ ์ฒซ ๋ฒ์งธ ์ฒด๊ณ์ ์ข ํฉ ๋ถ์์ผ๋ก์, foundational models๋ถํฐ embodied tasks๊น์ง full-stack์ ๋ค๋ฃจ๋ฉฐ ์ต์ ์ฐ๊ตฌ ๋ํฅ์ ํฌ๊ด์ ์ผ๋ก ์ ๋ฆฌํ๋ค. ๋ช ํํ ๊ตฌ์กฐ์ ํ๋ถํ ์ฌ๋ก๋ก ์ด ๊ธ์ํ ๋ฐ์ ํ๋ ๋ถ์ผ์ ํํฉ๊ณผ ๋ฏธ๋ ๋ฐฉํฅ์ ์ ์ํ๋ ๋งค์ฐ ๊ฐ์น ์๋ ๋ฆฌ๋ทฐ์ด๋ค.