์ ์: Zibo Zhou, Yue Hu, Lingkai Zhang, Zonglin Li, Siheng Chen | ๋ ์ง: 2025-05-27 | URL: https://arxiv.org/abs/2506.06487 📄 PDF
Figure 2: BeliefMapNav pipeline: The agent initializes with a 360ยฐ rotation. During exploration,
๋ณธ ๋ ผ๋ฌธ์ 3D voxel ๊ธฐ๋ฐ belief map์ ํ์ฉํ์ฌ zero-shot object navigation์์ LLM์ ์๋ฏธ๋ก ์ ์ถ๋ก ๊ณผ ๊ณ์ธต์ ๊ณต๊ฐ ์ ๋ณด๋ฅผ ํตํฉํจ์ผ๋ก์จ ๋ก๋ด์ด ์ฌ์ ํ์ต์ด๋ ์ฌ์ ๊ตฌ์ถ ๋งต ์์ด ์์ฐ์ด๋ก ์ง์ ๋ ๋์์ ๋ฏธ์ง์ ํ๊ฒฝ์์ ์ฐพ์ ์ ์๋๋ก ํ๋ค.
Figure 4: Visualization of the prior belief map, visibility map, and the posterior belief map, with an
Figure 2: BeliefMapNav pipeline: The agent initializes with a 360ยฐ rotation. During exploration,
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ 3D voxel-based belief map์ ํตํด LLM ์๋ฏธ๋ก ๊ณผ ๊ณต๊ฐ ๊ตฌ์กฐ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํตํฉํ๊ณ ํ๋ฅ ๊ธฐ๋ฐ ๊ฒฝ๋ก ๊ณํ์ผ๋ก zero-shot object navigation ์ฑ๋ฅ์ ๋ํญ ํฅ์์ํจ ์ฐ์ํ ๊ธฐ์ฌ์ด๋ค. ๋ค๋ง ์ค์ ๋ก๋ด ๋ฐฐ์น ์ ๊ณ์ฐ ๋ณต์ก๋์ LLM ์ค๋ฅ์ ๋ํ ๊ฐ๊ฑด์ฑ ๊ฒํ ๊ฐ ํ์ํ๋ค.