์ ์: Chen Gao, Liankai Jin, Xingyu Peng, Jiazhao Zhang, Yue Deng, Annan Li, He Wang, Si Liu | ๋ ์ง: 2025-06-11 | URL: https://arxiv.org/abs/2506.09839 📄 PDF
Figure 1: On the left, we present the large-scale OctoNav-Bench, which contains diverse instruction-
์์ ํ์์ ๋ฉํฐ๋ชจ๋ฌ ๋ฉํฐ๊ธฐ๋ฅ ์ง์๋ฅผ ๋ฐ๋ฅผ ์ ์๋ ์ผ๋ฐํ๋ embodied navigation ์์ด์ ํธ๋ฅผ ์ํด OctoNav-Bench ๋ฒค์น๋งํฌ์ OctoNav-R1 ๋ฐฉ๋ฒ์ ์ ์ํ๋ค. Think-Before-Action ์ถ๋ก ์ ํตํด ๋ณต์กํ ๋ค๋น๊ฒ์ด์ ์์ ์์ ํฅ์๋ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค.
Figure 1: On the left, we present the large-scale OctoNav-Bench, which contains diverse instruction-
Figure 4: Overview of the HTP for training OctoNav-R1. The model takes multi-model instruction
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ fragmented๋ embodied navigation ์์ ๋ค์ ํตํฉํ๋ ํฌ๊ด์ ์ธ ๋ฒค์น๋งํฌ์ ๋ฐฉ๋ฒ์ ์ฒ์ ์ ์ํ๋ฉฐ, Think-Before-Action์ ํตํ ๋ช ์์ reasoning ๋์ ์ผ๋ก ์ผ๋ฐํ๋ navigation ์์ด์ ํธ ๊ฐ๋ฐ์ ์ค์ํ ๊ธฐ์ฌ๋ฅผ ํ๋ค. ์ด๊ธฐ sim2real ๊ฒฐ๊ณผ๋ ์ค์ฉ์ ๊ฐ๋ฅ์ฑ์ ์์ฌํ์ง๋ง, ์ถ๊ฐ ์ค์ ํ๊ฒฝ ๊ฒ์ฆ์ด ํ์ํ๋ค.