์ ์: Bangguo Yu, Hamidreza Kasaei, Ming Cao | ๋ ์ง: 2023-04-11 | URL: https://arxiv.org/abs/2304.05501 📄 PDF
Fig. 2: The architecture of the target navigation framework. The framework takes RGB-D images as input to generate a
๋ํ ์ธ์ด๋ชจ๋ธ(LLM)์ ํ์ฉํ์ฌ ์๋ฏธ์ ๋งต๊ณผ ํ๋ก ํฐ์ด ์ ํ์ ํตํด ๋ฏธ์ง์ ํ๊ฒฝ์์ ์๊ฐ์ ๋ชฉํ ํญ๋ฒ์ ์ํํ๋ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. Zero-shot๊ณผ feed-forward ๋ ๊ฐ์ง ํจ๋ฌ๋ค์์ผ๋ก ์์์ ์ถ๋ก ์ ์ด์ฉํ ํจ์จ์ ํ์์ ๋ฌ์ฑํ๋ค.
Fig. 1: Visual target navigation example. The robot explores
Fig. 2: The architecture of the target navigation framework. The framework takes RGB-D images as input to generate a
์ดํ: LLM์ ์์์ ์ง์์ ์๋ฏธ์ ํ์์ ํ์ฉํ๋ ์ฐฝ์์ ์ธ ์ ๊ทผ์ผ๋ก ํ์ต ๋น์ฉ์ ํฌ๊ฒ ์ ๊ฐํ๋ฉด์๋ ์ฐ์ํ ์ผ๋ฐํ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค. Zero-shot ํ์ต ๋ฅ๋ ฅ๊ณผ ์ค์ ๋ก๋ด ์คํ์ ํตํด ์ค์ฉ์ฑ์ ์ ์ฆํ ์๋ฏธ ์๋ ์ฐ๊ตฌ์ด๋, ์ค์๊ฐ ์ฑ๋ฅ๊ณผ ๋ค์ํ ํ๊ฒฝ์์์ ํ์ฅ์ฑ ๊ฒ์ฆ์ด ํ์ํ๋ค.