์ ์: Yunchao Ma, Yizhuang Zhou, Yunhuan Yang, Tiancai Wang, Haoqiang Fan | ๋ ์ง: 2025-10-30 | URL: https://arxiv.org/abs/2510.26742 📄 PDF
Figure 2. Breakdown of the model running time. From a plain
ฯ0 ๋ ๋ฒจ์ multi-view VLA๋ฅผ ๋จ์ผ ์๋น์ GPU์์ 30Hz ํ๋ ์ ๋ ์ดํธ๋ก ์คํํ๊ธฐ ์ํด ๋ชจ๋ธ ์ถ๋ก ์ค๋ฒํค๋๋ฅผ ์ ๊ฑฐํ๋ ์ต์ ํ ๊ธฐ๋ฒ๋ค์ ์ ์ํ๊ณ , ์ค์๊ฐ ๋ก๋ด ์ ์ด๋ฅผ ์ํ Full Streaming Inference ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค.
Figure 2. Breakdown of the model running time. From a plain
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ VLA์ ์ค์๊ฐ ์คํ์ด ๋ถ๊ฐ๋ฅํ๋ค๋ ๊ธฐ์กด ์ธ์์ ๊นจ๊ณ , ์ฒด๊ณ์ ์ธ ์์ง๋์ด๋ง ๊ธฐ๋ฒ๋ค์ ํตํด 30Hz ์ค์๊ฐ ์ฒ๋ฆฌ๋ฅผ ๋ฌ์ฑํจ์ผ๋ก์จ ๋ก๋ด ์ ์ด์ ์๋ก์ด ๊ฐ๋ฅ์ฑ์ ์ ์ํ๋ค. ๋จ์ํ์ง๋ง ํจ๊ณผ์ ์ธ ์ต์ ํ ๊ธฐ๋ฒ๋ค๊ณผ Full Streaming Inference ํ๋ ์์ํฌ๋ ์ค์ฉ์ ๊ฐ์น๊ฐ ๋์ผ๋ฉฐ, ๊ตฌ์ฒด์ ์ธ ์ฝ๋ ๊ณต๊ฐ๋ ์ฌํ์ฑ์ ๋ณด์ฅํ๋ค.