์ ์: Kevin Black, Manuel Y. Galliker, Sergey Levine | ๋ ์ง: 2025-06-09 | URL: https://arxiv.org/abs/2506.07339 📄 PDF
Real-time chunking (RTC)์ diffusion ๋๋ flow ๊ธฐ๋ฐ VLA์ inference ์๊ฐ์ action chunking ์ ์ฑ ์ ๋น๋๊ธฐ์ ์ผ๋ก ์คํํ๋ ์๊ณ ๋ฆฌ์ฆ์ผ๋ก, ํ์ฌ chunk ์คํ ์ค ๋ค์ chunk๋ฅผ ์์ฑํ๋ฉด์ inference ์ง์ฐ์ผ๋ก ์ธํ ๋ถ์ฐ์์ฑ์ ์ ๊ฑฐํ๋ค.
Figure 1: Top: Real-time chunking (RTC) enables the robot to perform highly dexterous and dynamic tasks,
์ดํ: RTC๋ modern VLA์ inference latency ๋ฌธ์ ๋ฅผ ์ค์ฉ์ ์ผ๋ก ํด๊ฒฐํ๋ ์๋ฆฌํ inference-time ์๊ณ ๋ฆฌ์ฆ์ผ๋ก, flow matching์ ๊ตฌ์กฐ๋ฅผ ์ฐฝ์์ ์ผ๋ก ํ์ฉํ๋ฉด์๋ ๊ธฐ์กด ๋ชจ๋ธ์ ๋ํ ์ฌํ์ต์ ์๊ตฌํ์ง ์์ ์ฆ์ ์ ์ฉ ๊ฐ๋ฅํ๋ค. ์ค์ ๋ก๋ด ์์ ์์์ ์ฐ์ํ ์ฑ๋ฅ๊ณผ latency robustness๋ embodied AI ์์คํ ์ ์ค์ฉํ์ ์ค์ํ ๊ธฐ์ฌ๋ฅผ ์ ์ํ๋ค.