์ ์: Yuxuan Chen, Xiao Li | ๋ ์ง: 2025-06-21 | URL: https://arxiv.org/abs/2506.17639 📄 PDF
Fig. 1 : RLRC substantially compresses the VLA, leading to
Vision-Language-Action ๋ชจ๋ธ์ ์ค์ ๋ฐฐํฌ๋ฅผ ์ํด structured pruning, SFT/RL ๊ธฐ๋ฐ ์ฑ๋ฅ ๋ณต๊ตฌ, ๊ทธ๋ฆฌ๊ณ ์์ํ๋ฅผ ๊ฒฐํฉํ RLRC ์์ถ ๋ฐฉ๋ฒ์ ์ ์ํ์ฌ 8๋ฐฐ์ ๋ฉ๋ชจ๋ฆฌ ๊ฐ์์ 2.3๋ฐฐ์ ์ฒ๋ฆฌ๋ ํฅ์์ ๋ฌ์ฑํ๋ค.
Fig. 1 : RLRC substantially compresses the VLA, leading to
Fig. 5 : Overview of RLRC. RLRC contains three components: (1) structured pruning of VLA: structured pruning is employed
์ดํ: RLRC๋ VLA ์์ถ์ ์ํ ์ค์ฉ์ ์ด๊ณ ํฌ๊ด์ ์ธ ํ์ดํ๋ผ์ธ์ ์ ์ํ๋ฉฐ, RL ๊ธฐ๋ฐ ์ฑ๋ฅ ๋ณต๊ตฌ๋ผ๋ ์ฐฝ์์ ์ ๊ทผ์ผ๋ก ๊ธฐ์กด ์์ถ ๋ฐฉ๋ฒ์ ๋ฅ๊ฐํ๋ค. ์์ ์ ์ฝ ๋ก๋ด ํ๊ฒฝ์์์ VLA ๋ฐฐํฌ ๊ฐ๋ฅ์ฑ์ ํฌ๊ฒ ํฅ์์ํจ๋ค.