์ ์: Weidong Huang, Zhehan Li, Hangxin Liu, Biao Hou, Yao Su, Jingwen Zhang | ๋ ์ง: 2026-01-29 | URL: https://arxiv.org/abs/2601.21363 📄 PDF
Figure 1: Large-scale pretraIning and efficient FineTuning (LIFT) Framework. In stage (i), we
๋๊ท๋ชจ ๋ณ๋ ฌ ์๋ฎฌ๋ ์ด์ ์์ SAC ๊ธฐ๋ฐ ์ ์ฑ ์ฌ์ ํ์ต๊ณผ ๋ฌผ๋ฆฌ-์ ๋ณด ๊ธฐ๋ฐ ์ธ๊ณ ๋ชจ๋ธ์ ํ์ฉํ ํจ์จ์ ๋ฏธ์ธ์กฐ์ ์ ๊ฒฐํฉํ์ฌ ํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ ์๋ฎฌ-ํฌ-๋ฆฌ์ผ ์ ์ด์ ์์ ํ ์ ์์ ์คํํ๋ค.
Figure 2: Results of finetuning Booster T1 robot with varying target speeds. The black dashed line
ํ์ฅ ๊ฐ๋ฅํ SAC ๊ตฌํ: JAX ๊ธฐ๋ฐ SAC๊ฐ ๋๊ท๋ชจ ๋ณ๋ ฌ ์๋ฎฌ๋ ์ด์ ์์ ๊ฐ๋ ฅํ ์๋ ด์ ์ง์ํ๊ณ ๋จ์ผ NVIDIA RTX 4090์์ 1์๊ฐ ๋ด์ ์ค์ ํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ผ๋ก์ ๋ฌด์ท ๋ฐฐํฌ ๋ฌ์ฑ
์์ ํ๊ณ ํจ์จ์ ์ธ ๋ฏธ์ธ์กฐ์ ์ ๋ต: ๊ฒฐ์ ์ ์ ์ฑ ์คํ๊ณผ ์ธ๊ณ ๋ชจ๋ธ ๋ด ํ๋ฅ ์ ํ์ ๋ถ๋ฆฌ๋ฅผ ํตํด ์ ์ ์ค ์ํ์ฑ ์ํ ๋ฐ ์ํ ํจ์จ์ฑ ๊ฐ์
๊ณต๊ฐ ์์ค ํ์ดํ๋ผ์ธ: ์ฌ์ ํ์ต, ๋ฌด์ท ๋ฐฐํฌ, ๋ฏธ์ธ์กฐ์ ์ ์์ฐ๋ฅด๋ ํตํฉ ํด๋จธ๋ ธ์ด๋ ์ ์ด ํ์ดํ๋ผ์ธ ๊ณต๊ฐ
Figure 1: Large-scale pretraIning and efficient FineTuning (LIFT) Framework. In stage (i), we
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ๋๊ท๋ชจ ์๋ฎฌ๋ ์ด์ ํจ์จ์ฑ๊ณผ ์ํ-ํจ์จ์ ์ ์์ ํจ๊ณผ์ ์ผ๋ก ๊ฒฐํฉํ๊ณ , ์์ ์ฑ์ ๊ฐ์กฐํ ๋ฏธ์ธ์กฐ์ ์ ๋ต์ผ๋ก ํด๋จธ๋ ธ์ด๋ ์ ์ด์ ์ค์ง์ ๋์ ์ ํด๊ฒฐํ๋ค. ์ค๋ก๋ด ๊ฒ์ฆ๊ณผ ๊ณต๊ฐ ์ฝ๋๋ ๋ก๋ณดํฑ์ค ์ปค๋ฎค๋ํฐ์ ์ฆ์ ํ์ฉ ๊ฐ๋ฅํ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ๋ค.