TrajBooster: Boosting Humanoid Whole-Body Manipulation via Trajectory-Centric Learning
์ ์: Jiacheng Liu, Pengxiang Ding, Qihang Zhou, Yuxuan Wu, Da Huang, Zimian Peng, Wei Xiao, Weinan Zhang, Lixin Yang, Cewu Lu, Donglin Wang | ๋ ์ง: 2026-03-19 | DOI: 10.48550/arXiv.2509.11839 📄 PDF
Essence
Fig. 1: Overview of framework. Our proposed TrajBooster uses abundant existing robot manipulation datasets. It retargets
TrajBooster๋ ํ ๋ ํด๋จธ๋
ธ์ด๋์์ ์ถ์ถํ ๋ค์ํ ๊ถค์ ๋ฐ์ดํฐ๋ฅผ ์ด์กฑ ํด๋จธ๋
ธ์ด๋(Unitree G1)๋ก ์ ์ดํ์ตํ์ฌ, ๋ถ์กฑํ ์ด์กฑ ํด๋จธ๋
ธ์ด๋ ๋ฐ์ดํฐ๋ฅผ ๋ณด์ถฉํ๊ณ Vision-Language-Action ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํฅ์์ํค๋ ์ค์๊ฐ-์๋ฎฌ๋ ์ด์
-์ค์๊ฐ ํ์ดํ๋ผ์ธ์ด๋ค.
Motivation
- Known: Vision-Language-Action ๋ชจ๋ธ์ ๋ค์ํ ๋ก๋ด ๊ฐ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ฃผ์ง๋ง, ๊ณ ํ์ง ์์ฐ์ด ๋ถ์กฑํ ๋ ์๋ก์ด ๋ก๋ด์ ์ก์
๊ณต๊ฐ์ ๋น ๋ฅด๊ฒ ์ ์ํ์ง ๋ชปํ๋ค. ํนํ ์ด์กฑ ํด๋จธ๋
ธ์ด๋์ ์ ์ ์กฐ์์ ๋ณต์กํ ๋์ญํ ๊ท ํ ์ ์ง๊ฐ ํ์ํด ๋์ ์ ์ด๋ค.
- Gap: ๊ธฐ์กด ์ฐ๊ตฌ๋ ์ฃผ๋ก ํ์ ์กฐ์์ด๋ ์กฐ์กํ ์ ์ ์ ์ด์ ๊ตญํ๋์ด ์์ผ๋ฉฐ, ๊ด๋ฒ์ํ ๋์ด์์์ ์ด์กฑ ํด๋จธ๋
ธ์ด๋ ์ ์ ์กฐ์์ ๋ค๋ฃจ๋ VLA ๋ชจ๋ธ์ด ๋ถ์กฑํ๋ค. ๋ํ ์ด์กฑ ํด๋จธ๋
ธ์ด๋์ ๋๊ท๋ชจ ๋์ ๋ฐ์ดํฐ ์์ง์ ๋น์ฉ์ด ๋์ ๋ฐ์ดํฐ ๋ถ์กฑ ๋ฌธ์ ๊ฐ ์ฌ๊ฐํ๋ค.
- Why: ์ด์กฑ ํด๋จธ๋
ธ์ด๋์ ๊ฐ์ ์ฉ ์กฐ์ ๋ฅ๋ ฅ์ ์ค์ ํ๊ฒฝ์์์ ๋ก๋ด ์์จ์ฑ์ ํฌ๊ฒ ํฅ์์ํค๋ฉฐ, ์ ํ๋ ์ค์ ๋ฐ์ดํฐ๋ก๋ ํจ๊ณผ์ ์ผ๋ก ํ๋ จํ ์ ์๋ ๋ฐฉ๋ฒ์ ๋ก๋ด ์์ฉ์ ์ค์ฉ์ฑ์ ๋์ธ๋ค.
- Approach: ๋ง๋จ ์ดํํฐ 6D ๊ถค์ ์ ํํํ์ ๋ถ๋ณ ์ธํฐํ์ด์ค๋ก ์ฌ์ฉํ์ฌ ํ ๋ ํด๋จธ๋
ธ์ด๋ ๋ฐ์ดํฐ๋ฅผ ์ด์กฑ ํด๋จธ๋
ธ์ด๋๋ก ๋ณํํ๊ณ , heuristic-enhanced harmonized online DAgger๋ฅผ ํตํด ์ ์ฐจ์ ๊ถค์ ์ฐธ์กฐ๋ฅผ ๊ณ ์ฐจ์ ์ ์ ๋์์ผ๋ก ๋งคํํ๋ค. ์์ฑ๋ ํฉ์ฑ ๋ฐ์ดํฐ๋ก VLA๋ฅผ post-pre-trainํ ํ ์ต์ 10๋ถ์ ์ค์ ์๊ฒฉ ์กฐ์ข
๋ฐ์ดํฐ๋ก ๋ฏธ์ธ์กฐ์ ํ๋ค.
Achievement
Fig. 1: Overview of framework. Our proposed TrajBooster uses abundant existing robot manipulation datasets. It retargets
- ์ต์ด์ ์ด์กฑ ํด๋จธ๋
ธ์ด๋ ์ ์ ์กฐ์ VLA: ๊ด๋ฒ์ํ ๋์ ๊ถค์ ์ปค๋ฒ๋ฆฌ์ง๋ฅผ ๊ฐ์ง ์ค์ ํ๊ฒฝ์์์ ์ฒซ ๋ฒ์งธ cross-embodiment ์ด์กฑ ํด๋จธ๋
ธ์ด๋ ์ ์ ์กฐ์ VLA ๋ฌ์ฑ
- ๋ฐ์ดํฐ ํจ์จ์ฑ ๊ทน๋ํ: ๋จ 10๋ถ์ ์ค์ ์๊ฒฉ ์กฐ์ข
๋ฐ์ดํฐ๋ง์ผ๋ก ์ค์ฟผํ
, ๊ต์ฐจ ๋์ด ์กฐ์, ์กฐ์ ๋ ์ ์ ์ด๋ ๋ฑ์ ๊ฐ์ ์ฉ ์์
์ํ
- ๊ฐํ๋ ๊ฐ๊ฑด์ฑ๊ณผ ์ผ๋ฐํ: ์กด์ฌํ๋ ํ ๋ ํด๋จธ๋
ธ์ด๋ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ์ก์
๊ณต๊ฐ ์ดํด๋์ ์์ (zero-shot) ๊ธฐ์ ์ ์ด ๋ฅ๋ ฅ ํ์ ํ ๊ฐ์
- ํํํ์ ๋ถ๋ณ ์ธํฐํ์ด์ค: ๋ง๋จ ์ดํํฐ ๊ถค์ ์ ๊ณตํต ์ธํฐํ์ด์ค๋ก ์ฌ์ฉํ์ฌ ๋ค์ํ ๋ก๋ด ํํ ๊ฐ ํจ๊ณผ์ ์ธ ์ง์ ์ ์ด ๊ฐ๋ฅ
How
Fig. 1: Overview of framework. Our proposed TrajBooster uses abundant existing robot manipulation datasets. It retargets
- Agibot-World Beta ๋ฐ์ดํฐ์
์์ ํ ๋ ํด๋จธ๋
ธ์ด๋์ 6D ์ด์ค ํ ๋ง๋จ ์ดํํฐ ๊ถค์ ์ถ์ถ
- Isaac Gym ์๋ฎฌ๋ ์ดํฐ์์ heuristic-enhanced harmonized online DAgger ์๊ณ ๋ฆฌ์ฆ์ผ๋ก Unitree G1์ ์ ์ ์ ์ด๊ธฐ ํ๋ จํ์ฌ ์ ์ฐจ์ ๊ถค์ ์ฐธ์กฐ๋ฅผ ๊ณ ์ฐจ์ ์กฐ์ธํธ ๋์์ผ๋ก ๋งคํ
- ์์ฑ๋ ํฉ์ฑ ๋ฐ์ดํฐ๋ก โจsource vision, source language, target actionโฉ ํํ์ ์ด์ง์ ์ผ์ค์ ๊ตฌ์ฑ
- ๊ธฐ์กด pre-trained VLA ๋ชจ๋ธ์ ํฉ์ฑ ๋ฐ์ดํฐ๋ก post-pre-trainํ ํ, ์์งํ ์ค์ ์๊ฒฉ ์กฐ์ข
๋ฐ์ดํฐ โจtarget vision, target language, target actionโฉ๋ก ๋ฏธ์ธ์กฐ์
- Unitree G1 ํ๋ซํผ์์ ๋ฐฐํฌ ๋ฐ ๋ค์ํ ์ ์ ์กฐ์ ์์
์์ ํ๊ฐ
Originality
- ์ต์ด์ cross-embodiment ์ด์กฑ ํด๋จธ๋
ธ์ด๋ ์ ์ ์กฐ์: ๊ธฐ์กด ์ฐ๊ตฌ๋ฅผ ๋์ด ํ ๋ ํด๋จธ๋
ธ์ด๋์์ ์ด์กฑ ํด๋จธ๋
ธ์ด๋๋ก์ ๊ด๋ฒ์ ์ ์ ์กฐ์ ์ ์ดํ์ต ๋ฌ์ฑ
- ๋ง๋จ ์ดํํฐ ๊ถค์ ๊ธฐ๋ฐ ์ค์๊ฐ-์๋ฎฌ๋ ์ด์
-์ค์๊ฐ ํ์ดํ๋ผ์ธ: ํํํ์ ์ฐจ์ด๋ฅผ ๊ทน๋ณตํ๋ ์๋ก์ด cross-embodiment ์ ์ด ๋ฐฉ์ ์ ์
- ์ต์ ์ค์ ๋ฐ์ดํฐ ์๊ตฌ: ๊ธฐ์กด ๋๊ท๋ชจ ์ค์ ๋ฐ์ดํฐ ์์ง์ ํ์์ฑ์ ๊ทน์ ์ผ๋ก ๊ฐ์์ํด(10๋ถ)
- Heuristic-enhanced harmonized online DAgger: ์ ์ฐจ์ ๊ถค์ ์ฐธ์กฐ๋ฅผ ๊ณ ์ฐจ์ ์ ์ ๋์์ผ๋ก ํจ๊ณผ์ ์ผ๋ก ๋งคํํ๋ ์๋ก์ด ํ๋ จ ์๊ณ ๋ฆฌ์ฆ
Limitation & Further Study
- ์๋ฎฌ๋ ์ด์
-์ค์ ๊ฐ๊ทน(sim-to-real gap): ์๋ฎฌ๋ ์ด์
retargeting ๊ฒฐ๊ณผ๊ฐ ์ค์ ํ๊ฒฝ์์ ์๋ฒฝํ๊ฒ ์ฌํ๋์ง ์์ ์ ์์ผ๋ฉฐ, ์ด๋ก ์ธํ ์ฑ๋ฅ ์ ํ ๊ฐ๋ฅ์ฑ
- ์ ํ๋ ์๋ณธ ๋ฐ์ดํฐ์
์์กด์ฑ: Agibot-World Beta ๋ฐ์ดํฐ์
์ ์์
๋ค์์ฑ๊ณผ ์ง์ ๋ฐ๋ผ ์ฑ๋ฅ์ด ํฌ๊ฒ ์ํฅ์ ๋ฐ์ ์ ์์
- ๋จ์ผ ํ๊ฒ ํ๋ซํผ ํ๊ฐ: Unitree G1์๋ง ๊ฒ์ฆ๋์ด ๋ค๋ฅธ ์ด์กฑ ํด๋จธ๋
ธ์ด๋๋ก์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ ๋ฏธ๊ฒ์ฆ
- ํ์ ์ฐ๊ตฌ ๋ฐฉํฅ: (1) ๋ ๋ง์ ์ด์กฑ ํด๋จธ๋
ธ์ด๋ ํ๋ซํผ์์์ ๊ฒ์ฆ, (2) ๋๋ฉ์ธ ์ ์ ๊ธฐ๋ฒ์ ํตํ sim-to-real ๊ฐ๊ทน ๊ฐ์, (3) ๋ค์ํ ์๋ณธ ๋ก๋ด ํํ๋ก๋ถํฐ์ ์ ์ดํ์ต ํจ๊ณผ ๋ถ์
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: TrajBooster๋ ํํํ์ ์ผ๋ก ๋ค๋ฅธ ๋ก๋ด ๊ฐ ์ ์ดํ์ต์ด๋ผ๋ ์ด๋ ค์ด ๋ฌธ์ ์ ๋ํด ์ค์ฉ์ ์ด๊ณ ํจ๊ณผ์ ์ธ ํด๊ฒฐ์ฑ
์ ์ ์ํ๋ค. ์ต์ํ์ ์ค์ ๋ฐ์ดํฐ๋ง์ผ๋ก๋ ์ด์กฑ ํด๋จธ๋
ธ์ด๋์ ๊ด๋ฒ์ํ ์ ์ ์กฐ์์ ๊ฐ๋ฅํ๊ฒ ํ ์ ์์ ๋ก๋ด ํ์ต์ ์ค์ฉ์ฑ ์ธก๋ฉด์์ ๋งค์ฐ ์ค์ํ ๊ธฐ์ฌ๋ฅผ ํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์