์ ์: Gang Zhang | ๋ ์ง: 2025-12-19 | DOI: 10.48550/arXiv.2512.17183 📄 PDF
Figure 1: System Overview: Training and Inference Pipeline.
์ด ์ฐ๊ตฌ๋ ์์ฑ ์ ๋ ฅ์ผ๋ก๋ถํฐ ์๋ฏธ๋ก ์ ์ผ๋ก ์ ์ ํ ์ ์ค์ฒ๋ฅผ ์์ฑํ๊ณ ์ค์๊ฐ์ผ๋ก ํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ ๋ฐฐํฌํ๋ end-to-end ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. LLM๊ณผ Motion-GPT๋ฅผ ํ์ฉํ ์ ์ค์ฒ ์์ฑ๊ณผ imitation learning ๊ธฐ๋ฐ์ MotionTracker ์ ์ด ์ ์ฑ ์ ํตํฉํ์ฌ ์๋ฏธ ์๋ ๋น์ธ์ด์ ์ํต์ ์คํํ๋ค.
Figure 2: Comparison of Original vs. Reconstructed G1 Mo-
Figure 1: System Overview: Training and Inference Pipeline.
์ดํ: ์ด ๋ ผ๋ฌธ์ ์์ฑ ๊ธฐ๋ฐ ์๋ฏธ๋ก ์ ์ ์ค์ฒ ์์ฑ๊ณผ ์ค์๊ฐ ๋ก๋ด ๋ฐฐํฌ๋ฅผ ํตํฉํ ์๋ฏธ ์๋ ์ฐ๊ตฌ๋ก, LLM, Motion-GPT, imitation learning์ ์ฐฝ์์ ์ผ๋ก ๊ฒฐํฉํ์ฌ ์์ ํ end-to-end ํ์ดํ๋ผ์ธ์ ์คํํ๋ค. ๋ค๋ง ํ๊ฐ์ ์ ๋์ฑ ๊ฐํ์ ๋ค์ํ ํ๊ฒฝ์์์ robustness ๊ฒ์ฆ์ด ํ์ํ๋ค.