์ ์: Kwan-Yee Lin, Stella X. Yu | ๋ ์ง: 2025-05-09 | URL: https://arxiv.org/abs/2505.06218 📄 PDF
Figure 1. We propose training humanoids to hike complex trails, driving integrative skill development across visual perc
ํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ด ๋ณต์กํ ์ฐ๊ธธ์ ์์จ์ ์ผ๋ก ํ์ดํนํ๋๋ก ํ์ต์ํค๊ธฐ ์ํด ์๊ฐ ์ธ์, ์์ฌ๊ฒฐ์ , ์ด๋ ์คํ์ ํตํฉํ๋ LEGO-H ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. TC-ViT์ Hierarchical Latent Matching์ ํตํด ๋ค๋น๊ฒ์ด์ ๊ณผ ๋ก์ฝ๋ชจ์ ์ ๋จ์ผ ํ์ต ์ฒด๊ณ๋ก ํตํฉํ๋ค.
Figure 2. Hiking requires locomotion versatility, perceptual
Figure 3. LEGO-H framework overview. LEGO-H equips hu-
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ํ์ดํน์ ์๋ก์ด ๋ฒค์น๋งํฌ๋ก ์ ์ํ๊ณ TC-ViT์ HLM ๊ธฐ๋ฐ LEGO-H ํ๋ ์์ํฌ๋ฅผ ํตํด ๋ค๋น๊ฒ์ด์ ๊ณผ ๋ก์ฝ๋ชจ์ ์ ํตํฉ์ด๋ผ๋ ์ค๋๋ ๋ฌธ์ ์ ํ์ ์ ์ผ๋ก ์ ๊ทผํ๋ค. ๋ค๋ง ์๋ฎฌ๋ ์ด์ ์ค์ฌ์ ํ๊ฐ๊ฐ ์ค์ ๋ฐฐํฌ ๊ฐ๋ฅ์ฑ์ ์๋ฌธ์ ๋จ๊ธฐ์ง๋ง, ํด๋จธ๋ ธ์ด๋ ๋ก๋ด ์์จ์ฑ ๊ฐ๋ฐ์ ์ํ ๊ฐ๋ ฅํ ๊ธฐ์ด ์ ์๋ก์ ์ถฉ๋ถํ ์๋ฏธ ์๋ ๊ธฐ์ฌ์ด๋ค.