์ ์: Jianglong Ye, Keyi Wang, Chengjing Yuan, Ruihan Yang, Yiquan Li, Jiyue Zhu, Yuzhe Qin, Xueyan Zou, Xiaolong Wang | ๋ ์ง: 2025-06-20 | URL: https://arxiv.org/abs/2506.17198 📄 PDF
Fig. 1: The Dex1B benchmark consists of 1B generated high-quality demonstrations for grasping (top) and articulation (mi
์์ฑ ๋ชจ๋ธ๊ณผ ์ต์ ํ ๋ฐฉ๋ฒ์ ๊ฒฐํฉํ์ฌ 10์ต ๊ฐ์ ๊ณ ํ์ง ์๊ฐ๋ฝ ์กฐ์ ์์ฐ์ ์์ฑํ Dex1B ๋ฐ์ดํฐ์ ๊ณผ ์ด๋ฅผ ํ์ฉํ๋ DexSimple ๋ฐฉ๋ฒ์ ์ ์ํ์ฌ ์๊ฐ๋ฝ ์กฐ์ ์์ ์ ์ฑ๋ฅ์ 22% ํฅ์์์ผฐ๋ค.
Fig. 1: The Dex1B benchmark consists of 1B generated high-quality demonstrations for grasping (top) and articulation (mi
Fig. 2: Dex1B demonstration collection. The engine takes object assets and hand pose initialization as input, using a co
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ์์ฑ ๋ชจ๋ธ๊ณผ ์ต์ ํ๋ฅผ ๊ฒฐํฉํ์ฌ 10์ต ๊ฐ์ ๋๊ท๋ชจ ์๊ฐ๋ฝ ์กฐ์ ์์ฐ ๋ฐ์ดํฐ์ ์ ์ฒด๊ณ์ ์ผ๋ก ๊ตฌ์ฑํ๊ณ , ์ด๋ฅผ ํ์ฉํ ๊ฐ๋จํ๋ฉด์๋ ํจ๊ณผ์ ํ ํ์ต ๋ฐฉ๋ฒ์ผ๋ก ์ต๊ณ ์ฑ๋ฅ์ ๋ฌ์ฑํ ์ค์ํ ๊ธฐ์ฌ์ด๋ค. ๋ฐ์ดํฐ์ ์ ๊ท๋ชจ, ๋ค์์ฑ, ํ์ง ์ธก๋ฉด์์ ํ์ ์ ์ด๋ฉฐ ์ค์ ๋ก๋ด ์คํ์ ํตํ ๊ฒ์ฆ๋ ์ถฉ๋ถํ๋ค.