ClimbingCap: Multi-Modal Dataset and Method for Rock Climbing in World Coordinate
์ ์: Ming Yan, Xincheng Lin, Yuhua Luo, Shuqi Fan, Yudi Dai, Qixin Zhong, Lincai Zhong, Yuexin Ma, Lan Xu, Chenglu Wen, Siqi Shen, Cheng Wang | ๋ ์ง: 2025-03-27 | URL: https://arxiv.org/abs/2503.21268 📄 PDF
Essence
Figure 1. Overview. To address the challenging problem of global climbing motion recovery, we collect the dataset Ascend
ClimbingCap์ RGB์ LiDAR ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ์๋ฒฝ ๋ฑ๋ฐ ๋์์ ๊ธ๋ก๋ฒ ์ขํ๊ณ์์ ์ ํํ๊ฒ ๋ณต์ํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ๋ฉฐ, ๋๊ท๋ชจ ๋์ ์ ๋ฑ๋ฐ ๋์ ๋ฐ์ดํฐ์
AscendMotion์ ๊ตฌ์ถํ๋ค.
Motivation
- Known: ๊ธฐ์กด Human Motion Recovery ์ฐ๊ตฌ๋ ์ฃผ๋ก ๋ฌ๋ฆฌ๊ธฐ ๊ฐ์ ์ง๋ฉด ๊ธฐ๋ฐ ๋์์ ์ง์คํ์ผ๋ฉฐ, RGB ์ด๋ฏธ์ง ๊ธฐ๋ฐ ์นด๋ฉ๋ผ ๊ณต๊ฐ HMR ๋ฐฉ๋ฒ๋ค๊ณผ ์ต๊ทผ์ ์๋ ์ขํ HMR ๋ฐฉ๋ฒ๋ค์ด ์ ์๋์๋ค. ๋ฑ๋ฐ ๋์ ๋ฐ์ดํฐ์
์ผ๋ก๋ SPEED21(2D, 46k ํ๋ ์)๊ณผ CIMI4D(3D, 180k ํ๋ ์)๋ง ๊ณต๊ฐ๋์ด ์๋ค.
- Gap: ๊ธฐ์กด ๋ฑ๋ฐ ๋์ ๋ฐ์ดํฐ์
์ ๊ท๋ชจ๊ฐ ์๊ณ ๋์ด๋๊ฐ ๋ฎ์ผ๋ฉฐ, ํ์กดํ๋ HMR ๋ฐฉ๋ฒ๋ค์ ์คํ-๊ทธ๋ผ์ด๋ ์์ง์์ด๋ฉด์ ๋ณต์กํ ํฌ์ฆ์ ๊ธ๋ก๋ฒ ์์น ์ ํํ ๋ณต์์ด ํ์ํ ๋ฑ๋ฐ ๋์์ ์ ๋๋ก ์บก์ฒํ์ง ๋ชปํ๋ค.
- Why: ๋ฑ๋ฐ์ ์ฌ๋ฆผํฝ ์ ์ ์ข
๋ชฉ์ด ๋์์ง๋ง ๋์ ์บก์ฒ ์ฐ๊ตฌ๋ ๋ถ์กฑํ๋ฉฐ, ์ ํํ ๋ฑ๋ฐ ๋์ ๋ถ์์ ์คํฌ์ธ ์ฑ๋ฅ ๋ถ์, ์์ ๊ต์ก, ๊ธฐ์ ๊ฐ์ ์ ํ์์ ์ด๋ค.
- Approach: RGB์์๋ ์นด๋ฉ๋ผ ์ขํ์ ํฌ์ฆ๋ฅผ, LiDAR ํฌ์ธํธ ํด๋ผ์ฐ๋์์๋ ๊ธ๋ก๋ฒ ์ขํ์ ์์น๋ฅผ ๋ณ๋๋ก ๋ณต์ํ ํ ์ด๋ค์ ๊ฒฐํฉํ๊ณ ์ต์ ํํ๋ separate coordinate decoding ์ ๋ต์ ์ฑํํ๋ฉฐ, post-processing๊ณผ semi-supervised ํ์ต์ผ๋ก ์ผ๊ด์ฑ๊ณผ ์ฑ๋ฅ์ ํฅ์์ํจ๋ค.
Achievement
Figure 5. Qualitative Evaluation in the AscendMotion and CIMI4D dataset. The left and right areas show the results of Ca
- AscendMotion ๋ฐ์ดํฐ์
: 412k ํ๋ ์์ RGB, LiDAR, IMU ๋ฐ์ดํฐ๋ก ๊ตฌ์ฑ๋๋ฉฐ 22๋ช
์ ์๋ จ๋ ๋ฑ๋ฐ ์ฝ์น์ 12๊ฐ ์๋ฒฝ์์์ ๋์์ ํฌํจํ์ฌ ๊ธฐ์กด ๋ฐ์ดํฐ์
(CIMI4D 180k)๋ณด๋ค 2๋ฐฐ ์ด์ ํฌ๊ณ ๋์ด๋๊ฐ ๋๋ค.
- ClimbingCap ๋ฐฉ๋ฒ: Separate coordinate decoding, post-processing, semi-supervised training์ ์ผ์ค ์ ๋ต์ผ๋ก ๊ธ๋ก๋ฒ ์ขํ๊ณ์์ ์ฐ์์ ์ธ 3D ๋ฑ๋ฐ ๋์์ ๋ณต์ํ๋ฉฐ ๊ธฐ์กด ์ต์ฒจ๋จ ๋ฐฉ๋ฒ๋ค์ ๋ฅ๊ฐํ๋ค.
- ํฌ๊ด์ ๊ฒ์ฆ: ๋ค์ค ๋ฐ์ดํฐ์
์์ ๋ค์ํ ์ต์ฒจ๋จ ๋ฐฉ๋ฒ๋ค๊ณผ์ ๊ด๋ฒ์ํ ์คํ์ ํตํด ClimbingCap์ ์ฐ์์ฑ์ ์
์ฆํ๋ค.
How
Figure 2. Overview of ClimbingCap. The arrows indicate the three stages of the ClimbingCap framework: separate coordinat
- ์
๋ ฅ ๋ฐ ํน์ฑ ์ถ์ถ: RGB ์ด๋ฏธ์ง์ ํฌ์ธํธ ํด๋ผ์ฐ๋๋ฅผ ์
๋ ฅ๋ฐ์ผ๋ฉฐ, ํฌ์ธํธ ํด๋ผ์ฐ๋๋ฅผ extrinsic matrix๋ก ์๋ ์ขํ์์ ์นด๋ฉ๋ผ ์ขํ๋ก ๋ณํํ๋ค.
- Separate coordinate decoding: RGB ์ํ์ค์์ ์นด๋ฉ๋ผ ์ขํ ํฌ์ฆ๋ฅผ ์ถ์ถํ๊ณ LiDAR ํฌ์ธํธ ํด๋ผ์ฐ๋์์ ๊ธ๋ก๋ฒ ์ขํ ์์น๋ฅผ ์์ธกํ๋ค.
- Post-processing: ๋ ์ขํ๊ณ ๊ฐ ํฌ์ฆ์ ์ผ๊ด์ฑ์ ํ๋ณดํ๊ณ ์๋ฌ ๋์ ์ ๋ฐฉ์งํ๋ค.
- Semi-supervised training: Teacher-student ํ์ต ๋ฐฉ์์ผ๋ก ์ฝ๊ฒ ํ๋ ๊ฐ๋ฅํ ๋น๋ผ๋ฒจ ๋ฑ๋ฐ ๋์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ๋ชจ๋ธ ์ฑ๋ฅ์ ํฅ์์ํจ๋ค.
- ์๋ ์ฃผ์๊ณผ ์๋ ์ ์ : ์ฃผ์์ ์ ํ์ฑ์ ๋ณด์ฅํ๊ธฐ ์ํด ์๋ ์ฃผ์์ ์๋์ผ๋ก ์ ์ ํ๋ค.
Originality
- ๋ฑ๋ฐ ํนํ ์ ๊ทผ๋ฒ: ๊ธฐ์กด HMR ๋ฐฉ๋ฒ๋ค๊ณผ ๋ฌ๋ฆฌ ์คํ-๊ทธ๋ผ์ด๋ ๋ฑ๋ฐ ๋์์ ๊ณ ์ ํ ๋์ ๊ณผ์ (๊ทน๋จ์ ํ๋ค๋ฆฌ ์ฐ์ฅ, ์๋ฒฝ๊ณผ์ ์ธํฐ๋์
)๋ฅผ ๋ช
์์ ์ผ๋ก ๋ค๋ฃฌ๋ค.
- ๋ฉํฐ๋ชจ๋ฌ ๋ถ๋ฆฌ ๋ณต์: RGB์ LiDAR๋ฅผ ์๋ก ๋ค๋ฅธ ์ขํ๊ณ ์ถ์ ์ ํ์ฉํ๋ separate coordinate decoding ์ ๋ต์ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค์ ์ขํ๊ณ ๋ณํ ๋ชจํธ์ฑ์ ํด๊ฒฐํ๋ค.
- ๋๊ท๋ชจ ๋์ ์ ๋ฐ์ดํฐ์
: ์๋ จ๋ ๋ฑ๋ฐ๊ฐ์ ๋์๋ง ํฌํจํ์ฌ ๊ธฐ์กด ๋ฐ์ดํฐ์
๋ณด๋ค ๋์ด๋์ ๊ท๋ชจ ๋ชจ๋์์ ์ง์ ์ ์ด๋ฃฌ๋ค.
- ๋ฐ์ง๋ ํ์ต ํ์ฉ: ๋น๋ผ๋ฒจ ๋ฑ๋ฐ ๋ฐ์ดํฐ์ ํ์ฉ์ผ๋ก ์ค๋ฌด์ ๋ฐ์ดํฐ ์์ง ์ ์ฝ์ ๊ทน๋ณตํ๋ค.
Limitation & Further Study
- ์ค๋ด ์๋ฒฝ ํ๊ฒฝ ์ ํ: ๋ฐ์ดํฐ์
์ด 12๊ฐ ์ค๋ด ์๋ฒฝ์์๋ง ์์ง๋์ด ์ผ์ธ ์์ฐ์๋ฒฝ์ด๋ ๋ค์ํ ํ๊ฒฝ ์ผ๋ฐํ ๊ฒ์ฆ์ด ๋ถ์กฑํ๋ค.
- LiDAR ์์กด์ฑ: ๋ฐฉ๋ฒ์ด LiDAR ์ผ์์ ์์กดํ์ฌ ์ฅ๋น ๊ฐ์ฉ์ฑ์ด ์ ํ๋ ํ๊ฒฝ์์์ ์ ์ฉ ์ด๋ ค์์ด ์๋ค.
- ์์ ํผํ์: 22๋ช
์ ๋ฑ๋ฐ ์ฝ์น๋ก ์ ํ๋์ด ์ผ๋ฐ ๋ฑ๋ฐ๊ฐ(์ด๋ณด์, ์๋ง์ถ์ด)์ ๋ํ ์ฑ๋ฅ ๊ฒ์ฆ์ด ๋ถ์กฑํ ์ ์๋ค.
- ์ฅ๊ธฐ ์ํ์ค ์๋ฌ ๋์ : ๋
ผ๋ฌธ์์ ์ธ๊ธํ ๋๋ก ๊ธ๋ก๋ฒ HMR์ ์ฅ๊ธฐ ์ํ์ค์์ ์๋ฌ ๋์ ๋ฌธ์ ๊ฐ ์ฌ์ ํ ์กด์ฌํ ์ ์๋ค.
- ํ์ ์ฐ๊ตฌ ๋ฐฉํฅ: ์ผ์ธ ์์ฐ์๋ฒฝ ๋ฐ์ดํฐ ์์ง, RGB๋ง์ผ๋ก ์๋ํ๋ ๋ฐฉ์ ๊ฐ๋ฐ, ์ค์๊ฐ ๋ฑ๋ฐ ๊ต์ต ์์คํ
์ผ๋ก์ ํ์ฅ, ๋ค์ํ ๋์ด๋ ๋ฑ๋ฐ๊ฐ ํฌํจ์ด ํ์ํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ClimbingCap์ ๋ฏธ๊ฐ๋ฐ ๋ถ์ผ์ธ ๋ฑ๋ฐ ๋์ ์บก์ฒ์ ๋ํด ๋๊ท๋ชจ ๊ณ ํ์ง ๋ฐ์ดํฐ์
๊ณผ ๋ฉํฐ๋ชจ๋ฌ ๋ณ๋ ์ขํ ๋ณต์ ๋ฐฉ์์ ์ฐฝ์์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ์ฌ ๋์ ๋
์ฐฝ์ฑ๊ณผ ์ค์ง์ ๊ธฐ์ฌ๋๋ฅผ ๋ณด์ฌ์ค๋ค. ๊ด๋ฒ์ํ ์คํ ๊ฒ์ฆ๊ณผ ๊ณต๊ฐ ์์ ์ธ ๋ฐ์ดํฐ์
ยท์ฝ๋๋ ์ปค๋ฎค๋ํฐ ๊ธฐ์ฌ๋ ๋์ผ๋, ํ๊ฒฝ ์ผ๋ฐํ์ ๋จ์ผ ๋ชจ๋ฌ ๋ฐฉ์์ ๊ฐ๋ฐ์ด ํ์ ๊ณผ์ ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์