FALCON: Learning Force-Adaptive Humanoid Loco-Manipulation
์ ์: Yuanhang Zhang, Yifu Yuan, Prajwal Gurunath, Ishita Gupta, Shayegan Omidshafiei, Ali-akbar Agha-mohammadi, Marcell Vazquez-Chanlatte, Liam Pedersen, Tairan He, Guanya Shi | ๋ ์ง: 2025-05-10 | URL: https://arxiv.org/abs/2505.06776 📄 PDF
Essence
Figure 2: Overview of FALCON. (a) Two agents with different sub-tasks are jointly trained with
FALCON์ ์ด์ค ์์ด์ ํธ ๊ฐํํ์ต ํ๋ ์์ํฌ๋ก, ํ์ฒด์ ์์ ์ ๋ณดํ๊ณผ ์์ฒด์ ์ ๋ฐํ ๋ง๋จ ์ฅ์น ์์น ์ถ์ ์ ๋ถ๋ฆฌํ์ฌ ํ์ตํจ์ผ๋ก์จ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ด 0-100N์ ํฐ ์ธ๋ถ ํ์ ์ ์ํ๋ฉด์ ๊ฐ์ ์ ์์
์ ์ํํ๋๋ก ํ๋ค.
Motivation
- Known: ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ๋ณดํ๊ณผ ์กฐ์ ๋ฅ๋ ฅ์ด ๋ฐ์ ํ์ผ๋, ๊ฐํ ์ธ๋ถ ํ์ ์ ์ํ๋ ์ ๋ฐํ ์ ์ ์ ์ด๋ ๋ฏธํกํ๋ค. ๊ธฐ์กด์ Lower-RL-Upper-IK์ Monolithic-Whole-body-RL ๋ฐฉ์ ๋ชจ๋ ๊ฐ์ ์ ์ํธ์์ฉ์ ์ ๋๋ก ์ฒ๋ฆฌํ์ง ๋ชปํ๋ค.
- Gap: ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์์ ๋ฏธ์ง์ ํฐ ๋์ ํ ๊ต๋์ ๋์ํ๋ ๊ฐ์ ์ ๋ก์ฝ-์กฐ์ ์ ์ด๊ฐ ๋ถ์กฑํ๋ฉฐ, ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค์ ์ํ ํจ์จ์ฑ์ด ๋ฎ๊ฑฐ๋ ์ํ์ฒด์ ๋นํจ์จ์ ์กฐ์ ์ผ๋ก ์ธํ ๊ณผ์ ํฉ ๋ฌธ์ ๋ฅผ ๊ฒช๋๋ค.
- Why: ๊ฐ์ ์ ๋ก์ฝ-์กฐ์์ ๋ฌธ ์ด๊ธฐ, ์ง ์ด๋ฐ, ์นดํธ ๋๊ธฐ ๋ฑ ์ค์ ์ฐ์
๋ฐ ์๋น์ค ์์
์ ํ์์ ์ด๋ฉฐ, ์ด๋ฅผ ์ผ๋ฐํ๋ ์ ์ฑ
์ผ๋ก ๊ตฌํํ ์ ์๋ค๋ฉด ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ ์ค์ฉ์ฑ์ด ๋ํญ ์ฆ๊ฐํ๋ค.
- Approach: FALCON์ ํ์ฒด ์์ด์ ํธ(๋ณดํ ์์ ์ฑ)์ ์์ฒด ์์ด์ ํธ(๋ง๋จ ์์น ์ถ์ ๋ฐ ์๋ฌต์ ํ ๋ณด์)๋ฅผ ๊ณต์ ๊ณ ์ ์์ฉ๊ฐ๊ฐ์ผ๋ก ๋ถ๋ฆฌ ํ์ตํ๋ฉฐ, ๊ด์ ํ ํฌ ์ ์ฝ์ ์กด์คํ๋ 3D ํ ์ปค๋ฆฌํ๋ผ์ผ๋ก ์ ์ง์ ์ผ๋ก ์ธ๋ถ ํ์ ์ฆ๊ฐ์ํจ๋ค.
Achievement
Figure 1: FALCON enables versatile forceful loco-manipulation tasks for humanoids: (a) Transporting Pay-
- ์์ฒด ๊ด์ ์ถ์ ์ ํ๋ 200% ํฅ์: ๊ธฐ์กด ๊ธฐ์ค ๋๋น 2๋ฐฐ ์ ํํ ์์ฒด ๊ด์ ์ถ์ ์ ๋ฌ์ฑํ๋ฉด์ ๋ณดํ ์์ ์ฑ ์ ์ง
- ๊ฐ๋ ฅํ ํ ์ ์ ๋ฒ์: 0-100N์ ์ธ๋ถ ํ์ ์ ์ํ์ฌ ์ง ์ด๋ฐ(0-20N), ์นดํธ ๋๊ธฐ(0-100N), ๋ฌธ ์ด๊ธฐ(0-40N) ์ํ
- ๋น ๋ฅธ ํ์ต ์๋ ด: ์ด์ค ์์ด์ ํธ ๋ถํด๋ก ์ธํ ํจ์จ์ ํ์์ผ๋ก ํ์ต ์๋ ํฅ์
- ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ: Unitree G1, Booster T1 ๋ฑ ๋ค์ํ ํด๋จธ๋
ธ์ด๋ ํ๋ซํผ์์ ์ต์ํ์ ์กฐ์ ์ผ๋ก ์ ์ฑ
๋ฐฐํฌ ๊ฐ๋ฅ
- embodiment-๋ฌด๊ด ํ์ต: ํน์ ๋ก๋ด ํํ์ ๋ง์ถ ๋ณด์ ํจ์๋ ์ปค๋ฆฌํ๋ผ ํ๋ ์์ด ๋ค์ค ํ๋ซํผ ๋ฐฐํฌ ๊ฐ๋ฅ
How
Figure 2: Overview of FALCON. (a) Two agents with different sub-tasks are jointly trained with
- ํ์ฒด ์์ด์ ํธ์ ์์ฒด ์์ด์ ํธ๋ฅผ ๋ถ๋ฆฌํ๋, ์ ์ฒด ์ ์ฒด ๊ณ ์ ์์ฉ๊ฐ๊ฐ(๊ด์ ์์น/์๋, ๋ฃจํธ ๊ฐ์๋, ์ค๋ ฅ ํฌ์, ๊ณผ๊ฑฐ ํ๋)์ ๊ณต์ ํ์ฌ ์ํธ ์ธ์ ์ ์ง
- ํ์ฒด ๋ณด์์ ์ํ๋ ๋ณดํ ์๋, ์คํด์ค ์งํ, ๋ฃจํธ ๋์ด, ํ๋ฆฌ ์ ๊ฐ ์ถ์ ์ ์ด์
- ์์ฒด ๋ณด์์ ๋ชฉํ ๊ด์ ๊ตฌ์ฑ ์ถ์ (jittery motion ์ต์ํ)์ ์ด์
- 3D ํ ์ปค๋ฆฌํ๋ผ ์ค๊ณ: ๊ด์ ํ ํฌ ์ ์ฝ์ ์ญ ๋์ญํ์ผ๋ก ๊ณ์ฐํ์ฌ ๊ฐ ํ๋ จ ๋จ๊ณ์์ ์ ์ฉ ๊ฐ๋ฅํ ์ต๋ ํ ๋ฒ์ ๊ฒฐ์ , ์ ์ง์ ์ผ๋ก ์ค์ผ์ผ ๊ณ์ ฮฑ ์ฆ๊ฐ
- ์๋ฎฌ๋ ์ด์
์์ ์ด์ค ์์ด์ ํธ ๊ณต๋ ํ๋ จ ํ, sim-to-real ์ ์ด๋ก ์ค์ ๋ก๋ด ๋ฐฐํฌ
- ๋ฐฐํฌ ์ VR/์กฐ์ด์คํฑ ์๊ฒฉ ์กฐ์, FoundationPose ๊ธฐ๋ฐ ์์ธ ์ถ์ , IK ๊ธฐ๋ฐ ์์ฒด ๋ช
๋ น ๋ณํ ํ์ฉ
Originality
- ๊ธฐ์กด์ Lower-RL-Upper-IK(์ง์ฐ๋ ํ ๋ณด์)์ Monolithic-Whole-body-RL(์ํ ๋นํจ์จ)์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๋ ์๋ก์ด ์ด์ค ์์ด์ ํธ ํ์ต ๊ตฌ์กฐ
- ํด๋จธ๋
ธ์ด๋์ ๊ด์ ํ ํฌ ์ ์ฝ์ ๋ช
์์ ์ผ๋ก ๊ณ ๋ คํ ์ต์ด์ 3D ํ ์ปค๋ฆฌํ๋ผ ์ค๊ณ
- ์๋ฌต์ ์ ์ํ ํ ๋ณด์(explicit force estimation ์์ด)์ ํตํด ๋ฏธ์ง์ ๋์ ํ์ ๋์
- embodiment-๋ฌด๊ด ์ ์ฑ
ํ์ต์ผ๋ก ๋ค์ค ํด๋จธ๋
ธ์ด๋ ํ๋ซํผ์ผ๋ก์ ์ผ๋ฐํ ๋ฌ์ฑ
Limitation & Further Study
- ์๋ฎฌ๋ ์ด์
-ํ์ค ๊ฐ ๊ฐญ ๊ทน๋ณต์ ์ํ ๊ตฌ์ฒด์ ๋๋ฉ์ธ ๋ฌด์์ํ(Domain Randomization) ์ ๋ต์ด ๋
ผ๋ฌธ์์ ์ถฉ๋ถํ ์์ ๋์ง ์์
- ํ์ค ํ๊ฒฝ์์์ ๋ค์ํ ์ ์ด ์๋๋ฆฌ์ค(์: ๋ฏธ๋๋ฌ์ด ํ๋ฉด, ๋น์ ์ ํ ๋ถํฌ)์ ๋ํ ๊ฐ๊ฑด์ฑ ํ๊ฐ ๋ถ์กฑ
- ๊ณ์ฐ ๋ณต์ก๋ ๋ฐ ์ค์๊ฐ ์ ์ด ์ฑ๋ฅ(์ง์ฐ, CPU/GPU ์ฌ์ฉ๋)์ ๋ํ ์์ธ ๋ถ์ ๋ฏธํก
- ํ์ ์ฐ๊ตฌ: ๋ ์ ๊ตํ ํ ์ถ์ ๋ฐ ์ ์ ๋ฉ์ปค๋์ฆ, ์์ ์กฐ์ ์์
์ผ๋ก์ ํ์ฅ, ๋์ ์ด๋ ํ๊ฒฝ(์: ๋ถ๊ท์นํ ์งํ)์์์ ์ฑ๋ฅ ํ๊ฐ
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: FALCON์ ํด๋จธ๋
ธ์ด๋์ ๊ฐ์ ์ ๋ก์ฝ-์กฐ์ ๋ฌธ์ ๋ฅผ ์ด์ค ์์ด์ ํธ ๋ถํด์ ํ ์ปค๋ฆฌํ๋ผ ์ค๊ณ๋ก ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ๋ฉฐ, ๋ค์ค ํ๋ซํผ ๋ฐฐํฌ์ 2๋ฐฐ์ ์ถ์ ์ ํ๋ ํฅ์์ ์
์ฆํจ์ผ๋ก์จ ์ค์ฉ์ ๊ฐ์น๊ฐ ๋๋ค. ๋ค๋ง sim-to-real ๊ฐญ ๊ทน๋ณต ๋ฉ์ปค๋์ฆ๊ณผ ๊ทน๋จ์ ํ๊ฒฝ ๊ฐ๊ฑด์ฑ์ ๋ํ ๋ถ์์ด ๋ ํ์ํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์