Impact of Static Friction on Sim2Real in Robotic Reinforcement Learning
์ ์: Xiaoyi Hu, Qiao Sun, Bailin He, Haojie Liu, Xueyi Zhang, Chunpeng lu, Jiangwei Zhong | ๋ ์ง: 2025-03-03 | URL: https://arxiv.org/abs/2503.01255 📄 PDF
Essence
Fig. 1.
์ ์ ๋ง์ฐฐ์ด ๋ก๋ด ๊ฐํํ์ต์ Sim2Real ์ฑ๋ฅ์ ๋ฏธ์น๋ ์ํฅ์ ์ฒด๊ณ์ ์ผ๋ก ๋ถ์ํ๊ณ , Static friction-aware domain randomization์ ์ ์ํ์ฌ ๋ณต์กํ ์งํ์์์ ๋ก๋ด ์ ์ ๋ฅ๋ ฅ์ ํฅ์์ํจ๋ค.
Motivation
- Known: Domain randomization์ ๋ก๋ด ๊ฐํํ์ต์ Sim2Real ๊ฐญ์ ์ค์ด๋ ํ์ค์ ์ธ ๋ฐฉ๋ฒ์ด๋ฉฐ, ํ์ ์ ๊ด์ฑ, ์ ์ฑ ๋ง์ฐฐ, Kp, Kd ๋ฑ์ ๋งค๊ฐ๋ณ์๋ฅผ ๋ฌด์์ํํ๋ค. ๊ทธ๋ฌ๋ ๊ณผ๋ํ ๋ฌด์์ํ๋ ํ์ต ๋์ด๋๋ฅผ ์ฆ๊ฐ์ํจ๋ค.
- Gap: ๊ธฐ์กด domain randomization ๋ฐฉ๋ฒ๋ค์ static friction์ ๋งค๊ฐ๋ณ์ ๊ณต๊ฐ์์ ์ ์ธํ๊ณ ์์ผ๋ฉฐ, static friction์ด Sim2Real ์ฑ๋ฅ์ ๋ฏธ์น๋ ์ํฅ์ ๋ํ ์ฒด๊ณ์ ์ธ ๋ถ์์ด ๋ถ์กฑํ๋ค. ์ด๋ก ์ธํด ๋ง์ฐฐ์ด ๋์ ์ค์ ๋ก๋ด์์ ์ฑ๋ฅ ์ ํ๊ฐ ๋ฐ์ํ๋ค.
- Why: ๋ก๋ด ๊ด์ ์ ์ ์ ๋ง์ฐฐ์ ์ค์ ํ๊ฒฝ์์ ์ค์ํ ๋ฌผ๋ฆฌ์ ํน์ฑ์ด์ง๋ง ์๋ฎฌ๋ ์ด์
์์ ๊ฐ๊ณผ๋์ด ์์ผ๋ฉฐ, ์ด๋ฅผ ์ ํํ ๋ชจ๋ธ๋งํ๋ฉด ๊ณ๋จ ๊ฐ์ ๋ณต์กํ ์งํ์์์ ๋ก๋ด ์ ์ ๋ฅ๋ ฅ์ ํฌ๊ฒ ๊ฐ์ ํ ์ ์๋ค.
- Approach: ์ ์ด ์ด๋ก ์ ๊ด์ ๋ชจ๋ธ ๊ฐ๋ฐ๊ณผ ์ฒด๊ณ์ ์ธ ๋งค๊ฐ๋ณ์ ์๋ณ์ ํตํด ๋ก๋ด ๊ด์ ์ ๋ง์ฐฐ-ํ ํฌ ๋น์จ์ ๋ถ์ํ๊ณ , ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก Static friction-aware domain randomization์ ๊ตฌํํ์ฌ ํ์ต ๋ณต์ก๋๋ฅผ ์ค์ด๋ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค.
Achievement
Fig. 1.
- Static friction์ ์ํฅ ๊ท๋ช
: ๋งค๊ฐ๋ณ์ ์๋ณ ๋ฐ ๋น๊ต ์คํ์ ํตํด robotic reinforcement learning์์ static friction์ ์ํฅ์ ์ฒ์์ผ๋ก ์ฒด๊ณ์ ์ผ๋ก ์
์ฆ
- ์ ์ด ๋ชจ๋ธ ๊ธฐ๋ฐ ๋ถ์: 2์ฐจ ์ ์ด ๋ชจ๋ธ์ ๊ฐ๋ฐํ์ฌ domain randomization์์ ์ ์ธ ๊ฐ๋ฅํ ๋งค๊ฐ๋ณ์๋ฅผ ๋ถ์
- ์ค์ ๋ก๋ด ๊ตฌํ: Saturn Lite ์ก๊ฐํ ๋ก๋ด์์ ๋ฐฉ๋ฒ์ ์ ์ฉํ์ฌ ๊ธฐ์กด ๋ฐฉ์ ๋๋น ์ฐ์ํ ์ ์ ๋ฅ๋ ฅ๊ณผ ๊ณ๋จ ํต๊ณผ ์ฑ๋ฅ ๋ฌ์ฑ
How
Fig. 2.
- Control-theoretic joint model์ ๊ฐ๋ฐํ์ฌ ๋ชจํฐ ๋์ญํ ๋ถ์
- Systematic parameter identification์ ํตํด ์ค์ ๋ก๋ด ๊ด์ ์ friction-torque ratio ์ธก์
- Conventional domain randomization, Actuator Net, Static friction-aware domain randomization 3๊ฐ์ง ๋ฐฉ๋ฒ ๋น๊ต
- Rapid Motor Adaptation (RMA) ์๊ณ ๋ฆฌ์ฆ ์ ์ฉ์ผ๋ก ์ค์๊ฐ ์ ์ ํ์ต ๊ตฌํ
- Sim2Sim ๋ฐ Sim2Real ์คํ์ ํตํด ๊ฐ ๋ฐฉ๋ฒ์ ์ฑ๋ฅ ๊ฒ์ฆ
- Saturn Lite ๋ก๋ด์ tripod gait๋ฅผ ํ์ฉํ ์์จ์ ์งํ ์ ์์ ์ํ ์๋ก์ด ๋ณด์ ํจ์ ์ค๊ณ
Originality
- ์ฒซ ๋ฒ์งธ ์ฒด๊ณ์ ๋ถ์: Static friction์ Sim2Real ์ํฅ์ ์ฒ์์ผ๋ก ์ ๋์ ์ผ๋ก ๋ถ์ํ๊ณ ์
์ฆ
- ์ ์ด ์ด๋ก ๊ธฐ๋ฐ ์ ๊ทผ: ๊ฐํํ์ต ๋ฌธ์ ๋ฅผ ์ ์ด ์ด๋ก ์ผ๋ก ๋ถ์ํ์ฌ domain randomization ๋งค๊ฐ๋ณ์ ์ ํ์ ๊ทผ๊ฑฐ ์ ๊ณต
- ์ค์ ๋ก๋ด ์คํ: ์ก๊ฐํ ๋ก๋ด Saturn Lite์์ ์ค์ Sim2Real ์ฑ๋ฅ์ ๊ฒ์ฆํ ์ค๋ฌด ์ค์ฌ์ ์ฐ๊ตฌ
- ํ์ต ๋ณต์ก๋ ๊ฐ์: Static friction ๋ชจ๋ธ๋ง์ผ๋ก ์ธํ ํ์ต ๋์ด๋ ์ฆ๊ฐ๋ฅผ ์ํํ๋ ๊ฐ๋จํ ์๋ฃจ์
์ ์
Limitation & Further Study
- Saturn Lite ๋ก๋ด์ ํนํ๋ ๋ถ์์ผ๋ก, ๋ค๋ฅธ ๋ก๋ด ํ๋ซํผ์์์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ด ๋ฏธ๊ฒ์ฆ
- Static friction ์ธ ๋ค๋ฅธ ๋ฌผ๋ฆฌ์ ํน์ฑ(air resistance, contact dynamics ๋ฑ)์ ์ํฅ์ ๋ํ ๋ถ์ ๋ถ์ฌ
- Proprioceptive sensing๋ง ์ฌ์ฉํ์ฌ ์๊ฐ ์ ๋ณด๊ฐ ํ์ํ ๋ณต์กํ ํ๊ฒฝ์ผ๋ก์ ํ์ฅ ์ ํ
- Isaac Gym ๋ฑ ๊ณ ์ ์๋ฎฌ๋ ์ดํฐ์ ๋ฌผ๋ฆฌ ์ ํ๋ ํ๊ณ์ ๋ํ ์ฌํ ๋ถ์ ํ์
- ํ์์ฐ๊ตฌ: ๋ค์ํ ๋ก๋ด ํ๋ซํผ์ ๋ํ static friction ๋ชจ๋ธ ์ผ๋ฐํ, ๋ค์ค ๋ฌผ๋ฆฌ ํน์ฑ ๊ฒฐํฉ ํจ๊ณผ ๋ถ์, ์ค์๊ฐ friction ์๋ณ ๋ฐฉ๋ฒ ๊ฐ๋ฐ
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ๋ก๋ด ๊ฐํํ์ต์ Sim2Real ๊ฐญ์์ ๊ทธ๊ฐ ๊ฐ๊ณผ๋์๋ static friction์ ์ค์์ฑ์ ์ฒด๊ณ์ ์ผ๋ก ๊ท๋ช
ํ๊ณ ์ค์ ๋ก๋ด์์ ํจ๊ณผ๋ฅผ ์
์ฆํ ์๋ฏธ ์๋ ์ฐ๊ตฌ์ด๋ค. ์ ์ด ์ด๋ก ๊ณผ ๊ฐํํ์ต์ ํตํฉ ์ ๊ทผ๊ณผ ์ค๋ฌด ์ค์ฌ์ ๊ฒ์ฆ์ด ๊ฐ์ ์ด๋, ๋ค์ํ ๋ก๋ด ํ๋ซํผ์ผ๋ก์ ์ผ๋ฐํ๋ ํฅํ ๊ณผ์ ์ด๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์