Optimizing Bipedal Locomotion for The 100m Dash With Comparison to Human Running
๐ง Audio Overview ์์ฑ
์ ์ : Devin Crowley, Jeremy Dao, Helei Duan, Kevin Green, Jonathan Hurst, Alan Fern | ๋ ์ง : 2025-08-05 | URL : https://arxiv.org/abs/2508.03070 📄 PDF
Essence
Fig. 3: The top 5 most efficient freq (above) and ratio
์ด ๋
ผ๋ฌธ์ ์ด์กฑ ๋ก๋ด Cassie์ ๊ณ ์ ์ฃผํ ๋ณดํ์ ์ํด ๋ณดํ ๋งค๊ฐ๋ณ์(stride frequency, swing ratio)๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ์ต์ ํํ๊ณ , ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ์ธ๊ฐ์ ์ฃผํ ์ญํ๊ณผ ๋น๊ตํ๋ฉฐ, ์ต์ข
์ ์ผ๋ก 100m ๋์ ๊ธฐ๋ค์ค ์๋๋ ์ฝ๋๋ฅผ ๋ฌ์ฑํ ์์ ํ ์ปจํธ๋กค๋ฌ๋ฅผ ์ ์ํ๋ค.
Motivation
Known : Sim-to-real RL์ ์ด์ฉํ ์ด์กฑ ๋ณดํ ํ์ต์ด ํจ๊ณผ์ ์ด๋ฉฐ, ์ ํ ์ฐ๊ตฌ์์๋ ๊ณ ์ ๋ ๋ณดํ ๋งค๊ฐ๋ณ์๋ ์์ผ๋ก ํ๋ํ ๋งคํ์ ์ฌ์ฉํ๋ค. ์ธ๊ฐ์ ์ฃผํ ์ญํ์ ์ฌ์กฑ๋๋ฌผ ๋๋น ํจ์จ์ ์ผ๋ก ์๋ ค์ ธ ์๋ค.
Gap : ์ด์กฑ ๋ก๋ด์ ๊ณ ์ ์ฃผํ์ ์ํด ์๋์ ๋ฐ๋ผ ๋์ ์ผ๋ก ์กฐ์ ๋๋ ๋ณดํ ๋งค๊ฐ๋ณ์์ ์ต์ ํ ๋ฐฉ๋ฒ์ด ๋ถ์ฌํ์ผ๋ฉฐ, ๋ก๋ด ๋ณดํ๊ณผ ์ธ๊ฐ ์ฃผํ ์ญํ์ ์ฒด๊ณ์ ๋น๊ต ์ฐ๊ตฌ๊ฐ ๋ฏธํกํ๋ค.
Why : ๋ณดํ ๋งค๊ฐ๋ณ์์ ์๋ฆฌ ์๋ ์ต์ ํ๋ ์ด์กฑ ๋ก๋ด์ด ๋์ ์๋์์ ์์ ์ ์ด๊ณ ํจ์จ์ ์ผ๋ก ๋ฌ๋ฆด ์ ์๊ฒ ํ๋ฉฐ, ์ด๋ ์ค์ ๋ก๋ด ์์ฉ์ผ๋ก์ ํ์ฅ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ฃผ๋ ๊ฒ์ด ์ค์ํ๋ค.
Approach : PPO ๊ธฐ๋ฐ sim-to-real RL์ ํตํด ๊ด๋ฒ์ํ ๋ณดํ ๋งค๊ฐ๋ณ์ ์กฐํฉ๊ณผ ์๋์์ ์ ์ฑ
์ ํ๋ จํ ํ, ์๋ฎฌ๋ ์ด์
์์ ์๋์ง ํจ์จ ๊ธฐ๋ฐ ์ ์ ๋ฉํธ๋ฆญ์ผ๋ก ๊ฐ ์๋์์ ์ต์ ์ ๋งค๊ฐ๋ณ์๋ฅผ ์ ํํ๊ณ , ์ด๋ฅผ ์์ ํ 100m ๋์ ์ปจํธ๋กค๋ฌ์ ํตํฉํ๋ค.
Achievement
Fig. 3: The top 5 most efficient freq (above) and ratio
๋ณดํ ๋งค๊ฐ๋ณ์ ์ต์ ํ : ์์ผ๋ก ํ๋ํ ๋งคํ๊ณผ ์ง์ ์ผ๋ก ๋ค๋ฅธ ์๋-๋งค๊ฐ๋ณ์ ๊ณก์ ์ ๋ฐ๊ฒฌํ์ฌ, ํนํ ์ค๊ฐ ์๋(2-4 m/s)์์ ๋ ๋ฎ์ stride frequency๊ฐ ํจ์จ์ ์์ ๋ณด์
์ธ๊ฐ-๋ก๋ด ๋ณดํ ๋น๊ต : ํํํ์ ์ฐจ์ด์๋ ๋ถ๊ตฌํ๊ณ Cassie์ ์ต์ ํ๋ ๋ณดํ ์ญํ์ด ๊ด๋ฒ์ํ ์๋์์ ์ธ๊ฐ ์ฃผํ์ ํต์ฌ ํน์ฑ๊ณผ ์ ์ฌํจ์ ์
์ฆ
๊ธฐ๋ค์ค ์๋๋ ์ฝ๋ ๋ฌ์ฑ : ์ต์ ํ๋ ๋ณดํ์ ํตํฉํ ์ปจํธ๋กค๋ฌ๋ก ์ด์กฑ ๋ก๋ด 100m ๋์ ๊ธฐ๋ก ์๋ฆฝ
์์ ํ 100m ๋์ ์ปจํธ๋กค๋ฌ : ์ ์ง ์ํ์์์ ์์, ๊ณ ์ ์ฃผํ, ์์ ์ ์ ์ง๋ฅผ ํฌํจํ ์ค์ ๊ท์น์ ๋ง์กฑํ๋ ์ปจํธ๋กค๋ฌ ๊ฐ๋ฐ
How
Fig. 2: Hand-tuned mapping from the speed command to the
MuJoCo ๋ฌผ๋ฆฌ ์์ง๊ณผ dynamics randomization์ ์ฌ์ฉํ sim-to-real PPO ํ๋ จ์ผ๋ก 35์ฐจ์ ์ํ(๊ด์ ์์น/์๋, ๊ณจ๋ฐ ๋ฐฉํฅ), clock signal, ๋ณดํ ๋งค๊ฐ๋ณ์, ๋ชฉํ ์๋๋ฅผ ์
๋ ฅ์ผ๋ก ๋ฐ์ 10๊ฐ ์ก์ถ์์ดํฐ ์ ์ด
0-5 m/s ์๋ ๋ฒ์์์ hand-tuned ๋งคํ์ ยฑ0.2(ratio), ยฑ0.625(freq) ์คํ์
๋ด ๊ท ๋ฑ๋ถํฌ์์ ๋ชจ๋ ๋งค๊ฐ๋ณ์ ์กฐํฉ์ผ๋ก ์ ์ฑ
ํ๋ จ
๊ฐ ์๋์์ 100 policy step ๋์ ์์งํ ๊ถค์ ์ ๋ํด ์๋ ์ค์ฐจ, Cost of Transport, ํ ํฌ ๋น์ฉ, ๋ชจํฐ ์๋์ 4๊ฐ์ง ๋น์ฉ์ ๊ฐ์ค ๊ฒฐํฉํ์ฌ ๊ฐ ๋งค๊ฐ๋ณ์ ์กฐํฉ ํ๊ฐ
์์ 5๊ฐ ํจ์จ์ ์ธ ๋งค๊ฐ๋ณ์ ์กฐํฉ์ ์ถ์ด๋ฅผ 3์ฐจ ๋คํญ์ ํ๊ท๋ก ๋ถ์ํ์ฌ ์๋๋ณ ์ต์ ๋งค๊ฐ๋ณ์ ๊ณก์ ๋์ถ
์ต์ ํ๋ ๋ณดํ์ LSTM ๊ธฐ๋ฐ ๊ณ ์์ค ์ปจํธ๋กค๋ฌ์ ํตํฉํ๊ณ ์ค์ ๋ก๋ด ํ๋์จ์ด์ ๋ฐฐํฌ
Originality
์ฒด๊ณ์ ๋งค๊ฐ๋ณ์ ํ์ : ์ ํ ์ฐ๊ตฌ์ ๊ณ ์ ๊ฐ์ด๋ ์์ ์-ํ๋ ๋์ ๊ด๋ฒ์ํ ๋งค๊ฐ๋ณ์ ๊ณต๊ฐ์ ์๋ฆฌ์ ์ผ๋ก ํ์ํ๋ ์ฒซ ์๋
์ด์กฑ ๋ก๋ด ๊ณ ์ ์ฃผํ : ๊ธฐ์กด 2.0 m/s ์์ค์ ๋์ด 5 m/s ์ด์์ ๊ณ ์ ์ฃผํ์ ๋ฌ์ฑํ ์ฒซ ์ฌ๋ก
์ ๋์ ์ธ๊ฐ-๋ก๋ด ๋น๊ต : ๊ธฐ์กด ์์ฒด์ญํ ๋ฌธํ์ ๋ฐํ์ผ๋ก ๋ก๋ด๊ณผ ์ธ๊ฐ์ ์ฃผํ ์ญํ์ ์ ๋์ ์ผ๋ก ๋น๊ตํ ์ฒซ ์ฒด๊ณ์ ์ฐ๊ตฌ
์ค์ ๊ธฐ๋ก ๋ฌ์ฑ : ์ด๋ก ์ ๊ธฐ์ฌ๋ฅผ ๋์ด ๊ธฐ๋ค์ค ์๋๋ ์ฝ๋๋ผ๋ ๊ตฌ์ฒด์ ์ค์ธ๊ณ ์ฑ๊ณผ๋ก ๊ฒ์ฆ
Limitation & Further Study
์ง์ ์ฃผํ๋ง ๋์์ผ๋ก ํ๋ฉฐ, ํ์ ์ด๋ ๋ถ๊ท์นํ ์งํ ๋ฑ ๋ณต์กํ ํ๊ฒฝ์์์ ๋ณดํ ์ต์ ํ๋ ๋ฏธ๋ค๋ฃธ
์ ์ ๋ฉํธ๋ฆญ์ด ํจ์จ์ฑ 3๊ฐ ํญ๋ชฉ vs ์๋ ์ถฉ์ค๋ 1๊ฐ ํญ๋ชฉ์ผ๋ก ๋น๊ท ํ์ ์ด์ด์ ์๋ ์ถ์ ์ฑ๋ฅ์ด ์ ์ฝ๋ ์ ์์
์๋ฎฌ๋ ์ด์
๊ธฐ๋ฐ ์ต์ ํ์ด๋ฏ๋ก sim-to-real gap์ผ๋ก ์ธํ ํ๋์จ์ด ์ฑ๋ฅ ์ ํ ๊ฐ๋ฅ์ฑ ์กด์ฌ
Cassie์ ํน์ ํํ์ ์ต์ ํ๋ ๊ฒ์ผ๋ก ๋ค๋ฅธ ์ด์กฑ ๋ก๋ด ํ๋ซํผ์ผ๋ก์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ ๋ถ๋ช
ํ
ํ์ ์ฐ๊ตฌ๋ก ๋์ ํ๊ฒฝ, ๋ถ๊ท์น ์งํ, ๋ฐฉํฅ ๋ณ๊ฒฝ์ ํฌํจํ ๋ณดํ ์ต์ ํ ๋ฐ ๋ค์ํ ๋ก๋ด ํํ์ ๋ํ ํ์ฅ ํ์
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ : ์ด ๋
ผ๋ฌธ์ ์ด์กฑ ๋ก๋ด์ ๊ณ ์ ์ฃผํ์ ์ํ ๋ณดํ ๋งค๊ฐ๋ณ์์ ์ฒซ ์ฒด๊ณ์ ์ต์ ํ๋ฅผ ์ ์ํ๊ณ , ์ธ๊ฐ ์ฃผํ ์ญํ๊ณผ์ ํฅ๋ฏธ๋ก์ด ๋น๊ต๋ฅผ ํตํด ์ด๋ก ์ ๊น์ด๋ฅผ ์ ๊ณตํ๋ฉฐ, ๊ธฐ๋ค์ค ์๋๋ ์ฝ๋ ๋ฌ์ฑ์ผ๋ก ์ค์ง์ ์ํฉํธ๋ฅผ ์
์ฆํ ์ฐ์ํ ์ฐ๊ตฌ์ด๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
๋์ ์ฒญ์ค
์ผ๋ฐ์ธ
๋ํ์ยท๋ํ์์
์ ๋ฌธ๊ฐ
ํค
์น๊ทผํ
ํ์ ์
ํ๊ธฐ์ฐฌ
์ฃผ์์ (์ ํ)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์
๋ซ๊ธฐ
์์ฑ
Developed by Jehyun Lee, KIST AIX Strategy Department | jehyun.lee@gmail.com