Design and Control of a Bipedal Robotic Character
๐ง Audio Overview ์์ฑ
์ ์ : Ruben Grandia, Espen Knoop, Michael A. Hopkins, Georg Wiedebach, Jared Bishop, Steven Pickles, David Mรผller, Moritz Bรคcher | ๋ ์ง : 2025-01-09 | URL : https://arxiv.org/abs/2501.05204 📄 PDF
Essence
Fig. 2.
์ด ๋
ผ๋ฌธ์ ํํ๋ ฅ ์๋ ์์ ์ ๋์๊ณผ ๊ฐ๊ฑดํ ๋์ ์ด๋์ฑ์ ๊ฒฐํฉํ ์ด์กฑ ๋ก๋ด ์บ๋ฆญํฐ์ ์ค๊ณ ๋ฐ ์ ์ด ์์คํ
์ ์ ์ํ๋ค. Reinforcement Learning ๊ธฐ๋ฐ ์ ์ด ๊ตฌ์กฐ์ ์ค์๊ฐ ์ ๋๋ฉ์ด์
์์ง์ ํตํด ๋ก๋ด์ด ์ฐ๊ทน์ ์ฑ๋ฅ์ ์ํํ ์ ์๋๋ก ํ๋ค.
Motivation
Known : ์ด์กฑ ๋ก๋ด์ ๋์ ์ด๋์ฑ ๋ถ์ผ์์ ์ธ์์ ์ธ ์ฑ๊ณผ๋ฅผ ์ด๋ฃจ์์ผ๋ฉฐ, ๋ก๋ด์ ์์ง์์ด ์ธ๊ฐ์ ์ธ์์ ์ํฅ์ ๋ฏธ์น๋ค๋ ๊ฒ์ด ๋๋ฆฌ ์๋ ค์ ธ ์๋ค. ๋ํ ์ ๋๋ฉ์ด์
์๋ฆฌ๋ฅผ ๋ก๋ด์ ์ ์ฉํ๋ ์ฐ๊ตฌ์ Reinforcement Learning์ ํตํ ์ด๋ ์ ์ด ์ฐ๊ตฌ๊ฐ ์กด์ฌํ๋ค.
Gap : ๊ธฐ์กด ์ฐ๊ตฌ๋ ์ฃผ๋ก ์ผ๋ฐ ๋ชฉ์ ์ ํ๋ซํผ์ผ๋ก ์ค๊ณ๋ ๋ก๋ด๋ค์ ์ฌ์ฉํ๊ฑฐ๋, ๋์ ์ด๋์ฑ๊ณผ ํํ์ ๋์์ ๋์์ ๋ฌ์ฑํ๋ ํตํฉ ์์คํ
์ด ๋ถ์กฑํ๋ค. ๋ํ ๊ธฐ๊ณ์ ์ค๊ณ์ ์ด๋์ด ์์ ์ ๋น์ ์ ๋ฐ๋ผ ๊ณต๋์ผ๋ก ๊ฐ๋ฐ๋ ์ฌ๋ก๊ฐ ์ ํ์ ์ด๋ค.
Why : ์ํฐํ
์ธment ์์ฉ์์ ๋ก๋ด์ ์ฑ๊ณต์ ์ธ๊ฐ์ ์ฃผ๊ด์ ์ธ์์ ์์กดํ๋ฏ๋ก, ํํ์ฑ๊ณผ ๋์ ๋ฅ๋ ฅ์ ํตํฉ์ด ์ค์ํ๋ค. ์ด๋ ํด๋จผ-๋ก๋ด ์ํธ์์ฉ์ ์ง์ ํฌ๊ฒ ํฅ์์ํค๊ณ ๋ก๋ด์ ์ค์ ํ์ฉ ๋ฒ์๋ฅผ ํ์ฅํ ์ ์๋ค.
Approach : ๊ธฐ๊ณ์ ์ค๊ณ์ ์ ๋๋ฉ์ด์
์ ๋ฐ๋ณต์ ์ผ๋ก ์งํํ๋ฉด์ creative intent๋ฅผ ์ฐ์ ์ํ๊ณ , PPO๋ฅผ ์ฌ์ฉํ imitation reward ๊ธฐ๋ฐ Reinforcement Learning์ผ๋ก ์ฌ๋ฌ ๊ฐ์ ์ ์ฑ
์ ํ๋ จํ๋ค. ์ค์๊ฐ์์ animation engine์ด ์ฌ์ฉ์ ์
๋ ฅ๊ณผ ์ ๋๋ฉ์ด์
์ฝํ
์ธ ๋ฅผ ํฉ์ฑํ์ฌ ์ ์ด ์ ํธ๋ฅผ ์์ฑํ๊ณ , ์ง๊ด์ ์ธ ์กฐ์ข
์ธํฐํ์ด์ค๋ก ๋ก๋ด ์ฑ๋ฅ์ ์คํํ๋ค.
Achievement
Fig. 1.
ํตํฉ ์ํฌํ๋ก์ฐ : ์ ๋๋ฉ์ด์
์ฝํ
์ธ , ์ค๊ณ, ์ ์ด, ์ค์๊ฐ ์กฐ์ข
์ ํตํฉํ์ฌ ๋ง์ถคํ ๋ก๋ด ์บ๋ฆญํฐ์ ๋น ๋ฅธ ๊ฐ๋ฐ (1๋
์ด๋ด)์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
์ฐฝ์์ ๊ธฐ๋ฐ ์ค๊ณ : ๊ธฐ๋ฅ ์๊ตฌ์ฌํญ๋ณด๋ค๋ ์ฐฝ์์ ์๋์ ์ํด ์ฃผ๋๋ ์๋ก์ด ๋ก๋ด์ ํํ์ ์ด๋ํ์ ๊ฐ๋ฐํ๋ค.
๋ถ๋ฅ ๊ธฐ๋ฐ ์ ์ด : ๋ค์ํ ๋์์ ๋ณ๋์ ๋ฒ์ฃผ๋ก ๋ถ๋ฅํ๊ณ ๊ฐ๊ฐ์ ๋ํ ์ ์ด ์ ์ฑ
์ ํ๋ จํ์ฌ ์ค์๊ฐ์ ์ ํํ ์ ์๋๋ก ํ๋ค.
์กฐ์ข
์ธํฐํ์ด์ค : ์กฐ๊ฑด๋ถ ์ ์ฑ
์
๋ ฅ์ ํ์ฉํ ์ง๊ด์ ์ธ ์กฐ์ข
์ธํฐํ์ด์ค๋ก ์ค์๊ฐ ๋ก๋ด ์ฑ๋ฅ์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
๊ฐ๊ฑดํ ์คํ : ์์ ์ ๋์์ ๋ถํ์ค์ฑ๊ณผ ์ธ๋ถ ๊ต๋์ ๊ฐ๊ฑดํ๊ฒ ์คํํ ์ ์์์ ์
์ฆํ๋ค.
How
Fig. 2.
Animation tools (classical rig ๊ธฐ๋ฐ)๋ฅผ ์ฌ์ฉํ์ฌ ์บ๋ฆญํฐ์ ๋น์จ๊ณผ ์ด๋ ๋ฒ์ ์ฐ๊ตฌ
Procedural gait generation tool๋ก ๋ฌผ๋ฆฌ์ ์ผ๋ก ํ๋นํ ์ฃผ๊ธฐ์ ๋ณดํ ์ฌ์ดํด ์์ฑ
Joint positions, velocities, torques๋ฅผ mechanical design์ ํผ๋๋ฐฑํ์ฌ geometry, actuators, structural analysis ์ต์ ํ
์๋ฎฌ๋ ์ด์
๋ชจ๋ธ์ actuator models๊ณผ domain randomization์ ํตํฉ
Animation tools์์ kinematic motion references๋ฅผ ์ถ์ถํ์ฌ imitation rewards ์ ์
PPO (Proximal Policy Optimization)๋ฅผ ์ฌ์ฉํ์ฌ ๊ฐ ๋์ ๋๋ ๋์ ์ ํ๋ณ๋ก ๋
๋ฆฝ์ ์ธ ์ ์ฑ
ํ๋ จ
๊ณ ์์ค ์ ์ด ์ ํธ (commands)๋ก ์ ์ฑ
์ ์กฐ๊ฑดํํ์ฌ runtime์์ seamless ์ ํ ๋ฐ blending ๊ตฌํ
Animation engine์ด user inputs๊ณผ animation content๋ฅผ ํฉ์ฑํ์ฌ ์ ์ด ์ ํธ ์์ฑ
IMU ํผ๋๋ฐฑ์ ํตํด ์ ์์ค ์ ์ด๊ธฐ์์ ์์ ์ฑ ์ ์ง
Originality
๊ณต๋ ์ค๊ณ ํจ๋ฌ๋ค์ : ๊ธฐ๋ฅ ์๊ตฌ์ฌํญ์ด ์๋ ์ฐฝ์์ ์๋๊ฐ ๊ธฐ๊ณ์ ์ค๊ณ๋ฅผ ์ฃผ๋ํ๋ ์๋ก์ด ์ ๊ทผ๋ฒ
๋ถํ ์ ๋ณต ์ ๋ต : ๋จ์ผ ์ ์ฑ
๋์ ์ฌ๋ฌ ์ ์ฑ
์ ํ๋ จํ๊ณ runtime์ ์ ํํ๋ ๊ตฌ์กฐ
Animation-Mechatronics ํตํฉ ์ํฌํ๋ก์ฐ : ์ ๋๋ฉ์ด์
๊ณผ ๊ธฐ๊ณ์ ์ค๊ณ์ ๋ฐ๋ณต์ ์ํธ์์ฉ์ผ๋ก ๋น ๋ฅธ ๊ฐ๋ฐ ์ํ
์กฐ์ข
๊ธฐ๋ฐ ์ธํฐํ์ด์ค : ๊ณ ์ ๋ autonomous behavior ๋์ puppeteer๊ฐ ์ค์๊ฐ์ผ๋ก show๋ฅผ authorํ ์ ์๋ ์ธํฐํ์ด์ค
Conditional policy ํ์ฉ : ๊ณ ์์ค control commands๋ก ์ฌ๋ฌ ๋์์ seamless blending ๋ฐ ์ ํ ์คํ
Limitation & Further Study
์ ์๋ ๋ก๋ด์ ํน์ ์ํฐํ
์ธment ์์ฉ์ ๋ง์ถคํ๋์ด ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ด ์ ํ์ ์ผ ์ ์๋ค.
์ฌ๋ฌ ๊ฐ์ ๋
๋ฆฝ์ ์ ์ฑ
์ ํ๋ จํด์ผ ํ๋ฏ๋ก ์๋ก์ด ๋์ ์ถ๊ฐ ์ ์ฌํ๋ จ ๋น์ฉ์ด ๋ฐ์ํ๋ค.
Domain randomization์ ์ฌ์ฉํ์ง๋ง sim-to-real gap์ ์์ ํ ํด๊ฒฐ์ ์ ์๋์ง ์์๋ค.
์ธ๋ถ ํ๊ฒฝ ๋๋ ๋ณต์กํ ์งํ์์์ ๊ฐ๊ฑด์ฑ ํ๊ฐ๊ฐ ์ ํ์ ์ด๋ค.
ํ์ ์ฐ๊ตฌ๋ ๋ ํฐ ๋์ ๋ ํผํ ๋ฆฌ์ ๋ํ ํตํฉ ์ ์ฑ
ํ์ต ๋ฐฉ๋ฒ ๊ฐ๋ฐ, ๋น์ธ๊ฐํ ์บ๋ฆญํฐ์ ๋ํ ์ผ๋ฐํ, ๊ทธ๋ฆฌ๊ณ fully autonomous behavior planning ์์คํ
์ผ๋ก์ ํ์ฅ์ ๊ณ ๋ คํ ์ ์๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ : ์ด ๋
ผ๋ฌธ์ ์ด์กฑ ๋ก๋ด์ ํํ์ฑ๊ณผ ๋์ ๋ฅ๋ ฅ์ ํตํฉํ๋ ํ์ ์ ์ธ ์ค๊ณ ๋ฐ ์ ์ด ํ์ดํ๋ผ์ธ์ ์ ์ํ๋ฉฐ, ์ ๋๋ฉ์ด์
๊ณผ ๋ก๋ด ๊ณตํ์ ๊ต์ ์์ ์๋ก์ด ํจ๋ฌ๋ค์์ ์ ์ํ๋ค. ์ํฐํ
์ธment ๋ก๋ณดํฑ์ค์ ํด๋จผ-๋ก๋ด ์ํธ์์ฉ ๋ถ์ผ์ ์ค์ํ ๊ธฐ์ฌ๋ฅผ ํ๋ฉด์๋ ์ค์ ์์คํ
๊ตฌํ์ ํตํด ์ค์ฉ์ฑ์ ์
์ฆํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
๋์ ์ฒญ์ค
์ผ๋ฐ์ธ
๋ํ์ยท๋ํ์์
์ ๋ฌธ๊ฐ
ํค
์น๊ทผํ
ํ์ ์
ํ๊ธฐ์ฐฌ
์ฃผ์์ (์ ํ)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์
๋ซ๊ธฐ
์์ฑ
Developed by Jehyun Lee, KIST AIX Strategy Department | jehyun.lee@gmail.com