Stabilizing Humanoid Robot Trajectory Generation via Physics-Informed Learning and Control-Informed Steering
๐ง Audio Overview ์์ฑ
์ ์ : Evelyn D'Elia, Paolo Maria Viceconte, Lorenzo Rapetti, Diego Ferigo, Giulio Romualdi, Giuseppe L'Erario, Raffaello Camoriano, Daniele Pucci | ๋ ์ง : 2025-09-29 | URL : https://arxiv.org/abs/2509.24697 📄 PDF
Essence
Fig. 1: Our method used to execute various walking direc-
์ธ๊ฐํ ๋ก๋ด์ ๊ถค์ ์์ฑ์ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ํ์ต๊ณผ ์ ์ด ๊ธฐ๋ฐ ๋ณด์ ์ ๊ฒฐํฉํ์ฌ ๋ชจ๋ฐฉํ์ต์ ์์ ์ฑ์ ํฅ์์ํค๋ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค. Physics-informed loss์ PI ์ ์ด๊ธฐ๋ฅผ ํตํด ๋ฌผ๋ฆฌ ๋ฒ์น ์๋ฐ์ ์ค์ด๊ณ ์ค์ ๋ก๋ด์์์ ์์ ์ฑ์ ๊ฐ์ ํ๋ค.
Motivation
Known : ํ๋ ๋ณต์ (behavior cloning)๋ฅผ ์ด์ฉํ ์ธ๊ฐํ ๋ก๋ด ๊ถค์ ์์ฑ์ ์ธ๊ฐ๋ค์ด ๋ถ๋๋ฌ์ด ์์ง์์ ๊ฐ๋ฅํ๊ฒ ํ์์ผ๋, ์ ํ๋ ๋ฐ์ดํฐ๋์ผ๋ก ์ธํด ๋ฌผ๋ฆฌ ๋ฒ์น์ ์๋ฐํ๊ณ ๋ถ์์ ํ ๊ถค์ ์ ์์ฑํ ์ ์๋ค. Physics-informed machine learning(PIML)์ ๋ฌผ๋ฆฌ ์ ์ฝ์ ํ์ต์ ์ธ์ฝ๋ฉํ์ฌ ๋ฐ์ดํฐ ํจ์จ์ฑ์ ๊ฐ์ ํ๋ ๊ฒ์ผ๋ก ์๋ ค์ ธ ์๋ค.
Gap : ๊ธฐ์กด PIML ๊ธฐ๋ฐ ์ธ๊ฐํ ๋ก๋ด ์ ์ด๋ ๋ฏธ๋ถ๋ถ๊ฐ๋ฅํ ๋ฆฌ์๋ ํจ์๋ฅผ ์ฌ์ฉํ๊ฑฐ๋ ์ธ๊ฐ๋ค์์ด ๋ถ์กฑํ๋ฉฐ, ํ์ต ๋จ๊ณ์์์ ๋ฌผ๋ฆฌ ์ ์ฝ ์ธ์ฝ๋ฉ๊ณผ ์ถ๋ก ๋จ๊ณ์์์ ๋๋ฆฌํํธ ๋ณด์ ์ ํตํฉ์ ์ผ๋ก ๋ค๋ฃจ๋ ์ฐ๊ตฌ๊ฐ ๋ถ์กฑํ๋ค.
Why : ์ธ๊ฐํ ๋ก๋ด์ด ํ๋ ฅ์ ํ๊ฒฝ์์ ์์ ํ๊ณ ์ ๋ขฐํ ์ ์๊ฒ ์๋ํ๋ ค๋ฉด ๋ฌผ๋ฆฌ์ ์ผ๋ก ํ๋นํ ๊ถค์ ์ ์์ฑํด์ผ ํ๋ฉฐ, ๋์์ ์ธ๊ฐ๋ค์ด ์์ง์์ ์ ์งํด์ผ ํ๋ค. ์ด๋ ์ค์ ๋ฐฐํฌ ํ๊ฒฝ์์์ ์์ ์ฑ๊ณผ ์ฌ์ฉ์ ์ ๋ขฐ๋๋ฅผ ๊ฒฐ์ ํ๋ค.
Approach : ๋ ๊ฐ์ง ์ ๋ต์ผ๋ก ๊ตฌ์ฑ๋๋ค: (1) ํ์ต ๋จ๊ณ์์ ์ ์ด ๋ฐ์ ์๋๋ฅผ 0์ผ๋ก ์ ์งํ๋๋ก ํ๋ ๋ฏธ๋ถ๊ฐ๋ฅํ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ์์คํจ์๋ฅผ ์ถ๊ฐํ๊ณ , (2) ์ถ๋ก ๋จ๊ณ์์ ๋คํธ์ํฌ ์ถ๋ ฅ์ ๋น๋ก-์ ๋ถ(PI) ์ ์ด๊ธฐ๋ฅผ ์ง์ ์ ์ฉํ์ฌ ๋๋ฆฌํํธ๋ฅผ ์ต์ํํ๋ค.
Achievement
Fig. 3: Comparison of the drift in base position (top) and
Floating-base ๋ก๋ด์ ์ ์ฒด ์ด๋ํ์ ์ํ ํ์ต : ํ์ค ๋ฐ์ดํฐ ์ ํฉ ์์ค๊ณผ ํจ๊ป kinematically feasible ์ ์ด์ ๊ณ ๋ คํ physics-informed loss๋ฅผ ์ ์ํ์ฌ, ๋คํธ์ํฌ๊ฐ ์ ์ด ๋ฐ์ ๊ณ ์ ํ๊ณ ์ ๊ฐ ๋ฐ๋ง ์ด๋ํ๋๋ก ํ์ตํ๊ฒ ํจ
์ ์ด ๊ธฐ๋ฐ ๋๋ฆฌํํธ ๊ฐ์ : ๊ธฐ๋ณธ ์ ์ด ์ด๋ก ์ ํ์ฉํ์ฌ ์ฌ์ฉ์ ์
๋ ฅ๊ณผ ๋คํธ์ํฌ ์์ธก์ ๊ฒฐํฉํ ๋ณด์ ํญ์ ๋์
, ๊ถค์ ์ ๋๋ฆฌํํธ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ๊ฐ์
์ค์ ๋ก๋ด ๊ฒ์ฆ : ergoCub ์ธ๊ฐํ ๋ก๋ด์์ ๋ ๊ฐ์ง ์ ์ด ์ํคํ
์ฒ๋ก ์คํํ์ฌ ๋ฐฉ๋ฒ์ ๋ค์ค์ฑ(modularity)๊ณผ ํจ๊ณผ์ฑ์ ์
์ฆ, ๊ถค์ ์ ์ ํ๋์ ๋ฌผ๋ฆฌ ์ ์ฝ ์ค์๋ฅผ ์๋นํ ๊ฐ์
How
Fig. 2: Overall humanoid locomotion architecture integrating
Supervised learning์ ํตํด ์ด์ ์ํ์ ์ฌ์ฉ์ ์ง์ ๋ฐฉํฅ ์
๋ ฅ์ด ์ฃผ์ด์ก์ ๋ ๋ค์ ์ํ์ ์ ์ฒด ์ด๋ํ์ ์ํ๋ฅผ ์์ธกํ๋ ์ ๊ฒฝ๋ง ํ์ต
Physics-informed loss ํจ์ L(z; ฮธ) = wFยทLF(z; ฮธ) + wBยทLB(z; ฮธ) + wDยทLD(z; ฮธ) ํํ๋ก ์ ์ํ์ฌ ๋ฏธ๋ถ๊ฐ๋ฅํ ๋ฌผ๋ฆฌ ์ ์ฝ์ backpropagation ์ค์ ๋ฐ์
Jacobian ํ๋ ฌ์ ์๋ ๋ฏธ๋ถ(automatic differentiation)์ผ๋ก ๊ณ์ฐํ์ฌ ์ ์ด ๋ฐ์ ์๋ ์ ์ฝ์ ์์คํจ์์ ์ธ์ฝ๋ฉ
์ถ๋ก ๋จ๊ณ์์ PI ์ ์ด๊ธฐ u_corrected = u_network + kPยทe + kIยทโซe๋ฅผ ์ ์ฉํ์ฌ ๋คํธ์ํฌ ์ถ๋ ฅ์ ์ฒด๊ณ์ ์ค๋ฅ๋ฅผ ์ค์๊ฐ์ผ๋ก ๋ณด์
Ablation study๋ฅผ ํตํด ๊ฐ ๊ตฌ์ฑ ์์(physics-informed loss, PI ์ ์ด๊ธฐ)์ ๊ธฐ์ฌ๋ ์ ๋ํ
ergoCub ๋ก๋ด์์ ๋ค์ํ ๋ณดํ ๋ฐฉํฅ ์คํ ๋ฐ ๋ ๊ฐ์ง ์๋ก ๋ค๋ฅธ ์ ์ด ์ํคํ
์ฒ์์ ํธํ์ฑ ๊ฒ์ฆ
Originality
PIML๊ณผ ์ ์ด ์ด๋ก ์ ๊ฒฐํฉํ ๋ชจ๋์ ํ๋ ์์ํฌ๋ก, ํ์ต ๋จ๊ณ์ ์ถ๋ก ๋จ๊ณ๋ฅผ ๋ช
ํํ ๋ถ๋ฆฌํ์ฌ ๊ฐ๊ฐ ๋ค๋ฅธ ์์ ํ ์ ๋ต์ ์ ์ฉ
Automatic differentiation์ ํ์ฉํ์ฌ Jacobian ๊ธฐ๋ฐ ์ ์ด ์๋ ์ ์ฝ์ ๋ฏธ๋ถ๊ฐ๋ฅํ ์์คํจ์๋ก ๊ตฌํ, ๊ธฐ์กด non-differentiable ๋ฆฌ์๋ ๋ฐฉ์๊ณผ ์ฐจ๋ณํ
์ฌ์ฉ์ ์
๋ ฅ๊ณผ ๋คํธ์ํฌ ์์ธก์ PI ์ ์ด๊ธฐ๋ก ๋ธ๋ ๋ฉํ๋ ๋ฐฉ์์ ๊ฒฝ๋์ด๋ฉด์๋ ํจ๊ณผ์ ์ธ ์ถ๋ก ๋จ๊ณ ๋ณด์ ๋ฐฉ๋ฒ์ผ๋ก ์ค์ ๋ฐฐํฌ์ ์ฉ์ด
ํ๋ ๋ณต์ ์ ์ธ๊ฐ๋ค์์ ์ ์งํ๋ฉด์ ๋ฌผ๋ฆฌ ํ๋น์ฑ์ ๊ฐ์ ํ๋ ๋ช
ํํ ๋ชฉํ ์ค์ ๊ณผ ์ฒด๊ณ์ ์ ๊ทผ
Limitation & Further Study
๋ฐ์ดํฐ ์์กด์ฑ : ์ฌ์ ํ ์ด๊ธฐ ํ๋ ๋ณต์ ๋ชจ๋ธ์ ํ์ง์ ์์กดํ๋ฏ๋ก, ํ๋ จ ๋ฐ์ดํฐ์ ๋ค์์ฑ๊ณผ ํ์ง์ด ์ถฉ๋ถํ์ง ์์ผ๋ฉด ์ฑ๋ฅ ์ ํ
๋ฌผ๋ฆฌ ์ ์ฝ์ ์ ํ์ฑ : ํ์ฌ ์ ์ด ๋ฐ์ ์๋๋ง์ ์ ์ฝํ๊ณ ์์ผ๋ฉฐ, ๋ค๋ฅธ ์ค์ํ ๋ฌผ๋ฆฌ ๋ฒ์น(์: ๋ชจ๋ฉํ
๋ณด์กด, ์ง๋ฉด ๋ฐ๋ ฅ ์ ์ฝ)์ ๋ฏธํฌํจ
์ ์ด๊ธฐ ํ๋ : PI ์ ์ด๊ธฐ์ ์ด๋(kP, kI) ๊ฐ์ด ์๋์ผ๋ก ์กฐ์ ๋์ด์ผ ํ๋ฉฐ, ๋ก๋ด์ด๋ ํ๊ฒฝ ๋ณํ์ ๋ฐ๋ฅธ ์๋ ์กฐ์ ๋ฉ์ปค๋์ฆ ๋ถ์ฌ
์ผ๋ฐํ ์ฑ๋ฅ : ergoCub ๋ก๋ด์์๋ง ๊ฒ์ฆ๋์์ผ๋ฏ๋ก ๋ค๋ฅธ ์ธ๊ฐํ ๋ก๋ด์ด๋ ์ฌ์กฑ ๋ก๋ด์ผ๋ก์ ์ผ๋ฐํ ์ ๋ ๋ฏธ์ง์
๊ณ์ฐ ๋น์ฉ : ์ค์๊ฐ Jacobian ๊ณ์ฐ๊ณผ ์๋ ๋ฏธ๋ถ์ผ๋ก ์ธํ ๊ณ์ฐ ์ค๋ฒํค๋์ ์์ธ ๋ถ์ ๋ถ์กฑ
ํ์ ์ฐ๊ตฌ : (1) ๋ ํฌ๊ด์ ์ธ ๋ฌผ๋ฆฌ ์ ์ฝ์ ์์คํจ์์ ํฌํจํ๋ ๋ฐฉ๋ฒ, (2) ์ ์ํ PI ์ ์ด ์ด๋ ์กฐ์ ๊ธฐ๋ฒ, (3) ๋ค์ํ ์ธ๊ฐํ ๋ก๋ด ํ๋ซํผ์ผ๋ก์ ํ์ฅ, (4) ๋์ ํ๊ฒฝ(์: ์ฅ์ ๋ฌผ, ๊ณ๋จ)์์์ ์ฑ๋ฅ ํ๊ฐ
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ : ๋ณธ ๋
ผ๋ฌธ์ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ํ์ต๊ณผ ์ ์ด ์ด๋ก ์ ํจ๊ณผ์ ์ผ๋ก ๊ฒฐํฉํ์ฌ ์ธ๊ฐํ ๋ก๋ด ๊ถค์ ์์ฑ์ ์ค์ ์์ ์ฑ์ ํฅ์์ํค๋ ์ค์ง์ ์ด๊ณ ๋ชจ๋์์ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค. ํนํ ๋ฏธ๋ถ๊ฐ๋ฅํ ๋ฌผ๋ฆฌ ์ ์ฝ ์ธ์ฝ๋ฉ๊ณผ ์ถ๋ก ๋จ๊ณ์ PI ์ ์ด ๋ณด์ ์ ๊ตฌํ์ด ๊ฐ๋จํ๋ฉด์๋ ์ค์ฆ์ ํจ๊ณผ๊ฐ ํฌ๋ฉฐ, ์ค์ ๋ก๋ด ๊ฒ์ฆ์ผ๋ก ์ฐ์
์ ์ฉ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
๋์ ์ฒญ์ค
์ผ๋ฐ์ธ
๋ํ์ยท๋ํ์์
์ ๋ฌธ๊ฐ
ํค
์น๊ทผํ
ํ์ ์
ํ๊ธฐ์ฐฌ
์ฃผ์์ (์ ํ)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์
๋ซ๊ธฐ
์์ฑ
Developed by Jehyun Lee, KIST AIX Strategy Department | jehyun.lee@gmail.com