์ ์: Zachary Olkin, William D. Compton, Aaron D. Ames | ๋ ์ง: 2026-05-03 | URL: https://arxiv.org/abs/2605.01978 📄 PDF
Fig. 1.
๋ณธ ๋ ผ๋ฌธ์ Control Lyapunov Function (CLF)์ ๊ธฐ๋ฐ์ผ๋ก ํ ๊ฐํํ์ต(CLF-RL)์ผ๋ก ํ์ต๋ ์ ์ด ์ ์ฑ ์ ์ด๋ก ์ ์์ ์ฑ์ ๋ถ์ํ๋ค. ์ฐ์ยท์ด์ฐ ์๊ฐ ๋ชจ๋์์ ์ต์ ์ ์ด ๋ฌธ์ ๋ก ์ฌ์ ์ํ์ฌ ์ง์ ์์ ์ฑ์ ์ฆ๋ช ํ๊ณ , ์ด๋ฅผ ์์น ๊ฒ์ฆ ๋ฐ ํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ ์ฃผ๊ธฐ ๋ณดํ ์คํ์ผ๋ก ๊ฒ์ฆํ๋ค.
Fig. 2.
Theorem 1 (์ฐ์์๊ฐ ์ง์์์ ์ฑ): ์ต์ ์ ์ฑ ฯโ๋ ์์ ๊ทผ์ฒ์์ ์ง์ญ ์ง์ ์์ ์ ๋ฌ์ฑํ๋ฉฐ, โฅx(t)โฅ โค โ[cโ(ฮณ + 2L)/(cโ(ฮณ + ฮป))] e^(-ฮปt/2) โฅxโโฅ์ ๋ช ์์ ์๋ ด ๊ฒฝ๊ณ๋ฅผ ๋ง์กฑํ๋ค. Theorem 2 (์ด์ฐ์๊ฐ ํ์ฅ): ์ด์ฐ์๊ฐ ๋์ญํ์์๋ ๋์ผํ ์ง์ ์์ ์ฑ ์ฑ์ง์ ์ฆ๋ช ํ๊ณ ๋ก๋ฒ์คํธ์ฑ์ ๋ณด์ฅํ๋ค. ์์น ๊ฒ์ฆ: Double integrator ๋ฐ cart-pole ์์คํ ์์ ์ด๋ก ์ ๊ฒฝ๊ณ๊ฐ ์์น ํด์ ์ผ์นํจ์ ํ์ธํ๋ค. ์คํ ๊ฒ์ฆ: Unitree G1 ํด๋จธ๋ ธ์ด๋๋ก๋ด์ ์ฃผ๊ธฐ ๋ณดํ ์ถ์ข ํ์ต์ CLF-RL์ ์ ์ฉํ์ฌ ์์ ์ ์ธ ๋ณดํ ๊ถค์ ์ถ์ข ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค.
Fig. 2.
โข Assumption 1-2์์ CLF์ ์กด์ฌ ๋ฐ ์ต์ ์ ์ฑ ์กด์ฌ ์กฐ๊ฑด์ ์ ์ธํ๊ณ , positive definiteness์ forward invariance๋ฅผ ๋ณด์ด๊ธฐ ์ํด 4๊ฐ์ ๋ณด์กฐ์ ๋ฆฌ(Lemma 1-4)๋ฅผ ์ฆ๋ช . โข Lemma 1: J(0)=0์ด๊ณ J(x)>0 (xโ 0)์ ์์ ๋ถํธ์ฑ ์ฆ๋ช . โข Lemma 2: ์ํ ๊ฒฝ๊ณ J(x) โค ฮฒ/(ฮณ+ฮป) V(x) ๋์ถ. โข Lemma 3: HJB ์๊ณผ ์ต์ ์ฑ ์กฐ๊ฑด์ผ๋ก๋ถํฐ Jฬ(x) โค -ฮปJ*(x) ๋์ถ. โข Lemma 4: ์์ถ์ฑ(compactness)๊ณผ ๋ถ๋ณ์ฑ(invariance) ์ฆ๋ช . โข ์ด์ฐ์๊ฐ์ ๊ฒฝ์ฐ ๋น์ทํ ๋ ผ๋ฆฌ๋ฅผ difference equation์ ์ ์ฉํ๊ณ , ์ถ๊ฐ ์ค์ฉ์ ๋ณด์ํญ(additional practical reward terms)์ ํฌํจํ๋ ํ์ฅ์ ์ ์.
โข CLF-RL์ด ์ค์ ๋ก ์ง์ ์์ ์ฑ์ ๋ณด์ฆํ๋ค๋ ์ต์ด์ ์ํ์ ์ฆ๋ช ์ ์. โข Optimal control ํ๋ ์์ํฌ์ Lyapunov ์์ ์ฑ ์ด๋ก ์ ํตํฉ์ ํ์ฉ์ผ๋ก RL์ ์ด๋ก ์ ๊ธฐ์ด๋ฅผ ๊ฐํ. โข ์ฐ์์๊ฐ๊ณผ ์ด์ฐ์๊ฐ ๋ชจ๋์์ ์ฆ๋ช ํ๊ณ ์ค์ฉ์ ์ถ๊ฐ ๋ณด์ํญ๊น์ง ํฌํจํ๋ ํฌ๊ด์ ๋ถ์.
โข Assumption 1-2์ ์กด์ฌ ์กฐ๊ฑด์ด ์ ์ธ์ ์ด๋ฉฐ, ๋ชจ๋ ์ค์ ์์คํ ์์ CLF์ ๊ตฌ์ฑ ๋ฐฉ๋ฒ์ด ์๋ช ํ์ง ์๋ค. โข ์ง์ญ ์์ ์ฑ๋ง ์ฆ๋ช ๋๋ฉฐ, ์๋ ด ์์ญ(region of attraction)์ ํฌ๊ธฐ์ ๋ํ ๋ช ์์ ์ ๋ํ๊ฐ ๋ถ์กฑ. โข ํด๋จธ๋ ธ์ด๋ ์คํ์ ์ฃผ๊ธฐ ๊ถค์ ์ถ์ข ์ผ๋ก ์ ํ๋์ด ์ผ๋ฐํ ์ฑ๋ฅ(disturbance ๋์, ๋น์ ์ ์ํฉ)์ด ๊ฒ์ฆ๋์ง ์์. ํ์ ์ฐ๊ตฌ: ์ ์ญ ์์ ์ฑ ์กฐ๊ฑด ๋์ถ, CLF ์๋ ์์ฑ ๋ฐฉ๋ฒ ๊ฐ๋ฐ, ๋ชจ๋ธ ๋ถํ์ค์ฑ ํ์์์ ๋ก๋ฒ์คํธ์ฑ ๋ถ์ ํ์.
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ CLF-RL์ ์ค์ ์ฑ๊ณต์ ์ด๋ก ์ผ๋ก ๋ท๋ฐ์นจํ๋ ์ค์ํ ๊ธฐ์ฌ๋ก, ์ง์ ์์ ์ฑ ์ฆ๋ช ์ด ๋ช ํํ๊ณ ์ฐ์ยท์ด์ฐ ์๊ฐ ๋ชจ๋์์ ํฌ๊ด์ ์ผ๋ก ๋ค๋ฃจ์ด์ก๋ค. ๋ค๋ง ์ง์ญ ์์ ์ฑ ํ์ , CLF ๊ตฌ์ฑ ๋ฐฉ๋ฒ์ ์ค์ฉ์ฑ ๋ถ์ฌ, ์ ํ๋ ์คํ ๊ฒ์ฆ์ด ํ๊ณ์ด๋, ์ ์ด ์ด๋ก ๊ณผ RL์ ๊ฒฉ์ฐจ๋ฅผ ์ค์ด๋ ๊ฐ์น ์๋ ์ฒซ ๊ฑธ์์ด๋ค.