์ ์: Joohwan Seo, Soochul Yoo, Junwoo Chang, Hyunseok An, Hyunwoo Ryu | ๋ ์ง: 2025.03 | DOI: N/A 📄 PDF
Fig. 4. Coordinate frames {A} and {B} for specifying
๋ณธ ๋ ผ๋ฌธ์ ๋ก๋ด ํ์ต ๋ฐ ์ ์ด์์ SE(3) ๋ํ์ฑ(equivariance)์ ํ์ฉํ๋ ์ฌํ ํํ ๋ฆฌ์ผ ์๋ฒ ์ด์ด๋ค. Group theory, Lie groups, SE(3) ๋ฑ ์ํ์ ๊ธฐ์ด๋ถํฐ equivariant neural networks์ ๋ก๋ด ์์ฉ๊น์ง ํฌ๊ด์ ์ผ๋ก ๋ค๋ฃฌ๋ค.
Fig. 4. Coordinate frames {A} and {B} for specifying
์ฃผ์ ์ฑ๊ณผ:
โข SE(3)-equivariance์ ํต์ผ๋ ์ํ์ ํ๋ ์์ํฌ ์ ์
โข Lie groups, Lie algebras๋ก๋ถํฐ SE(3) ์ ์ ๋ฐ group action์ ๋ช ํํ ์ค๋ช
โข Group convolutional networks์ steerability on SE(3)์ equivariant ์ ๊ฒฝ๋ง ์ค๊ณ ๋ฐฉ๋ฒ๋ก ์ ๊ณต
โข Imitation learning๊ณผ reinforcement learning์์์ SE(3)-equivariant ๋ชจ๋ธ ์ ์ฉ ์ฌ๋ก ๊ฒํ
โข Geometric control ๊ด์ ์์ SE(3) manifold ์์ ์ ์ด ์ค๊ณ ๊ธฐ๋ฒ ์๊ฐ
โข End-to-end SE(3)-equivariant energy-based models์ diffusion ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ ์ต์ ๋ํฅ ์ ๋ฆฌ
Fig. 1. Illustration of a Lie group G and two of its tan-
โข Group theory์ ๊ธฐ์ด ๊ฐ๋ (Group, Subgroup, Group action)์ ๋ช ํํ ์ ์ํ๊ณ SO(3), SE(3) ๋ฑ ํต์ฌ ๊ทธ๋ฃน ์๊ฐ
โข Lie groups์ Lie algebras์ ๊ด๊ณ, exponential map๊ณผ logarithmic map์ ์ค๋ช ํ์ฌ ๊ตฐ์ ์ง์ญ ๊ตฌ์กฐ ํด์
โข Matrix Lie groups๋ฅผ ํตํด rigid body transformations์ ์ํ์ ํํ ์ ๊ณต
โข Group-equivariant neural network์ ์ค๊ณ ์๋ฆฌ(fiber bundles, representation theory) ์ค๋ช
โข Equivariance ์ ์ฝ์ ๋ง์กฑํ๋ convolutional filters์ linear maps์ ๊ตฌ์ฑ ๋ฐฉ๋ฒ ์ ์
โข SE(3)-equivariant deep learning ๋ชจ๋ธ์ ๊ตฌ์ฒด์ ๊ตฌํ(point cloud ์ฒ๋ฆฌ, energy-based models)
โข Imitation learning๊ณผ reinforcement learning ์๊ณ ๋ฆฌ์ฆ๊ณผ equivariance์ ๊ฒฐํฉ ๋ฐฉ์ ๋ ผ์
โข Error functions, Riemannian metrics, velocity errors๋ฅผ ํตํ geometric control ์ค๊ณ ์๋ฆฌ ์ค๋ช
โข SE(3)-equivariance๋ฅผ ๋ก๋ด ํ์ต๊ณผ ์ ์ด์ ํตํฉํ๋ ํฌ๊ด์ ์ธ ํํ ๋ฆฌ์ผ ์ ๊ณต์ผ๋ก ๊ธฐ์กด ์ฐ์ฌ๋ ์ฐ๊ตฌ๋ค์ ์ฒด๊ณํ
โข ๋ก๋ด ์ปค๋ฎค๋ํฐ์ ๋ค์ํ ํ๊ธฐ๋ฒ์ ํต์ผํ์ฌ ์ดํด์ ์ฅ๋ฒฝ ์ ๊ฑฐ
โข Group theory ๊ธฐ์ด๋ถํฐ ์ต์ ๋ฅ๋ฌ๋ ์์ฉ๊น์ง ์ผ๊ด๋ ์ํ์ ๊ด์ ์ผ๋ก ์ค๋ช
โข Geometric control๊ณผ equivariant deep learning์ ์ฐ๊ฒฐํ๋ ๊ด์ ์ ์
โข ์ด๋ก ์ ์ค๋ช ์ ์ค์ ์ ๋์ด ์ค์ ๋ก๋ด ์์คํ ์์์ ๊ตฌํ ๋ฐ ์ฑ๋ฅ ๋น๊ต ์คํ์ด ๋ถ์กฑ
โข ๋ค์ํ ๋ก๋ด ์์ (manipulation ์ธ navigation, perception ๋ฑ)์์์ equivariance ํ์ฉ์ด ์ ํ์ ์ผ๋ก ๋ค๋ฃจ์ด์ง
โข ๊ณ์ฐ ๋ณต์ก๋ ๋ฐ ํ์ฅ์ฑ ๋ฌธ์ ์ ๋ํ ์ถฉ๋ถํ ๋ถ์ ๋ถ์ฌ
โข ํ์ ์ฐ๊ตฌ: multi-modal sensor fusion, lifelong learning, ๋์ ํ๊ฒฝ์์์ robust equivariant models ๊ฐ๋ฐ ํ์
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ SE(3)-equivariance ๊ด์ ์์ ๋ก๋ด ํ์ต ๋ฐ ์ ์ด๋ฅผ ๋ค๋ฃจ๋ ํฌ๊ด์ ์ด๊ณ ์ฒด๊ณ์ ์ธ ํํ ๋ฆฌ์ผ ์๋ฒ ์ด์ด๋ค. Group theory ๊ธฐ์ด๋ถํฐ ์ต์ deep learning ์์ฉ๊น์ง ํต์ผ๋ ์ํ ํ๊ธฐ๋ฒ์ผ๋ก ์ค๋ช ํ์ฌ ๋ก๋ด ์ปค๋ฎค๋ํฐ์ ํฐ ๊ธฐ์ฌ๋ฅผ ํ ์ ์์ผ๋, ์ค์ ๊ตฌํ๊ณผ ์คํ์ ๊ฒ์ฆ์ด ๋์ฑ ๊ฐํ๋๋ค๋ฉด ์ํฅ๋ ฅ์ด ๋์ฑ ์ฆ๋๋ ๊ฒ์ผ๋ก ํ๋จ๋๋ค.