์ ์: Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. Luo | ๋ ์ง: 2025-10-01 | URL: https://arxiv.org/abs/2510.01068 📄 PDF
๋ณธ ๋ ผ๋ฌธ์ General Policy Composition (GPC)๋ฅผ ์ ์ํ์ฌ ์ฌ์ ํ์ต๋ diffusion ๋๋ flow ๊ธฐ๋ฐ ๋ก๋ด ์ ์ฑ ๋ค์ ๋ถํฌ ์์ค ์ ์๋ฅผ convex ์กฐํฉ์ผ๋ก ๊ฒฐํฉํจ์ผ๋ก์จ, ์ถ๊ฐ ํ์ต ์์ด ๊ฐ๋ณ ์ ์ฑ ๋ณด๋ค ์ฐ์ํ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค.
Figure 2: Overview of our proposed General Policy Composition. Combining distributional
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ๊ธฐ์กด ์ ์ฑ ํ์ฉ์ ํตํ ์ฑ๋ฅ ํฅ์์ด๋ผ๋ ์ค์ฉ์ ๋ฌธ์ ๋ฅผ ์ด๋ก ์ ๊ธฐ์ด์ ํจ๊ป ํด๊ฒฐํ๋ฉฐ, GPC๋ ๊ฐ๋จํ๋ฉด์๋ ํจ๊ณผ์ ์ธ ๋ฐฉ๋ฒ์ผ๋ก ๋ก๋ด ํ์ต์ ๋ฐ์ดํฐ ํจ์จ์ฑ ๋ฌธ์ ์ ๋ํ ์๋ก์ด ๊ด์ ์ ์ ์ํ๋ค. ๊ด๋ฒ์ํ ์คํ ๊ฒ์ฆ๊ณผ ์ฐ์ํ ์ฑ๋ฅ ํฅ์์ ๋ก๋ด ์ ์ด ๋ถ์ผ์ ์๋นํ ๊ธฐ์ฌ๋ฅผ ํ๋ค.