์ ์: Sunshine Jiang, Xiaolin Fang, Nicholas Roy, Tomรกs Lozano-Pรฉrez, Leslie Pack Kaelbling, Siddharth Ancha | ๋ ์ง: 2025-05-28 | URL: https://arxiv.org/abs/2505.21851 📄 PDF
Figure 1: (a) Diffusion policy [1] and flow-matching policy [2] input a history of observations (not shown) to
Action trajectory๋ฅผ flow trajectory๋ก ์ทจ๊ธํ์ฌ diffusion/flow-matching ์ ์ฑ ์ ๋จ์ํํ๊ณ , ํ๋ฆ ์ํ๋ง ์ค ์ค์๊ฐ์ผ๋ก ๋ก๋ด์ action์ ์คํธ๋ฆฌ๋ฐํ ์ ์๋ streaming flow policy๋ฅผ ์ ์ํ๋ค.
Figure 2: (a) To illustrate our method, we consider a toy example of 1-D robot actions with two demonstration
Figure 2: (a) To illustrate our method, we consider a toy example of 1-D robot actions with two demonstration
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ action trajectory๋ฅผ flow trajectory๋ก ์ทจ๊ธํ๋ ๊ทผ๋ณธ์ ์ผ๋ก ์๋ก์ด ๊ด์ ์ ์ ์ํ์ฌ diffusion/flow policy์ ๊ณ์ฐ ํจ์จ์ฑ๊ณผ ๋ฐ์์ฑ์ ํฌ๊ฒ ๊ฐ์ ํ ๋ ผ๋ฌธ์ด๋ค. Streaming generation์ด๋ผ๋ ์ค์ฉ์ ์ด์ ๊ณผ ์ด๋ก ์ ๊ธฐ๋ฐ(flow matching)์ ์กฐํ, ๊ทธ๋ฆฌ๊ณ ๋ก๋ด ์ ์ด์ ํน์ฑ์ ํ์ฉํ ์ค๊ณ๊ฐ ๋๋ณด์ด๋ ์ฐ์ํ ์ฐ๊ตฌ๋ค.