์ ์: Setareh Cohan, Guy Tevet, Daniele Reda, Xue Bin Peng, Michiel van de Panne | ๋ ์ง: 2024-05-17 | URL: https://arxiv.org/abs/2405.11126 📄 PDF
Figure 1: Flexible motion in-betweening given a text prompt and spatio-temporally sparse keyframes. From left to right:
CondMDI๋ diffusion model ๊ธฐ๋ฐ์ ํตํฉ๋ ๋ชจ์ ์ธ-๋นํธ์๋ ๋ฐฉ๋ฒ์ผ๋ก, ํ ์คํธ ์กฐ๊ฑด๊ณผ ํจ๊ป ์ ์ฐํ keyframe ์ ์ฝ์ ๋ฐ์ ๋ค์ํ๊ณ ์ ๋ฐํ ์ธ๊ฐ ๋ชจ์ ์ ์์ฑํ๋ค.
Figure 2: Conditional Motion Diffusion In-betweening (CondMDI) overview. The model is fed a noisy motion sequence x๐ก,
Figure 2: Conditional Motion Diffusion In-betweening (CondMDI) overview. The model is fed a noisy motion sequence x๐ก,
์ดํ: CondMDI๋ masked conditional diffusion model์ ํตํด motion in-betweening์ ์ค๋ ํ๊ณ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ๋ฉฐ, ์ ์ฐํ ์ ์ฝ ์ฒ๋ฆฌ์ ํ ์คํธ ์กฐ๊ฑด์ ํตํฉ์ผ๋ก ์ค๋ฌด์ ๊ฐ์น๊ฐ ๋๊ณ ๊ธฐ์ ์ ์ผ๋ก๋ ์ฐ์ํ ๊ธฐ์ฌ๋ฅผ ์ ์ํ๋ค.