์ ์: Jiaxin Lu, Chun-Hao Paul Huang, Uttaran Bhattacharya, Qixing Huang, Yi Zhou | ๋ ์ง: 2025-04-14 | URL: https://arxiv.org/abs/2504.10414 📄 PDF
Figure 1. Overview of the HUMOTO dataset. The dataset contains mocap 4D human-object interaction animations with multipl
HUMOTO๋ 735๊ฐ ์ํ์ค(7,875์ด)์ ๊ณ ์ถฉ์ค๋ ๋ชจ์ ์บก์ฒ 4D ์ธ๊ฐ-๊ฐ์ฒด ์ํธ์์ฉ ๋ฐ์ดํฐ์ ์ผ๋ก, 63๊ฐ์ ์ ๋ฐ ๋ชจ๋ธ๋ง ๊ฐ์ฒด์ ์์ธํ ์ ๋์์ ํฌํจํ๋ฉฐ LLM ๊ธฐ๋ฐ ์คํฌ๋ฆฝํ ๊ณผ ๋ค์ค์ผ์ ์บก์ฒ๋ก ๋ณต์กํ ๋ค์ค-๊ฐ์ฒด ์ํธ์์ฉ์ ์ ํํ ๊ธฐ๋กํ๋ค.
Figure 1. Overview of the HUMOTO dataset. The dataset contains mocap 4D human-object interaction animations with multipl
Figure 2. Scene-Driven LLM Scripting. We established target
์ดํ: HUMOTO๋ ๊ณ ์ถฉ์ค๋ ๋ค์ค-๊ฐ์ฒด ์ธ๊ฐ-๊ฐ์ฒด ์ํธ์์ฉ ๋ฐ์ดํฐ์ ์ผ๋ก์, Scene-Driven LLM Scripting๊ณผ ๋ค์ค์ผ์ ์บก์ฒ ๊ธฐ์ ์ ์ฐฝ์์ ๊ฒฐํฉ์ ํตํด ๊ธฐ์กด ๋ฐ์ดํฐ์ ์ ํ๊ณ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ์์ผ๋ฉฐ, ์ ๋์ ํ๊ฐ ๋ฉํธ๋ฆญ ๋์ ์ผ๋ก HOI ๋ฐ์ดํฐ์ ๋ถ์ผ์ ๊ธฐ์ฌํ ๊ฐ์น ์๋ ์์ฐ์ด๋ค.