์ ์: Boxiao Pan, Adam W. Harley, C. Karen Liu, Leonidas J. Guibas | ๋ ์ง: 2025-08-20 | URL: https://arxiv.org/abs/2508.14466 📄 PDF
Figure 1. Problem formulation. Given a posed egocentric video (black-outlined frustums, with frames shown in detail on t
Project Aria ์๊ฒฝ์ ์ด์ฉํ ๋ฐ์ดํฐ ์์ง ํ์ดํ๋ผ์ธ๊ณผ ํจ๊ป, ๋์ ์ฅ์ ๋ฌผ์ด ์๋ ์ค์ ํ๊ฒฝ์์ egocentric ๋น๋์ค๋ก๋ถํฐ ๋ฏธ๋์ 6D ํค๋ ํฌ์ฆ(์์น ๋ฐ ํ์ )๋ฅผ ์์ธกํ๋ LookOut ๋ชจ๋ธ์ ์ ์ํ๋ค.
Figure 2. LookOut architecture. Given a posed egocentric video, we obtain frame-wise DINO features with the pre-trained
Figure 2. LookOut architecture. Given a posed egocentric video, we obtain frame-wise DINO features with the pre-trained
์ดํ: ์ธ๊ฐํ egocentric ๋ค๋น๊ฒ์ด์ ์ ๋์ ํ๊ฒฝ ์ฒ๋ฆฌ, ๋ฅ๋์ ์ ๋ณด ์์ง ๋ชจ๋ธ๋ง, ๊ทธ๋ฆฌ๊ณ ์ค์ฉ์ ๋ฐ์ดํฐ ์์ง ํ์ดํ๋ผ์ธ์ ์ข ํฉ์ ์ผ๋ก ํด๊ฒฐํ ํฌ๊ด์ ๊ธฐ์ฌ๋ก, Project Aria๋ฅผ ํ์ฉํ ํ์ ์ ๋ฐ์ดํฐ ์์ง ๋ฐฉ์๊ณผ ํ์ค์ฑ ๋์ 4์๊ฐ AND ๋ฐ์ดํฐ์ ์ด ํฅํ ์ฐ๊ตฌ์ ํฐ ์ํฅ์ ๋ฏธ์น ๊ฒ์ผ๋ก ๊ธฐ๋๋๋ค.