iGibson 1.0: a Simulation Environment for Interactive Tasks in Large Realistic Scenes
์ ์: Bokui Shen, Fei Xia, Chengshu Li, Roberto Martรญn-Martรญn, Linxi Fan, Guanzhi Wang, Claudia Pรฉrez-D'Arpino, Shyamal Buch, Sanjana Srivastava, Lyne P. Tchapmi, Micael E. Tchapmi, Kent Vainio, Josiah Wong, Li Fei-Fei, Silvio Savarese | ๋ ์ง: 2020-12-05 | URL: https://arxiv.org/abs/2012.02924 📄 PDF
Essence
Fig. 1: Robot performs an interactive task in iGibson 1.0. It operates
iGibson 1.0์ 15๊ฐ์ ์์ ํ ์ํธ์์ฉ ๊ฐ๋ฅํ ํ์ค์ ์ค๋ด ์ฅ๋ฉด(108๊ฐ ๋ฐฉ)์ ํฌํจํ๋ ๋ก๋ด ์๋ฎฌ๋ ์ด์
ํ๊ฒฝ์ผ๋ก, ๋๊ท๋ชจ ์ฅ๋ฉด์์ ์กฐ์๊ณผ ๋ค๋น๊ฒ์ด์
์ ํฌํจํ ๋ํํ ์์
์ ํ์ตํ ์ ์๊ฒ ํ๋ค.
Motivation
- Known: ๊ธฐ์กด ๋ก๋ด ์๋ฎฌ๋ ์ด์
ํ๊ฒฝ๋ค(Gibson, Habitat, AI2Thor ๋ฑ)์ ์์ ๋ค๋น๊ฒ์ด์
์์
์๋ง ์ง์คํ๊ฑฐ๋ ๋จ์ํ๋ ์ํธ์์ฉ ๋ชจ๋๋ฅผ ์ ๊ณตํ์ฌ, ํ์ค์ ์ธ ๋๊ท๋ชจ ์ฅ๋ฉด์์ ์์ ํ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ์ํธ์์ฉ์ ์ง์ํ์ง ๋ชปํ๋ค.
- Gap: ์ค์ ๋ก๋ด์ด ์ํํด์ผ ํ๋ ๋ณต์กํ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ์กฐ์๊ณผ ๋ชจ๋ฐ์ผ ์กฐ์ ์์
์ ๋๊ท๋ชจ ํ์ค์ ๊ฐ์ ์ฉ ํ๊ฒฝ์์ ํ์ตํ ์ ์๋ ํตํฉ์ ์๋ฎฌ๋ ์ด์
ํ๋ซํผ์ด ๋ถ์ฌํ๋ค.
- Why: ํ์ค์ ์ธ ๋๊ท๋ชจ ํ๊ฒฝ์์์ ์๋ฎฌ๋ ์ด์
์ ๋ก๋ด์ ๊ฐ๊ฐ์ด๋ ์ ์ฑ
(sensorimotor policy)์ robustํ๊ฒ ํ์ตํ๊ณ ์ค์ ๋ก๋ด์ผ๋ก์ ์ ์ด(transfer)๋ฅผ ๊ฐ๋ฅํ๊ฒ ํ๋ฉฐ, ํจ์จ์ ์ธ ๋ชจ๋ฐฉ ํ์ต(imitation learning)์ ์ง์ํ๋ค.
- Approach: ์ค์ ์ธ๊ณ์ 3D ์ฌ๊ตฌ์ฑ์ ๊ธฐ๋ฐ์ผ๋ก 15๊ฐ์ ์ํธ์์ฉ ๊ฐ๋ฅํ ์ฅ๋ฉด์ ์์ฑํ๊ณ , Physics-Based Rendering(PBR), ๋๋ฉ์ธ ๋๋๋ง์ด์ ์ด์
, ํตํฉ๋ motion planner, ๊ทธ๋ฆฌ๊ณ ์ธ๊ฐ-๋ก๋ด ์ธํฐํ์ด์ค๋ฅผ ์ ๊ณตํ๋ค.
Achievement
Fig. 3: Fifteen interactive iGibson 1.0 scenes modelled after real-world reconstructions, preserving layout, distributio
- ์์ ์ํธ์์ฉ ํ๊ฒฝ: 15๊ฐ์ ์ค์ ๊ฐ์ ์ ๋ชจ๋ธ๋งํ ์ฅ๋ฉด์์ 108๊ฐ์ ๋ฐฉ๊ณผ 570๊ฐ์ ๊ฐ์ฒด๋ฅผ ํฌํจํ๋ฉฐ, ๋ชจ๋ ๊ฐ์ฒด๊ฐ ๋ฌผ๋ฆฌ ์์ง์ ํตํด ์์ ํ ์ํธ์์ฉ ๊ฐ๋ฅ
- ๊ณ ํ์ง ์ผ์ ์ ํธ: RGB, depth, segmentation, LiDAR, optical flow ๋ฑ์ ํฌํจํ ํ์ค์ ์ธ ๊ฐ์ ์ผ์ ์ ํธ ์์ฑ๊ณผ PBR์ ํตํ ๊ณ ์ถฉ์ง ๋ ๋๋ง
- ๋๋ฉ์ธ ๋๋๋ง์ด์ ์ด์
: ์ฌ๋ฃ์ ์๊ฐ์ ์์ฑ๊ณผ ๋ฌผ๋ฆฌ์ ์์ฑ, ๊ฐ์ฒด ํํ๋ฅผ ๋ณ๊ฒฝํ๋ฉด์ ์ํธ์์ฉ์ฑ์ ์ ์งํ๋ ๋ฉ์ปค๋์ฆ
- ๊ฐ๋ฐ ๋๊ตฌ: sampling-based motion planner์ ์ธ๊ฐ-๋ก๋ด ์ธํฐํ์ด์ค๋ฅผ ํตํ ํจ์จ์ ์ธ demonstration ์์ง ๋ฐ imitation learning ์ง์
- ํ์ฅ์ฑ: CubiCasa5K์ 3D-Front ๋ ์ด์์ ์ง์์ผ๋ก 12,000๊ฐ ์ด์์ ์ถ๊ฐ ์ํธ์์ฉ ๊ฐ๋ฅ ์ฅ๋ฉด ์ ๊ณต
- ์ค์ฆ์ ์ฑ๊ณผ: visual representation ํ์ต์ด downstream manipulation ์์
ํ๋ จ์ ๊ฐ์ํํ๊ณ , navigation agent์ ์ผ๋ฐํ ๋ฅ๋ ฅ ํฅ์ ์
์ฆ
How
Fig. 4: Robot interacting in iGibson 1.0 (large picture: 3rd person
- ์ค์ ์ธ๊ณ 3D ์ค์บ์ ์ ์ ๋ฉ์๋ฅผ ๋์ scene graph๋ก ๋ณํํ์ฌ articulated object model ํตํฉ
- ๊ฐ์ฒด ๋ชจ๋ธ์ ์ฌ๋ฃ ๋ฐ ๋์ญํ ์์ฑ์ ๋ํ ์ฃผ์ ๋ฌ๊ธฐ(metallic, roughness, normal maps)
- PyBullet ๋ฌผ๋ฆฌ ์์ง์ ํ์ฉํ ์์ ํ rigid body์ articulated body ์๋ฎฌ๋ ์ด์
- Physics-Based Rendering(PBR)์ ํตํด ์ฌ๋ฃ ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ๊ณ ํ์ง ์ด๋ฏธ์ง ์์ฑ
- Domain randomization: ๊ฐ์ฒด ๋ฐฐ์น์ ๋ถํฌ๋ฅผ ๋ณด์กดํ๋ฉด์ ์ฌ๋ฃ ์์ฑ๊ณผ ๊ฐ์ฒด ํํ ๋ณ๊ฒฝ
- Sampling-based motion planner(RRT ๊ธฐ๋ฐ)๋ฅผ ํตํ ์ถฉ๋ ์๋ ๊ถค์ ์์ฑ
- GUI ์ธํฐํ์ด์ค๋ฅผ ํตํ ์ธ๊ฐ ์ฌ์ฉ์์ ๋ํํ ์กฐ์์ผ๋ก demonstration ์์ง
Originality
- Gibson ์ด์ ๋ฒ์ ์ ์ ์ ํ๊ฒฝ๊ณผ ๋ฌ๋ฆฌ ์์ ํ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ์ํธ์์ฉ์ ์ง์ํ๋ ์ฒซ ๋๊ท๋ชจ ํ์ค์ ํ ํ๊ฒฝ ์๋ฎฌ๋ ์ดํฐ
- ์ค์ ๊ฐ์ ์ ๊ฐ์ฒด ๋ฐฐ์น ๋ถํฌ์ ๋ ์ด์์์ ๋ณด์กดํ๋ฉด์ ์์ ํ articulated object ์ํธ์์ฉ์ ๊ฐ๋ฅํ๊ฒ ํ ์
- ๋๋ฉ์ธ ๋๋๋ง์ด์ ์ด์
, high-fidelity ์ผ์ ์ ํธ, motion planner, ์ธ๊ฐ ์ธํฐํ์ด์ค๋ฅผ ํตํฉํ ํต์ผ๋ ํ๋ซํผ ์ ๊ณต
- Interactability๋ฅผ ๊ณ ๋ คํ ์๊ฐ ํํ ํ์ต์ด downstream ์์
์ฑ๋ฅ์ ํฅ์์ํจ๋ค๋ ์ค์ฆ์ ์ฆ๋ช
Limitation & Further Study
- 15๊ฐ์ ๊ธฐ๋ณธ ์ ๊ณต ์ฅ๋ฉด์ด ์ ํ์ ์ด๋ฉฐ, ํ์ฅ์ ์ํด ์ธ๋ถ ๋ฐ์ดํฐ์
(CubiCasa5K, 3D-Front)์ ์์กด
- ์ค์ ์ผ์์ ๋
ธ์ด์ฆ, ์ง์ฐ, ํ๋์จ์ด ํ๊ณ ๋ฑ์ ์์ ํ ์๋ฎฌ๋ ์ด์
ํ์ง ๋ชปํ ๊ฐ๋ฅ์ฑ
- ํ์ตํ ์ ์ฑ
์ ์ค์ ๋ก๋ด์ผ๋ก์ ์ฑ๊ณต์ ์ธ ์ ์ด(sim-to-real transfer)์ ๋ํ ์ค์ฆ ๊ฒฐ๊ณผ๊ฐ ์ ํ์
- ์ธ๊ฐ demonstration ์์ง์ ํธ์์ฑ์๋ ๋ถ๊ตฌํ๊ณ ๋๊ท๋ชจ demonstration ๋ฐ์ดํฐ์
๊ตฌ์ถ์ scalability ๋ฏธํก
- ํ์ ์ฐ๊ตฌ: (1) ๋ ๋ค์ํ ํ๊ฒฝ๊ณผ ์์
๋๋ฉ์ธ ์ถ๊ฐ, (2) sim-to-real transfer์ ์ฒด๊ณ์ ํ๊ฐ, (3) ๋ ๋ณต์กํ ๋ค์ค ์์ด์ ํธ ์ํธ์์ฉ ์๋๋ฆฌ์ค ์ง์
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: iGibson 1.0์ ๋๊ท๋ชจ ํ์ค์ ํ๊ฒฝ์์ ์์ ํ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ์ํธ์์ฉ์ ์ง์ํ๋ ํ๊ธฐ์ ์ธ ๋ก๋ด ์๋ฎฌ๋ ์ด์
ํ๋ซํผ์ผ๋ก, ์กฐ์, ๋ชจ๋ฐ์ผ ์กฐ์, ๋ค๋น๊ฒ์ด์
๋ฑ ๋ค์ํ embodied AI ์์
์ฐ๊ตฌ๋ฅผ ๊ฐ๋ฅํ๊ฒ ํ๋ค. ํ๋ถํ ๋๊ตฌ ์ง์๊ณผ ์คํ์์ค ๊ณต๊ฐ๋ฅผ ํตํด ๋ก๋ด๊ณตํ ์ปค๋ฎค๋ํฐ์ ํฐ ์ํฅ์ ๋ฏธ์น ๊ฒ์ผ๋ก ๊ธฐ๋๋๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์