Essence
Figure 1: The main architecture of the survey: domain gap taxonomy, overarching insights on methodologies, and future tr
๊ตฌํ ๋ก๋ด(embodied agents)์ ์ํ ํฌ๋ก์ค ๋๋ฉ์ธ ์ ์ฑ
์ ์ด(cross-domain policy transfer) ๋ฐฉ๋ฒ๋ค์ ์ฒด๊ณ์ ์ผ๋ก ๊ฒํ ํ ์ข
ํฉ ์๋ฒ ์ด. ์๋ฎฌ๋ ์ด์
, ์คํ์ค ๋ฑ ์ ๋น์ฉ ์์ค ๋๋ฉ์ธ์ ๋ฐ์ดํฐ๋ฅผ ์ค์ ํ๊ฒฝ(ํ๊ฒ ๋๋ฉ์ธ)์ ํจ๊ณผ์ ์ผ๋ก ์ ์ดํ๋ ๊ธฐ์ ๋ค์ ๋ถ๋ฅ ๋ฐ ๋ถ์.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ์ด ์๋ฒ ์ด๋ ํฌ๋ก์ค ๋๋ฉ์ธ ์ ์ฑ
์ ์ด ๋ถ์ผ์ ์ฒซ ์ฒด๊ณ์ ๊ฒํ ๋ก์, ๋ถ์ฐ๋ ์ฐ๊ตฌ๋ค์ ํตํฉํ๊ณ ๋๋ฉ์ธ ๊ฐญ์ ๋ช
ํํ ๋ถ๋ฅํ์ฌ ํด๋น ๋ถ์ผ์ ์ค์ํ ๊ธฐ์ด ์๋ฃ๋ฅผ ์ ๊ณตํ๋ค. ๋ก๋ด ํ์ต๊ณผ ๊ตฌํ AI์ ์ค์ธ๊ณ ๋ฐฐํฌ๋ฅผ ์ํ ํ์์ ์ธ ๊ธฐ์ ์์ญ์ ํฌ๊ด์ ์ผ๋ก ์ ๋ฆฌํ์ฌ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ์ ์ ์ํ๋ ๊ฐ์น ์๋ ๊ธฐ์ฌ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
ํฌ๋ก์ค ๋๋ฉ์ธ ์ ์ฑ
์ ์ด๋ฅผ ์ํ ๊ธฐ๊ณ์ ํด์๊ฐ๋ฅ์ฑ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ก ์ ์ ๊ณตํ๋ ๊ธฐ์ด ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM๊ธฐ๋ฐ ์์ด์ ํธ์ ์ํํธ์จ์ด/์๋ฎฌ๋ ์ด์
์๋ํ ์ฐ๊ตฌ๋ฅผ ๋ค๋ฃจ๋ฉฐ, cross-domain transfer์ ์ํํธ์จ์ด์ ํ์ฅ์ ๋ํ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ตฌํํ ์์ด์ ํธ์ ๋๋ฉ์ธ ์ ์ด ๋ฐ ์ค์ ํ๊ฒฝ ์ ์ฉ ๋ฐฉ๋ฒ(์๋ฎฌ-์คํ์ค-ํ์ฅ)์ ์ด๋ก ยท๋ถ๋ฅ๊ฐ ์๋ฃ ๋ถ์ผ์ LLM ์์ด์ ํธ ์ค์ฉ์ฑ ๋
ผ์์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํจ.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ตฌํํ ๋ก๋ด ์์ด์ ํธ์ ์ ์ฑ
์ ์ด ๋ฐ ์ค์ ํ๊ฒฝ ์ ์ฉ์ ๊ดํ ์ด๋ก ยท๋ถ๋ฅ๋ฅผ ์ ๊ณตํด 010์ ๊ณ์ธต์ ์ ์ด ํ๋ ์์ํฌ์ ์ด๋ก ์ ๊ธฐ๋ฐ์.
๊ธฐ๋ฐ ์ฐ๊ตฌ
003๋ฒ ๋
ผ๋ฌธ์ ๋ค์ํ ๋๋ฉ์ธ์์์ ์ ์ฑ
์ ์ด์ ์์ด์ ํธ ์ ์ฉ์ ์ข
ํฉ์ ์ผ๋ก ์ ๋ฆฌํ์์ผ๋ฏ๋ก, 793๋ฒ ์ฌ์ฉ์ ๊ธฐ๋ฐ ์์ด์ ํธ ์ฑํ ๋ถ์์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
003์ AI ๊ธฐ๋ฐ ๊ณผํ ์ฐ๊ตฌ์์ ๊ต์ฐจ ๋๋ฉ์ธ ์ค์ผ์คํธ๋ ์ด์
์ ์ฑ
์๋ฆฝ ๋ฐ ์ ์ด ํ์ต ์ฌ๋ก๋ฅผ ์ข
ํฉ์ ์ผ๋ก ๊ฒํ ํด, 354์ ๋ณ๋ ฌ ์ฒ๋ฆฌ์ ์ ๋ชฉํด ์ฝ์ ๋งํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ตฌํ ๋ก๋ด์ ์ํ ๋๋ฉ์ธ ์ ์ ๋ฐ ์ ์ฑ
์ ์ด ๋ฐฉ๋ฒ์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์คํ ์๋ํ ์ ์ฑ
์ ์ด ๋ฐ ๋ค์ค ๋๋ฉ์ธ ์ต์ ํ์ ๋ํ ์๋ฒ ์ด๋ก, ๋ชฉํ์งํฅ์ ๋ฐ์ดํฐ ์์ง ๋ฐ ์ต์ ํ ์ ๋ต๊ณผ ๊ด๋ จ์ด ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ตฌํ ์์ด์ ํธ์ ๋๋ฉ์ธ ์ ์ด ์ ์ฑ
์๋ฒ ์ด์ ๋ค๊ตญ์ด ์น ์์ด์ ํธ ํ๊ฐ ๋ฒค์น๋งํฌ๋ ์์ด์ ํธ์ ๋ฒ์ฉ์ฑ๊ณผ ํ์ฅ์ฑ ์ธก๋ฉด์์ ์ํธ๋ณด์์ ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฎฌ๋ ์ด์
์์ ์ค์ ํ๊ฒฝ์ผ๋ก์ ์ ์ฑ
์ ์ด ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ์์จ ์์ด์ ํธ์ ์ค๊ณ์ ํ๊ฐ๋ฅผ ๋ค๋ฃจ๋ฉฐ, embodied agent์์ LLM์ ํตํ ์ ์ฑ
์ ์ด์ ์ต์ ๋ํฅ๊ณผ ์๋์ง๋ฅผ ๋ณด์์ ์ผ๋ก ๋ณด์ฌ์ค.
ํ์ ์ฐ๊ตฌ
ํฌ๋ก์ค ๋๋ฉ์ธ ์ ์ฑ
์ ์ด์ ํน์ ์ธก๋ฉด์ ํ์ฅํ์ฌ ๋ค๋ฃจ๋ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
LLM ์์ด์ ํธ์ ์์จ์ ์ ๋ณด ํ์ ๋ฐ ์คํํ๊ฒฝ ์ ์ ์ฌ๋ก๋ฅผ ๊ณต์ ํ์ฌ, ๊ตฌํ ๋ก๋ด ๋ฐ ์์ด์ ํธ์ ๊ต์ฐจ๋๋ฉ์ธ ์ ์ด ํ์ฅ์ ์ฐธ๊ณ ํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ๊ณผํ ์์ด์ ํธ์ ์ ๋ขฐ์ฑ, ํ๊ฐ, ์ํ๊ด๋ฆฌ ๋ฑ cross-domain policy transfer์ ์ค์ ์ ์ฉ ์ ๊ณ ๋ ค์ ๊ณผ ํ๊ฐ ๋ฐฉ๋ฒ์ ๋ํด ์ฌ๋ ์๊ฒ ๋ค๋ฃฌ๋ค.
์์ฉ ์ฌ๋ก
๋ค์ค ์์ด์ ํธ์ ๊ฒฝํ์ถ์ ๋ฐ ์ ์ฑ
์ ์ดํ์ต ํ๋ ์์ํฌ๊ฐ ๋ก๋ด ๊ตฌํ ๋ฑ ํ ๋๋ฉ์ธ์ผ๋ก ๋ค์ํ๊ฒ ์ ์ฉ ๊ฐ๋ฅํฉ๋๋ค.
์์ฉ ์ฌ๋ก
๊ฐํํ์ต๊ณผ ์๋ฎฌ๋ ์ด์
-์คํ ๊ฐ ์ ์ฑ
์ ์ด ์ฐ๊ตฌ์ ์ค์ ๋ฌผ๋ฆฌยท๋ก๋ณดํฑ์ค ์ ์ฉ ์ฌ๋ก๋ก, embodied agents์ ์คํ๊ฒฝ(์๋ฎฌโ๋ฆฌ์ผ) ์ ์ด๋ฅผ ์ดํดํ ์ ์์ต๋๋ค.
์์ฉ ์ฌ๋ก
A comprehensive survey of cross-domain policy transfer ๋
ผ๋ฌธ์ ์๋ํ๋ ๊ณผํ ๊ณต์ ๋ฐ ์ต์ ํ ๋ฐ๊ฒฌ ํ๋ ์์ํฌ์ ์ค์ ๋ค๋ถ์ผ ์์ฉ ๊ฐ๋ฅ์ฑ์ ๋๋ฌ๋
๋๋ค.
์์ฉ ์ฌ๋ก
์์จ ์คํ์ค์์ ์์ด์ ํธ ๊ธฐ๋ฐ ์ ์ฑ
์ ์ด๋ฅผ ์ค์ workflow์ ์ ์ฉํ๋ ์์๋ก ํฌ๋ก์ค๋๋ฉ์ธ ์ด์์ ๊ตฌํ ๋ฐฉ๋ฒ์ ํ์ธํ ์ ์๋ค.