์ ์: Wenhao Yu, Nimrod Gileadi, Chuyuan Fu, Sean Kirmani, Kuang-Huei Lee, Montse Gonzalez Arenas, Hao-Tien Lewis Chiang, Tom Erez, Leonard Hasenclever, Jan Humplik, Brian Ichter, Ted Xiao, Peng Xu, Andy Zeng, Tingnan Zhang, Nicolas Heess, Dorsa Sadigh, Jie Tan, Yuval Tassa, Fei Xia | ๋ ์ง: 2023-06-14 | URL: https://arxiv.org/abs/2306.08647 📄 PDF
Figure 1: LLMs have some internal knowledge about robot motions, but cannot directly translate them into actions
LLM์ ์ด์ฉํ์ฌ ์์ฐ์ด ๋ช ๋ น์ ๋ณด์ ํจ์๋ก ๋ณํํ๊ณ , ์ค์๊ฐ ์ต์ ํ๊ธฐ(MuJoCo MPC)๋ก ๋ก๋ด ํ๋์ ํฉ์ฑํ๋ ์๋ก์ด ํจ๋ฌ๋ค์์ ์ ์ํ๋ค.
Figure 4: Comparison of our method and alternative methods in terms of pass rate: if we generate N pieces of code
Figure 2: Detailed dataflow of the Reward Translator. A Motion Descriptor LLM takes the user input and describe
์ดํ: ์ด ๋ ผ๋ฌธ์ LLM์ ๋ณด์ ํจ์ ์์ฑ๊ธฐ๋ก ํ์ฉํ์ฌ ์์ฐ์ธ์ด์ ์ ์์ค ๋ก๋ด ๋์ ์ฌ์ด์ ๊ฐ๊ทน์ ํจ๊ณผ์ ์ผ๋ก ํด์ํ๋ ํ์ ์ ์ธ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค. ๊ฐ๋ ฅํ ์คํ ๊ฒฐ๊ณผ์ ์ค์ ๋ก๋ด ๊ฒ์ฆ์ ํตํด ๋ฐฉ๋ฒ๋ก ์ ํ๋น์ฑ์ ์ ์ฆํ๋ฉฐ, ๋ก๋ด ์ ์ด์์ LLM ํ์ฉ์ ์๋ก์ด ๋ฐฉํฅ์ ์ ์ํ๋ค.