์ ์: Murtaza Dalal, Tarun Chiruvolu, Devendra Chaplot, Ruslan Salakhutdinov | ๋ ์ง: 2024-05-02 | URL: https://arxiv.org/abs/2405.01534 📄 PDF
Figure 2: Method overview. PSL decomposes tasks into a list of regions and stage termination conditions
Plan-Seq-Learn (PSL)์ LLM์ ๊ณ ์์ค ๊ณํ, motion planning์ ์ํ์ฑ, RL์ ์ ์์ค ์ ์ด ํ์ต์ ํตํฉํ์ฌ ์ฌ์ ์ ์๋ ์คํฌ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์์ด ์ฅ์๊ฐ ๋ก๋ด ์์ ์ ํด๊ฒฐํ๋ค.
Figure 3: Sample Efficiency Results. We plot task success rate as a function of the number of trials. PSL
Figure 2: Method overview. PSL decomposes tasks into a list of regions and stage termination conditions
์ดํ: PSL์ LLM, motion planning, RL์ ์ํธ ๋ณด์์ ๊ฐ์ ์ ์ฐฝ์์ ์ผ๋ก ํตํฉํ์ฌ ์ฌ์ ์ ์๋ ์คํฌ ์์ด ์ฅ์๊ฐ ๋ก๋ด ์์ ์ ํจ์จ์ ์ผ๋ก ํด๊ฒฐํ๋ ์ค์ง์ ์ด๊ณ ๊ฐ๋ ฅํ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค. ๊ด๋ฒ์ํ ์คํ๊ณผ ๋ช ํํ ์ค๋ช ์ผ๋ก ๋์ ๊ฐ์น์ ๊ธฐ์ฌ๋ฅผ ์ ์ฆํ๋ค.