์ ์: Wenlong Huang, Fei Xia, Ted Xiao, Harris Chan, Jacky Liang, Pete Florence, Andy Zeng, Jonathan Tompson, Igor Mordatch, Yevgen Chebotar, Pierre Sermanet, Noah Brown, Tomas Jackson, Linda Luu, Sergey Levine, Karol Hausman, Brian Ichter | ๋ ์ง: 2022-07-12 | URL: https://arxiv.org/abs/2207.05608 📄 PDF
Figure 1: Inner Monologue enables grounded closed-loop feedback for robot planning with large language models
LLM์ ๋ก๋ด ์ ์ด์ ํ์ฉํ ๋, ํ๊ฒฝ ํผ๋๋ฐฑ์ ์์ฐ์ด๋ก ์ฃผ์ ํ์ฌ LLM์ด '๋ด์ ๋ ๋ฐฑ(inner monologue)'์ ํ์ฑํ๊ฒ ํจ์ผ๋ก์จ ํ๋ฃจํ ๊ณํ ๋ฐ ์ถ๋ก ์ ๊ฐ๋ฅํ๊ฒ ํ๋ค. ์ถ๊ฐ ํ์ต ์์ด ํ๋กฌํํ ๋ง์ผ๋ก ๋ณต์กํ ์ฅ๊ธฐ ์กฐ์ ์์ ์ ์ํํ ์ ์์์ ๋ณด์ฌ์ค๋ค.
Figure 3: Different instantiations of Inner Monologue in three distinct domains โ simulated tabletop rearrangement (top)
Figure 2: Various types of textual feedback. Success Detection gives task-specific task completion information, Passive
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋ก๋ด ๊ณํ์ ํ๋ฃจํ ํผ๋๋ฐฑ์ ์์ฐ์ด๋ก ํตํฉํ๋ ์ฐฝ์์ ์ด๊ณ ์ค์ฉ์ ์ธ ์ ๊ทผ์ ์ ์ํ๋ฉฐ, ์ถ๊ฐ ํ์ต ์์ด๋ ๋ณต์กํ ์ค์ ์์ ์ ์ํ ๊ฐ๋ฅํจ์ ๋ค์์ ์คํ์ผ๋ก ์ ์ฆํ๋ค. ๋ค๋ง perception ํผ๋๋ฐฑ์ ํ์ง ์์กด์ฑ๊ณผ LLM์ ๊ณ ๋น์ฉยท์ง์ฐ ๋ฌธ์ ๊ฐ ์ถํ ๊ฐ์ ๊ณผ์ ์ด๋ค.