์ ์: Alexander Robey, Zachary Ravichandran, Vijay Kumar, Hamed Hassani, George J. Pappas | ๋ ์ง: 2024-10-17 | URL: https://arxiv.org/abs/2410.13691 📄 PDF
Figure 1: Jailbreaking LLM-controlled robots.
LLM ๊ธฐ๋ฐ ๋ก๋ด ์ ์ด ์์คํ ์ ๋ณด์ ์ทจ์ฝ์ ์ ์กฐ์ฌํ๊ธฐ ์ํด RoboPAIR ์๊ณ ๋ฆฌ์ฆ์ ์ ์ํ๋ฉฐ, ์ด๋ ์ฑํ ๋ด jailbreak์ ๋ฌ๋ฆฌ ์ค์ ๋ฌผ๋ฆฌ์ ํด๋ก์ด ํ๋์ ์ ๋ํ๋ ์ต์ด์ ๊ณต๊ฒฉ ๋ฐฉ์์ด๋ค.
Figure 3: Jailbreaking elicits harmful robotic actions. When directly prompted, LLM-controlled
Figure 4: Jailbreaking the Unitree Go2.
์ดํ: ๋ณธ ์ฐ๊ตฌ๋ LLM ์ ์ด ๋ก๋ด์ ๋ฌผ๋ฆฌ์ ์์ ์ฑ ์ํ์ ์ต์ด๋ก ์ฒด๊ณ์ ์ผ๋ก ์ ์ฆํ ์ค์ํ ๋ณด์ ์ฐ๊ตฌ๋ก, ์ค์ ๋ฐฐํฌ๋ ์์ฉ ๋ก๋ด์ ๋ํ jailbreak ์ฑ๊ณต์ AI ์์ ๋ถ์ผ์์ ํ๊ธฐ์ ์ธ ๋ฐ๊ฒฌ์ด๋ค. ๋ค๋ง ๋ฐฉ์ด ๋ฉ์ปค๋์ฆ์ ๋ํ ๊ตฌ์ฒด์ ์ ์์ ํ์ ์ฐ๊ตฌ๋ก ๋จ๊ฒจ์ ธ ์์ด ์ค์ ๋ฐฐํฌ ํ๊ฒฝ์์์ ์์ ํ ๋ฐฉ์ด ์ฑ ์์ ์ฐ์ ์ฒด์ ์ ๊ฐ๋๋ ์ธก๋ฉด์ด ์๋ค.