์ ์: Andrew Hundt, William Agnew, Vicky Zeng, Severin Kacianka, Matthew Gombolay | ๋ ์ง: 2022-07-23 | URL: https://arxiv.org/abs/2207.11569 📄 PDF
Fig. 1. An example trial showing harmful robot behavior that is, in aggregate, racially stratified like White supremacis
๋ณธ ๋ ผ๋ฌธ์ CLIP ๊ฐ์ ๋๊ท๋ชจ ๊ธฐ์ด ๋ชจ๋ธ์ ํ์ฉํ๋ ๋ก๋ด ์กฐ์ ์์คํ ์ด ์ค์ ๋ฌผ๋ฆฌ์ ํ๊ฒฝ์์ ์ธ์ข , ์ฑ๋ณ ๊ณ ์ ๊ด๋ ๊ณผ ๊ณผํ์ ์ผ๋ก ์ ์ฆ๋์ง ์์ ๊ณจ์ํ์ ์ฒด๊ณ์ ์ผ๋ก ์ฌํํ๋ ๊ฒ์ ์ฒ์์ผ๋ก ์ค์ฆ์ ์ผ๋ก ์ ์ฆํ๋ค.
Fig. 1. An example trial showing harmful robot behavior that is, in aggregate, racially stratified like White supremacis
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ๋ก๋ด๊ณตํ์์ ๊ธฐ์ด ๋ชจ๋ธ์ ํธํฅ์ด ๋ฌผ๋ฆฌ์ ์ธ๊ณ์์ ์ค์ ๋ก ์ฌํ๋๋ ํ์์ ์ฒ์์ผ๋ก ์ค์ฆ์ ์ผ๋ก ์ ์ฆํ๋ฉฐ, ๋ก๋ด ์์จ์ฑ์ ์ํ์ฑ์ ๊ฐ์กฐํ๋ ์ค์ํ ๊ธฐ์ฌ๋ค. ํ์ ๊ฐ ์ ๊ทผ๊ณผ ๋ช ํํ ์ ์ฑ ์ ์ธ์ผ๋ก ๋ก๋ด๊ณตํ ๊ณต๋์ฒด์ ์ฐ์ ์ ํ๋ ๋ณํ๋ฅผ ์ด๊ตฌํ๋ ์๋ฏธ ์๋ ์์ ์ด๋ค.