์ ์: Almir Aljoviฤ, Zuwan Lin, Wenbo Wang, Xinhe Zhang, Arnau Marin-Llobet | ๋ ์ง: 2025 | DOI: 10.1101/2025.05.15.653585 📄 PDF
๊ทธ๋ฆผ 1: BehaveAgent ์ํคํ ์ฒ. (a) ํ์ฌ ํ๋ ๋ถ์ ๋ฐฉ๋ฒ๋ก ๊ณผ (b) BehaveAgent์ ์๋ํ๋ ์ํฌํ๋ก์ฐ ๋น๊ต
๋ฉํฐ๋ชจ๋ฌ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)๊ณผ ๋น์ -์ธ์ด ๋ชจ๋ธ(VLM)์ ํตํฉํ ์์จ AI ์์ด์ ํธ BehaveAgent๋ ์ฌํ์ต์ด๋ ์๋ ๊ฐ์ ์์ด ๋น๋์ค์์ ๋๋ฌผ ํ๋์ ๋ณดํธ์ ์ผ๋ก ๋ถ์ํ ์ ์๋ค. ์๋ฌผ๋ถํฐ ์ธ๊ฐ๊น์ง ๋ค์ํ ์ข ๊ณผ ์คํ ํจ๋ฌ๋ค์์์ ์ ๋ก์ท(zero-shot) ์๊ฐ ์ถ๋ก ์ ํตํด ํ๋ ๋ถ์์ ์๋ํํ๋ค.
๊ทธ๋ฆผ 2: ์ ๋ก์ท ํ๋ ํจ๋ฌ๋ค์ ๊ฐ์ง ๋ฐ ๋ชฉํ ์ค์ . BehaveAgent๊ฐ ์์ฑ๋ ๋น๋์ค์์ ์๋์ผ๋ก ํ๋ ์ ํ์ ์ธ์ํ๊ณ ๋ง์ถคํ ๋ถ์ ๋ชฉํ๋ฅผ ์ค์ ํจ
๊ทธ๋ฆผ 3: ๋ชฉํ ์งํฅ์ ํผ์ฒ ๊ฐ์ง ๋ฐ ์ถ๋ก ๊ธฐ๋ฐ ์ถ์
๊ทธ๋ฆผ 4: ๋น๋์ค ๊ฐ์ฒด ๋ถํ ๋ฐ VLM ์๋ด ์๋ฏธ๋ก ์ ๋ผ๋ฒจ๋ง์ ํตํ ํผ์ฒ ํด๋ฌ์คํฐ๋ง
๊ทธ๋ฆผ 5: ๋งฅ๋ฝ ์ธ์ ํ๋ ์๊ฐ์ ๋ถํ
์ดํ: BehaveAgent๋ ๋ฉํฐ๋ชจ๋ฌ LLM ๊ธฐ๋ฐ ์์จ ์์ด์ ํธ๋ก์ ํ๋ ๋ถ์ ๋ถ์ผ์ ํ์ ์ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ฉฐ ์ข ๊ฐ ๋ณดํธ์ ์ผ๋ฐํ ๋ฅ๋ ฅ์ด ๋ฐ์ด๋๋, ์ค์ ํ๋ ๋น๋์ค ๋ฐ์ดํฐ์ ๋ํ ๊ด๋ฒ์ํ ์ ๋์ ๊ฒ์ฆ๊ณผ ์ฑ๋ฅ ๋ฒค์น๋งํน์ด ํ์ํ๋ค.