์ ์: Xiang Shi, Jiawei Liu, Yinpeng Liu, Qikai Cheng, Wei Lu | ๋ ์ง: 2024 | DOI: N/A 📄 PDF
๊ทธ๋ฆผ 1: ์์ฐ ์ด๋ฏธ์ง์ ๊ณผํ ๋ ผ๋ฌธ ๊ทธ๋ฆผ์ ํ ์คํธ-์ด๋ฏธ์ง ์ ๋ ฌ ์์ ๋น๊ต. ๊ณผํ ๊ทธ๋ฆผ์ ํ ์คํธ-์ ๋ ฌ ์์ ์ ๊ฐ ๋ชจ๋ ์์๋ฅผ ํ์ฑํ๊ณ , ํ ์คํธ๋ฅผ ์ ๋ ฌํ๋ฉฐ, ์ ๋ ฌ๋์ง ์์ ์์๋ฅผ ์๋ณํ๋ ๊ฒ์ ์๊ตฌํจ.
๋ณธ ์ฐ๊ตฌ๋ ๊ณผํ ๋ ผ๋ฌธ์ ๊ทธ๋ฆผ์์ ํ ์คํธ์ ์๊ฐ ์์์ ์ธ๋ฐํ ์ ๋ ฌ์ ์ํ ์๋ก์ด ์์ ์ธ "Figure Integrity Verification"์ ์ ์ํ๋ฉฐ, ์ด๋ฅผ ์ง์ํ๊ธฐ ์ํด Figure-seg ๋ฐ์ดํฐ์ ๊ณผ Every Part Matters (EPM) ํ๋ ์์ํฌ๋ฅผ ๊ฐ๋ฐํ๋ค. ์ด๋ ๋ณต์กํ ๋๋ฉ์ธ-ํนํ ๊ณผํ ๊ทธ๋ฆผ์ ์ดํด์ ๊ฒ์ฆ์ ํฌ๊ฒ ๊ฐ์ ํ๋ค.
๊ทธ๋ฆผ 2: ๊ณผํ ๊ทธ๋ฆผ ์ธ๋ฐํ ์ ๋ ฌ์ ์ํ ๋ฐ์ดํฐ์ ๊ตฌ์ถ ํ๋ก์ธ์ค ๊ฐ์.
๊ทธ๋ฆผ 4: ๋ฌด๊ฒฐ์ฑ ๊ฒ์ฆ ์์ ๊ตฌํ์ ์ํ ์ ์ฒด ํ๋ ์์ํฌ. (a)๋ ๋ ๊ฐ์ง ํ๊ฐ ๊ธฐ์ค์ ๋ณด์ฌ์ค.
๊ทธ๋ฆผ 5: Chain-of-Attribute (CoA) ์ถ๋ก ํ๋ก์ธ์ค์ ์์ธ ์ค๋ช .
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ๊ณผํ ๊ทธ๋ฆผ์ ์ธ๋ฐํ ํ ์คํธ-์ ๋ ฌ ๋ถ์์ด๋ผ๋ ๋ฏธ์ถฉ์กฑ ์ฐ๊ตฌ ๊ณต๋ฐฑ์ ๋ช ํํ๊ฒ ์ ์ํ๊ณ , ์๋ก์ด ์์ , ๊ณ ํ์ง ๋ฐ์ดํฐ์ , ํจ๊ณผ์ ์ธ MLLM ํ๋ ์์ํฌ๋ฅผ ํตํด ์ฒด๊ณ์ ์ผ๋ก ํด๊ฒฐํจ์ผ๋ก์จ ๋ฉํฐ๋ชจ๋ฌ ์ดํด ๋ถ์ผ์ ์ค์ง์ ์ธ ๊ธฐ์ฌ๋ฅผ ์ ๊ณตํ๋ค. ๋ค๋ง ๋๋ฉ์ธ-ํนํ ์ ์์ฑ๊ณผ ๊ณ์ฐ ํจ์จ์ฑ ๊ฐ์ ์ด ์ค์ ์์ฉ์ ๊ด๊ฑด์ด ๋ ๊ฒ์ด๋ค.