์ ์: Yibo Yan, Shen Wang, Jiahao Huo, Jingheng Ye, Zhendong Chu, Xuming Hu, Philip S. Yu, Carla Gomes, Bart Selman, Qingsong Wen | ๋ ์ง: 2025 | DOI: 10.48550/arXiv.2502.02871 📄 PDF
Essence
๋ณธ ๋
ผ๋ฌธ์ ๋ฉํฐ๋ชจ๋ฌ ๋ํ ์ธ์ด ๋ชจ๋ธ(MLLM)์ด ์ํ, ๋ฌผ๋ฆฌํ, ํํ, ์๋ฌผํ ๋ฑ ๋ค์ํ ๊ณผํ ๋ถ์ผ์์ ๊ณผํ์ ์ถ๋ก (Scientific Reasoning)์ ํ๊ธฐ์ ์ผ๋ก ํฅ์์ํฌ ์ ์๋ค๋ ์
์ฅ์ ์ ์ํ๋ ์์น ๋
ผ๋ฌธ(Position Paper)์ด๋ค. ์ ์๋ค์ MLLM์ ํ
์คํธ, ์ด๋ฏธ์ง, ๊ธฐํ ๋ชจ๋ฌ๋ฆฌํฐ ํตํฉ ๋ฅ๋ ฅ์ด ํ์ฌ ๊ณผํ ์ถ๋ก ๋ชจ๋ธ์ ๋๋ฉ์ธ ๊ฐ ์ผ๋ฐํ ๋ถ์กฑ๊ณผ ๋ฉํฐ๋ชจ๋ฌ ์ธ์ง ํ๊ณ๋ฅผ ๊ทน๋ณตํ ์ ์๋ค๊ณ ์ฃผ์ฅํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ MLLM์ ๊ณผํ์ ์ถ๋ก ์์ฉ์ ๋ํ ํฌ๊ด์ ์ธ ์์น๋ฅผ ์ ์ํ๋ ์ ๋์ ์ฐ๊ตฌ๋ก, 4๋จ๊ณ ๋ก๋๋งต๊ณผ ๋ฉํฐ๋ชจ๋ฌ ๊ณผํ ๋ฐ์ดํฐ ๋ถ์์ ํตํด ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ์ ์ ์ํ๋ ๊ฒ์ด ๊ฐ์ ์ด๋ค. ๋ค๋ง ์์น ๋
ผ๋ฌธ์ ํน์ฑ์ ๊ตฌ์ฒด์ ์ค์ฆ๊ณผ ๊ธฐ์ ์ ๊น์ด๊ฐ ์ ํ์ ์ด๋ฏ๋ก, ํ์ ๋
ผ๋ฌธ๋ค์์ ๊ฐ ๋จ๊ณ๋ณยท๋๋ฉ์ธ๋ณ ๊ตฌ์ฒด์ ๊ตฌํ๊ณผ ๋ฒค์น๋งํน์ด ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ฉํฐ๋ชจ๋ฌ ๋ํ ์ธ์ด๋ชจ๋ธ(Gemini)์ ๊ตฌ์กฐ์ ์ฑ๋ฅ ๋ฐ ์ฌ๋ฌ ๊ณผํ ๋ถ์ผ์์์ ํ์ฉ ์ฌ๋ก๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ์ค๋ช
ํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ LLM์ ๋ํฅ๊ณผ ์ค์ ์์ฉ์ ๋ํ ์๋ฒ ์ด๋ก, ๋ณธ ๋
ผ๋ฌธ์ด ๋ค๋ฃจ๋ ๋ฉํฐ๋ชจ๋ฌ LLM ์ถ๋ก ์ ์ด๋ก ์ ๊ทผ๊ฑฐ๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
627๋ฒ์ ๋ฉํฐ๋ชจ๋ฌ LLM ๊ธฐ๋ฐ ๊ณผํ ์ถ๋ก ์ผ๋ฐํ๋ฅผ ์ฃผ์ฅํ๊ณ , 660๋ฒ์ ๋์ ์ธ๊ณผ์ฐ๊ตฌ ํ์ดํ๋ผ์ธ ์ ์ฒด๋ฅผ ์๋ํํ ์ค์ ํ๋ ์์ํฌ๋ก ๊ตฌ์ฒดํ์ํจ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ํ ์์ค ๊ณผํ ๋ฌธ์ ํด๊ฒฐ์ ์ํ ๋ฉํฐ๋ชจ๋ฌ LLM ๋ฒค์น๋งํฌ๋ก, ๋ค์ํ ๋๊ตฌ์ ํ๊ฐ ๋ฐฉ์์ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ค์ค ๋ชจ๋ฌ ๊ณผํ์ ์ถ๋ก ๋ฅ๋ ฅ์ ํ๊ฐํ๋ ๋ฐ์ดํฐ์
๊ณผ ๋ฒค์น๋งํฌ๋ฅผ ์ ๊ณตํ์ฌ ์ด ๋
ผ๋ฌธ์ ์ฃผ์ฅ์ ์ค์ฆ์ ์ผ๋ก ํ
์คํธํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
614๋ฒ์ ์ฌ๋ฃ๊ณผํ ์๋ํ ์คํ์ค์ ์ด์ ์ ๋๊ณ , 627๋ฒ์ ๋ฉํฐ๋ชจ๋ฌ LLM์ด ๋ค์ํ ๊ณผํ ๋ถ์ผ์์ ๊ณผํ์ ์ถ๋ก ํฅ์์ ์ฃผ์ฅํ์ฌ ์ํธ๋ณด์์ ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณ ๋ถ์ ๋๋
ธ๋ธ๋ฌ์ ํฉ์ฑ ๋ฐ ๊ณ๋ฉด ํน์ฑ ๋ถ์์์, AI/ML ๊ธฐ๋ฐ ํฌํ
์
์ ์ฉ ์์๋ก ์๋ก ๋ณด์์ ์ธ์ฌ์ดํธ๋ฅผ ์ ๊ณตํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
720๋ฒ ๋
ผ๋ฌธ์ ์๋ฌผยทํํ ๋ฑ ๊ณผํ๋ถ์ผ๋ฅผ ์ํ ๋ํ ์ธ์ด ๋ชจ๋ธ์ ๋ฐ์ ๋ฐฉํฅ์ ๋ค๋ฃจ๋ฉฐ, ๋ฉํฐ๋ชจ๋ฌ LLM์ ๊ณผํ์ ์ ์ฉ ๋
ผ์๋ก ์ด์ด์ง๋๋ค.
ํ์ ์ฐ๊ตฌ
523์์ ์ง์ ํ ๋ฉํฐ๋ชจ๋ฌ LLM์ ์ฌ๋ฃ๊ณผํ ์์ฉ ๊ฐ๋ฅ์ฑ์, 627์์ ์ฌ๋ฃ ํ๊ฐยท๋ฐ๊ฒฌ์ ์ค์ ๋ก ์ ์ฉํ ์ค์ฆ์ ์ฌ๋ก๋ฅผ ํ์ธํ ์ ์์ต๋๋ค.
์์ฉ ์ฌ๋ก
Efficient and Equivariant Graph Networks ๋
ผ๋ฌธ์ ๋ฉํฐ๋ชจ๋ฌ LLM์ ์ค์ ๋ถ์ ์ค๊ณ์ ๊ณผํ์ ๋ฐ๊ฒฌ์ ์ ์ฉํ ์์๋ฅผ ์ ๊ณตํ์ฌ 627์ ์ฃผ์ฅ์ ์ค๋ฌด์ ์ผ๋ก ๋ท๋ฐ์นจํฉ๋๋ค.
์์ฉ ์ฌ๋ก
660๋ฒ์ UrbanCIA ํ๋ ์์ํฌ๋ LLM ๊ธฐ๋ฐ์ผ๋ก ๋์ ์ธ๊ณผ์ถ๋ก ๋ฑ ์๋ก์ด ๊ณผํ์ ์ฐ๊ตฌ ์๋ํ์ ๊ตฌ์ฒด์ ์์๋ฅผ ์ ์ํ๋ค.
์์ฉ ์ฌ๋ก
๋ฉํฐ๋ชจ๋ฌ LLM์ ์ฐจํธ ์ดํด ํนํ๋ก ํ๋ํ์ฌ ์ฐจ๋ณํ๋ ๊ณผํ์ ์ถ๋ก ๋ฌธ์ ๋ฅผ ๋ค๋ฃน๋๋ค.
์์ฉ ์ฌ๋ก
627๋ฒ์์ ์ฃผ์ฅํ๋ LLM์ ํตํ ๊ณผํ์ ์ถ๋ก ยท์คํ ํ์ ๋
ผ์๋, 631๋ฒ์ฒ๋ผ ๊ฒฝ์ ํ ํ์ฅ์คํ ์๋ ์์ธก ๋ฑ ๊ตฌ์ฒด์ ์ฌ๋ก์ ์ฐ๊ฒฐ๋๋ค.