์ ์: Peng Li, Zihan Zhuang, Yangfan Gao, Yi Dong, Sixian Li, Changhao Jiang, Shihan Dou, Zhiheng Xi, Enyu Zhou, Jixuan Huang, Hui Li, Jingjing Gong, Xingjun Ma, Tao Gui, Zuxuan Wu, Qi Zhang, Xuanjing Huang, Yu-Gang Jiang, Xipeng Qiu | ๋ ์ง: 2026-01-19 | DOI: 10.48550/arXiv.2601.12799 📄 PDF
Figure 2 | The inference pipeline of FRoM-W1. (a) H-GPT first translates language instructions
FRoM-W1์ ์์ฐ์ด ์ง์๋ฌธ์ผ๋ก๋ถํฐ ํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ ์ ์ ์์ง์์ ์ ์ดํ๋ ์คํ์์ค ํ๋ ์์ํฌ๋ก, H-GPT ๋ชจ๋ธ๊ณผ H-ACT ๋ชจ๋์ 2๋จ๊ณ ๊ตฌ์กฐ๋ก ์ธ์ด ์ดํด์ ์์ ์ ์ธ ๋ก๋ด ์คํ์ ๋์์ ๋ฌ์ฑํ๋ค.
Figure 1 | (a) We introduce FRoM-W1, an open-source framework that leverages Chain-of-Thought
Figure 2 | The inference pipeline of FRoM-W1. (a) H-GPT first translates language instructions
์ดํ: FRoM-W1์ ์์ฐ์ด ๊ธฐ๋ฐ ํด๋จธ๋ ธ์ด๋ ์ ์ ์ ์ด๋ผ๋ ์ค์ํ ๋ฌธ์ ๋ฅผ Chain-of-Thought์ 2๋จ๊ณ RL ์ ๋ต์ผ๋ก ์ฐฝ์์ ์ผ๋ก ํด๊ฒฐํ๋ฉฐ, ์์ ์คํ์์ค ์ ๊ณต๊ณผ ์ค์ ๋ก๋ด ์ค์ฆ์ ํตํด ๋์ ์ค์ฉ์ฑ๊ณผ ์ฌํ์ฑ์ ๋ณด์ฌ์ค๋ค.