์ ์: Junyi Bian, Xiaolei Qin, Wuhe Zhou, Mengzuo Huang, Congyi Luo, Ke Zhang, Weidong Zhang | ๋ ์ง: 2023 | DOI: arXiv:2311.08896 📄 PDF
Essence
HeLM์ ์ ์ฒด ํ๋ ์์ํฌ: ์๋จ์ ํ๋ จ ๊ณผ์ , ํ๋จ์ ์ถ๋ก ๊ณผ์ ์ ๋ณด์ฌ์ค
ํ-ํ
์คํธ ์์ฑ ์์
์์ ์
๋ ฅ ํ
์ด๋ธ์ ๊ด๋ จ ํ(row)์ ๋จผ์ ๊ฐ์กฐ(highlighting)ํ๋ ๋ ๋จ๊ณ ์ ๊ทผ ๋ฐฉ์์ ์ ์ํ์ฌ, ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ด ํต์ฌ ์ฆ๊ฑฐ์ ์ง์คํ๋๋ก ํจ์ผ๋ก์จ ์์ฑ ํ์ง์ ํฅ์์ํจ๋ค.
Evaluation
์ดํ: HeLM์ ํ-ํ
์คํธ ์์ฑ์์ ๋ช
์์ ์ฆ๊ฑฐ ๊ฐ์กฐ๋ฅผ ํตํด ์ฑ๋ฅ๊ณผ ํด์ ๊ฐ๋ฅ์ฑ์ ๋์์ ๋ฌ์ฑํ ์ค์ฉ์ ์ด๊ณ ํจ๊ณผ์ ์ธ ์ ๊ทผ๋ฒ์ด๋ฉฐ, ์ฃผ์ ์๋ ๋ฐ์ดํฐ์
์์๋ ์ ์ฉ ๊ฐ๋ฅํ ์ฆ๊ฑฐ ๋ผ๋ฒจ ๊ตฌ์ฑ ๋ฐฉ๋ฒ์ ์ฐฝ์์ฑ์ด ๋๋ณด์ธ๋ค. ๋ค๋ง ๊ฐ๋ณ ๊ธฐ์ ์ ์ฐธ์ ์ฑ๊ณผ ์ด๋ก ์ ๊น์ด ์ธก๋ฉด์์๋ ๋ณด์์ ์ฌ์ง๊ฐ ์๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
ChartLlama๋ ์ฐจํธ ์ดํดยท์์ฑ LLM์ ๋ฉํฐ๋ชจ๋ฌ ์ฆ๊ฑฐ ์ถ์ถ ๊ธฐ๋ฒ์ ์ ์ํ์ฌ, ํ
์ด๋ธ-ํ
์คํธ ์ฆ๊ฑฐ ๊ฐ์กฐ์ ์๋ฆฌ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Hierarchical attention graph for scientific document summarization ๋
ผ๋ฌธ์ ์
๋ ฅ ํยทํ
์คํธ์ ๊ณ์ธต์ ๊ด๊ณ ํ์ต์ด HeLM๊ณผ ๊ฐ์ ์์ฝยท์์ฑ ์์
์ ํ์ง์ ๋์ธ๋ค๋ ์ ์ ์ ์ค๋ช
ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Tablemaster์ฒ๋ผ LLM ๊ธฐ๋ฐ ํ ์ดํด ๋ฐ reasoning ํ์ฅ ์ฐ๊ตฌ๋ ์
๋ ฅ ํ
์ด๋ธ ํด์ ๋ฐ ์ฆ๊ฑฐ ํ์ด๋ผ์ดํ
์ ์ด๋ก ์ ๊ทผ๊ฑฐ๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
328 ๋
ผ๋ฌธ์ ์ค๋ช
๊ฐ๋ฅ์ฑ ์ ๊ทผ์๋ 399๋ฒ ๋
ผ๋ฌธ์ฒ๋ผ ์ฆ๊ฑฐ ์ค์ฌ ์ง์์ฆ๊ฐ์ด๋ ์ค๋ช
์ ์ฆ๋ช
์ค๊ณ์ ์๋ฆฌ๊ฐ ์ํฅ์ ๋ฏธ์นฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
SciCap๋ ํ-ํ
์คํธ ๊ธฐ๋ฐ ๊ณผํ์ ์บก์
์์ฑ์ ์ด์ ์ ๋ง์ถค์ผ๋ก์จ HeLM์ ์ฆ๊ฑฐ ๊ฐ์กฐ ๋ฐฉ์์ด ๋ค๋ฅธ ์ ๊ทผ๋ฒ๊ณผ ๋ฌด์์ด ๋ค๋ฅธ์ง ๋น๊ตํ ๋งํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
Wikipedia ์ ๊ธฐ ์์ฑ์์ RAG ๋ฐ ํ
์ด๋ธ ๊ธฐ๋ฐ ์ฆ๊ฑฐ ์ ๋ณด ํ์ฉ ๋ฐฉ์๊ณผ, ํ-ํ
์คํธ ์์ฑ์์ ์ฆ๊ฑฐ ํ ๊ฐ์กฐ๋ฅผ ํตํ ๋ฐฉ๋ฒ์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
FigCaps-HF๋ ๋๋ฉ์ธ ์ ๋ฌธ๊ฐ ํผ๋๋ฐฑ ๊ธฐ๋ฐ RLHF ์บก์
์์ฑ์ผ๋ก, ์ฆ๊ฑฐ ํ์ด๋ผ์ดํธ/๊ฐํ ๋ฐฉ์์ด ๋ค๋ฅด๋ฉด์๋ ์์ฉ ๋ชฉ์ ์ด ๊ฐ๋ค.
๋ค๋ฅธ ์ ๊ทผ
HeLM ๋
ผ๋ฌธ์ ํ
์ด๋ธ-ํ
์คํธ ์์ฝ์ด๋ ์ฆ๊ฑฐ ๊ฐ์กฐ๋ฅผ ํตํด ๊ทธ๋ํ ๊ธฐ๋ฐ ์์ฝ ํ์ง์ ๋์ด๋ฏ๋ก, ๋ฌธ์ ์์ฝ์์์ ๊ทธ๋ํ ํ์ฉ์ ๋ค์ํ ๊ตฌํ์ ๋ณด์ฌ์ค๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ
์ด๋ธ ์์
ํนํ ์ธ์ด๋ชจ๋ธ ํ์ต์ ๋์์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
404๋ฒ ๋
ผ๋ฌธ์ ๋๊ท๋ชจ ๊ณผํ ๋ฌธํ์ RAG ์์คํ
์ฑ๋ฅ์ ํ์ ์ ์ผ๋ก ๋์ธ ์ฌ๋ก๋ก, 399๋ฒ ๋
ผ๋ฌธ์ ์ฆ๊ฑฐ ์ฃผ๋ ์์ฝ ๋ชจ๋ธ๊ณผ ๋น๊ต์ ์ ๊ทผ๋ฒ์ ๋ฌ๋ฆฌํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Multi-llm collaborative caption generation in scientific documents ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋ค์ํ ์ฆ๊ฑฐ ๊ฐ์กฐ ๋ฐฉ์์ด ๊ณผํ ๋ํ ๋ฐ ํ ์์ฑ์ ํ์ง์ ์ด๋ค ์ํฅ์ ์ฃผ๋์ง ์ค์ฆ์ ์ผ๋ก ์ฐ๊ตฌํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ์ ์ฉ์ด ๋
ผ๋ฌธ ์์ฑ ๋ฑ ๊ณผํ์ ์ฐฝ์์์ ๋ณธ์ ์๋๊ฒ ์๋ชป๋ ์ ๋ณด ํ์ฐ ๋ฌธ์ ๋ฅผ ์ฌ์ธต์ ์ผ๋ก ์กฐ๋ช
ํ๋ฉฐ, ํ๊ฐ์ ์ํ์ฑ๊ณผ ๊ฐ์น ๋ชจ๋๋ฅผ ๊ท ํ ์๊ฒ ๊ณ ๋ คํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ฅ๋ฌธ ์ปจํ
์คํธ ์ฒ๋ฆฌ๋ฅผ ์ํ ๋ค๋ฅธ ์ํคํ
์ฒ์ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
812๋ฒ ๋
ผ๋ฌธ์ ๊ณผํ ๋
ผ๋ฌธ ๋ฑ ์ฅ๋ฌธ์ ์ถ์ถ ์์ฝ์ ์ํ Extreme Summarization ์ ๊ทผ๋ฒ์ ์ ์ํ์ฌ, 399๋ฒ์ ํ
์ด๋ธ-ํ
์คํธ ์ฆ๊ฑฐ ๊ฐ์กฐ ์ ๋ต์ ์ค์ ๋ค์ค๋ชจ๋ฌ ์์ฝ ํ๋ ์์ํฌ๋ฅผ ๋ํฉ๋๋ค.
์์ฉ ์ฌ๋ก
๊ฐ์กฐ ์ฆ๊ฑฐ ๊ธฐ๋ฐ ์ธ์ด๋ชจ๋ธ(HeLM)์ด ๊ณผํ์ ๋ณต์ก๊ณ ๋์ญํ ํด์์ ์ธ์ด-๊ณต๊ฐ ํตํฉ ๊ธฐ๋ฐ ์ ์ฉ์ ๋ณด์ฌ์ค๋ค.