HeLM: Highlighted Evidence augmented Language Model for Enhanced Table-to-Text Generation

์ €์ž: Junyi Bian, Xiaolei Qin, Wuhe Zhou, Mengzuo Huang, Congyi Luo, Ke Zhang, Weidong Zhang | ๋‚ ์งœ: 2023 | DOI: arXiv:2311.08896 📄 PDF


Essence

Figure 1

HeLM์˜ ์ „์ฒด ํ”„๋ ˆ์ž„์›Œํฌ: ์ƒ๋‹จ์€ ํ›ˆ๋ จ ๊ณผ์ •, ํ•˜๋‹จ์€ ์ถ”๋ก  ๊ณผ์ •์„ ๋ณด์—ฌ์คŒ

ํ‘œ-ํ…์ŠคํŠธ ์ƒ์„ฑ ์ž‘์—…์—์„œ ์ž…๋ ฅ ํ…Œ์ด๋ธ”์˜ ๊ด€๋ จ ํ–‰(row)์„ ๋จผ์ € ๊ฐ•์กฐ(highlighting)ํ•˜๋Š” ๋‘ ๋‹จ๊ณ„ ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ œ์•ˆํ•˜์—ฌ, ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์ด ํ•ต์‹ฌ ์ฆ๊ฑฐ์— ์ง‘์ค‘ํ•˜๋„๋ก ํ•จ์œผ๋กœ์จ ์ƒ์„ฑ ํ’ˆ์งˆ์„ ํ–ฅ์ƒ์‹œํ‚จ๋‹ค.

Motivation

Achievement

Figure 2

๊ฐ•์กฐ๊ธฐ์™€ ์š”์•ฝ๊ธฐ์˜ ํ”„๋กฌํ”„ํŠธ ๊ตฌ์กฐ

  1. ์ตœ์ฒจ๋‹จ ์„ฑ๋Šฅ: FetaQA์™€ QTSumm ๋ฐ์ดํ„ฐ์…‹์—์„œ ROUGE์™€ BLEU ์ ์ˆ˜ ๊ธฐ์ค€ ์ตœ์ฒจ๋‹จ ๊ฒฐ๊ณผ ๋‹ฌ์„ฑ
  2. ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ ์ œ๊ณต: ๊ฐ•์กฐ๋œ ํ–‰ ์ธ๋ฑ์Šค๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ์˜ ์˜์‚ฌ๊ฒฐ์ • ๊ณผ์ •์„ ๋ช…ํ™•ํžˆ ์ œ์‹œํ•˜์—ฌ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ(interpretability) ํ–ฅ์ƒ
  3. ํšจ์œจ์  ํŒŒ์ธํŠœ๋‹: QLoRA๋ฅผ ํ™œ์šฉํ•œ ๋งค๊ฐœ๋ณ€์ˆ˜ ํšจ์œจ์  ํ•™์Šต์œผ๋กœ ์ œํ•œ๋œ ๊ณ„์‚ฐ ์ž์›์—์„œ๋„ LLaMA2 ํŒŒ์ธํŠœ๋‹ ๊ฐ€๋Šฅ

How

Figure 3

์ฆ๊ฑฐ ๋ ˆ์ด๋ธ” ์ฆ๋ฅ˜๋ฅผ ์œ„ํ•œ ํ”„๋กฌํ”„ํŠธ

Figure 4

ํ‘œ ๊ฐ•์กฐ ์˜ˆ์‹œ: ๊ด€๋ จ ํ–‰์˜ ๊ฐ ์…€์— '' ๋ฌธ์ž๋ฅผ ๋ถ™์—ฌ ๊ฐ•์กฐ*

๋ฐฉ๋ฒ•๋ก :

Originality

Limitation & Further Study

Evaluation

์ดํ‰: HeLM์€ ํ‘œ-ํ…์ŠคํŠธ ์ƒ์„ฑ์—์„œ ๋ช…์‹œ์  ์ฆ๊ฑฐ ๊ฐ•์กฐ๋ฅผ ํ†ตํ•ด ์„ฑ๋Šฅ๊ณผ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ์„ ๋™์‹œ์— ๋‹ฌ์„ฑํ•œ ์‹ค์šฉ์ ์ด๊ณ  ํšจ๊ณผ์ ์ธ ์ ‘๊ทผ๋ฒ•์ด๋ฉฐ, ์ฃผ์„ ์—†๋Š” ๋ฐ์ดํ„ฐ์…‹์—์„œ๋„ ์ ์šฉ ๊ฐ€๋Šฅํ•œ ์ฆ๊ฑฐ ๋ผ๋ฒจ ๊ตฌ์„ฑ ๋ฐฉ๋ฒ•์˜ ์ฐฝ์˜์„ฑ์ด ๋‹๋ณด์ธ๋‹ค. ๋‹ค๋งŒ ๊ฐœ๋ณ„ ๊ธฐ์ˆ ์˜ ์ฐธ์‹ ์„ฑ๊ณผ ์ด๋ก ์  ๊นŠ์ด ์ธก๋ฉด์—์„œ๋Š” ๋ณด์™„์˜ ์—ฌ์ง€๊ฐ€ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ChartLlama๋Š” ์ฐจํŠธ ์ดํ•ดยท์ƒ์„ฑ LLM์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ฆ๊ฑฐ ์ถ”์ถœ ๊ธฐ๋ฒ•์„ ์ œ์‹œํ•˜์—ฌ, ํ…Œ์ด๋ธ”-ํ…์ŠคํŠธ ์ฆ๊ฑฐ ๊ฐ•์กฐ์˜ ์›๋ฆฌ์  ๊ธฐ๋ฐ˜์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Hierarchical attention graph for scientific document summarization ๋…ผ๋ฌธ์€ ์ž…๋ ฅ ํ‘œยทํ…์ŠคํŠธ์˜ ๊ณ„์ธต์  ๊ด€๊ณ„ ํ•™์Šต์ด HeLM๊ณผ ๊ฐ™์€ ์š”์•ฝยท์ƒ์„ฑ ์ž‘์—…์˜ ํ’ˆ์งˆ์„ ๋†’์ธ๋‹ค๋Š” ์ ์„ ์ž˜ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Tablemaster์ฒ˜๋Ÿผ LLM ๊ธฐ๋ฐ˜ ํ‘œ ์ดํ•ด ๋ฐ reasoning ํ™•์žฅ ์—ฐ๊ตฌ๋Š” ์ž…๋ ฅ ํ…Œ์ด๋ธ” ํ•ด์„ ๋ฐ ์ฆ๊ฑฐ ํ•˜์ด๋ผ์ดํŒ…์˜ ์ด๋ก ์  ๊ทผ๊ฑฐ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
328 ๋…ผ๋ฌธ์˜ ์„ค๋ช…๊ฐ€๋Šฅ์„ฑ ์ ‘๊ทผ์—๋Š” 399๋ฒˆ ๋…ผ๋ฌธ์ฒ˜๋Ÿผ ์ฆ๊ฑฐ ์ค‘์‹ฌ ์งˆ์˜์ฆ๊ฐ•์ด๋‚˜ ์„ค๋ช…์  ์ฆ๋ช… ์„ค๊ณ„์˜ ์›๋ฆฌ๊ฐ€ ์˜ํ–ฅ์„ ๋ฏธ์นฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
SciCap๋„ ํ‘œ-ํ…์ŠคํŠธ ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ์บก์…˜ ์ƒ์„ฑ์— ์ดˆ์ ์„ ๋งž์ถค์œผ๋กœ์จ HeLM์˜ ์ฆ๊ฑฐ ๊ฐ•์กฐ ๋ฐฉ์‹์ด ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•๊ณผ ๋ฌด์—‡์ด ๋‹ค๋ฅธ์ง€ ๋น„๊ตํ•  ๋งŒํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Wikipedia ์ „๊ธฐ ์ƒ์„ฑ์—์„œ RAG ๋ฐ ํ…Œ์ด๋ธ” ๊ธฐ๋ฐ˜ ์ฆ๊ฑฐ ์ •๋ณด ํ™œ์šฉ ๋ฐฉ์‹๊ณผ, ํ‘œ-ํ…์ŠคํŠธ ์ƒ์„ฑ์—์„œ ์ฆ๊ฑฐ ํ–‰ ๊ฐ•์กฐ๋ฅผ ํ†ตํ•œ ๋ฐฉ๋ฒ•์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
FigCaps-HF๋Š” ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€ ํ”ผ๋“œ๋ฐฑ ๊ธฐ๋ฐ˜ RLHF ์บก์…˜ ์ƒ์„ฑ์œผ๋กœ, ์ฆ๊ฑฐ ํ•˜์ด๋ผ์ดํŠธ/๊ฐ•ํ™” ๋ฐฉ์‹์ด ๋‹ค๋ฅด๋ฉด์„œ๋„ ์‘์šฉ ๋ชฉ์ ์ด ๊ฐ™๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
HeLM ๋…ผ๋ฌธ์€ ํ…Œ์ด๋ธ”-ํ…์ŠคํŠธ ์š”์•ฝ์ด๋‚˜ ์ฆ๊ฑฐ ๊ฐ•์กฐ๋ฅผ ํ†ตํ•ด ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์š”์•ฝ ํ’ˆ์งˆ์„ ๋†’์ด๋ฏ€๋กœ, ๋ฌธ์„œ ์š”์•ฝ์—์„œ์˜ ๊ทธ๋ž˜ํ”„ ํ™œ์šฉ์˜ ๋‹ค์–‘ํ•œ ๊ตฌํ˜„์„ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ…Œ์ด๋ธ” ์ž‘์—… ํŠนํ™” ์–ธ์–ด๋ชจ๋ธ ํ•™์Šต์˜ ๋Œ€์•ˆ์  ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
404๋ฒˆ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ๊ณผํ•™ ๋ฌธํ—Œ์˜ RAG ์‹œ์Šคํ…œ ์„ฑ๋Šฅ์„ ํ˜์‹ ์ ์œผ๋กœ ๋†’์ธ ์‚ฌ๋ก€๋กœ, 399๋ฒˆ ๋…ผ๋ฌธ์˜ ์ฆ๊ฑฐ ์ฃผ๋„ ์š”์•ฝ ๋ชจ๋ธ๊ณผ ๋น„๊ต์  ์ ‘๊ทผ๋ฒ•์„ ๋‹ฌ๋ฆฌํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Multi-llm collaborative caption generation in scientific documents ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋‹ค์–‘ํ•œ ์ฆ๊ฑฐ ๊ฐ•์กฐ ๋ฐฉ์‹์ด ๊ณผํ•™ ๋„ํ‘œ ๋ฐ ํ‘œ ์ƒ์„ฑ์˜ ํ’ˆ์งˆ์— ์–ด๋–ค ์˜ํ–ฅ์„ ์ฃผ๋Š”์ง€ ์‹ค์ฆ์ ์œผ๋กœ ์—ฐ๊ตฌํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ์ ์šฉ์ด ๋…ผ๋ฌธ ์ž‘์„ฑ ๋“ฑ ๊ณผํ•™์  ์ฐฝ์ž‘์—์„œ ๋ณธ์˜ ์•„๋‹ˆ๊ฒŒ ์ž˜๋ชป๋œ ์ •๋ณด ํ™•์‚ฐ ๋ฌธ์ œ๋ฅผ ์‹ฌ์ธต์ ์œผ๋กœ ์กฐ๋ช…ํ•˜๋ฉฐ, ํ™˜๊ฐ์˜ ์œ„ํ—˜์„ฑ๊ณผ ๊ฐ€์น˜ ๋ชจ๋‘๋ฅผ ๊ท ํ˜• ์žˆ๊ฒŒ ๊ณ ๋ คํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์žฅ๋ฌธ ์ปจํ…์ŠคํŠธ ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•œ ๋‹ค๋ฅธ ์•„ํ‚คํ…์ฒ˜์  ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
812๋ฒˆ ๋…ผ๋ฌธ์€ ๊ณผํ•™ ๋…ผ๋ฌธ ๋“ฑ ์žฅ๋ฌธ์„œ ์ถ”์ถœ ์š”์•ฝ์„ ์œ„ํ•œ Extreme Summarization ์ ‘๊ทผ๋ฒ•์„ ์ œ์•ˆํ•˜์—ฌ, 399๋ฒˆ์˜ ํ…Œ์ด๋ธ”-ํ…์ŠคํŠธ ์ฆ๊ฑฐ ๊ฐ•์กฐ ์ „๋žต์— ์‹ค์ œ ๋‹ค์ค‘๋ชจ๋‹ฌ ์š”์•ฝ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋”ํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๊ฐ•์กฐ ์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ์–ธ์–ด๋ชจ๋ธ(HeLM)์ด ๊ณผํ•™์  ๋ณต์žก๊ณ„ ๋™์—ญํ•™ ํ•ด์„์˜ ์–ธ์–ด-๊ณต๊ฐ„ ํ†ตํ•ฉ ๊ธฐ๋ฐ˜ ์ ์šฉ์„ ๋ณด์—ฌ์ค€๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •