Hierarchical attention graph for scientific document summarization in global and local level

์ €์ž: Chenlong Zhao, Xiwen Zhou, Xiaopeng Xie, Yong Zhang | ๋‚ ์งœ: 2024 | DOI: N/A 📄 PDF


Essence

Figure 1

๋ฌธ์„œ์˜ ์ง€์—ญ(local)๊ณผ ์ „์—ญ(global) ๊ด€์ ์—์„œ์˜ ๋ชจ๋ธ๋ง ์˜ˆ์‹œ: ๋‹จ์–ด-๋ฌธ์žฅ ๊ฐ„ ๊ด€๊ณ„(intra-sentence)์™€ ๋ฌธ์žฅ ๊ฐ„ ๊ด€๊ณ„(inter-sentence)๋ฅผ ๊ณ„์ธต์ ์œผ๋กœ ๊ตฌ๋ถ„

๊ณผํ•™ ๋…ผ๋ฌธ ๊ฐ™์€ ์žฅ๋ฌธ์„œ์˜ ์ถ”์ถœ ์š”์•ฝ์„ ์œ„ํ•ด ๊ทธ๋ž˜ํ”„ ์‹ ๊ฒฝ๋ง์„ ํ™œ์šฉํ•˜์—ฌ ๋ฌธ์žฅ ๋‚ด ๊ด€๊ณ„(์ง€์—ญ ์ˆ˜์ค€)์™€ ๋ฌธ์žฅ ๊ฐ„ ๊ณ ์ฐจ ๊ด€๊ณ„(์ „์—ญ ์ˆ˜์ค€)๋ฅผ ๊ณ„์ธต์ ์œผ๋กœ ๋™์‹œ์— ๋ชจ๋ธ๋งํ•˜๋Š” HAESum ๋ฐฉ๋ฒ• ์ œ์‹œ.

Motivation

Achievement

Figure 2

HAESum ํ”„๋ ˆ์ž„์›Œํฌ ๊ฐœ์š”: (์ขŒ) ์ง€์—ญ ์ˆ˜์ค€ ์ด์งˆ ๊ทธ๋ž˜ํ”„(HEGAT)์—์„œ ๋ฌธ์žฅ-๋‹จ์–ด ์–‘๋ฐฉํ–ฅ ๋ฉ”์‹œ์ง€ ํŒจ์‹ฑ, (์šฐ) ์ „์—ญ ์ˆ˜์ค€ ํ•˜์ดํผ๊ทธ๋ž˜ํ”„ ์ž๊ธฐ์ฃผ์˜(HGSAT)์—์„œ ๊ณ ์ฐจ ๋ฌธ์žฅ ๊ด€๊ณ„ ํฌ์ฐฉ

  1. ์ฒซ ๊ณ„์ธต์  GNN ๊ธฐ๋ฐ˜ ์ถ”์ถœ ์š”์•ฝ ๋ชจ๋ธ: ๊ธฐ์กด๊ณผ ๋‹ฌ๋ฆฌ ๋ฌธ์žฅ ๋‚ด ๊ด€๊ณ„์™€ ๋ฌธ์žฅ ๊ฐ„ ๊ด€๊ณ„๋ฅผ ๋ถ„๋ฆฌ๋œ ๊ทธ๋ž˜ํ”„์—์„œ ์ˆœ์ฐจ์ ์œผ๋กœ ํ•™์Šตํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ๊ณ„์ธต ๊ตฌ์กฐ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ™œ์šฉ
  2. ์ƒˆ๋กœ์šด ํ•˜์ดํผ๊ทธ๋ž˜ํ”„ ์ž๊ธฐ์ฃผ์˜ ๋ ˆ์ด์–ด: ๋…ธ๋“œ๋ฟ ์•„๋‹ˆ๋ผ ํ•˜์ดํผ์—ฃ์ง€(hyperedge)๋ฅผ ๋ช…์‹œ์ ์œผ๋กœ ํ‘œํ˜„ํ•˜์—ฌ ๊ณ ์ฐจ ๋ฌธ์žฅ ๊ด€๊ณ„๋ฅผ ํฌ์ฐฉ. ์‚ฌ์ „ํ›ˆ๋ จ ๋ชจ๋ธ์— ์˜์กดํ•˜์ง€ ์•Š์•„ ์ €์ž์› ์–ธ์–ด ์ ์šฉ ๊ฐ€๋Šฅ
  3. ๋ฒค์น˜๋งˆํฌ ๊ฒ€์ฆ: Arxiv, PubMed ๋‘ ๋ฐ์ดํ„ฐ์…‹์—์„œ ๊ธฐ์กด ๋ฐฉ๋ฒ•๋“ค ๋Œ€๋น„ ํšจ๊ณผ์„ฑ ์ž…์ฆ

How

1) ๋ฌธ์žฅ ์ฃผ๋ณ€ ๋‹จ์–ด๋กœ๋ถ€ํ„ฐ ์ •๋ณด ์ง‘๊ณ„โ†’๋‹จ์–ด ํ‘œํ˜„ ๊ฐฑ์‹  (์‹ 1-4)

2) ๊ฐฑ์‹ ๋œ ๋‹จ์–ด๋กœ๋ถ€ํ„ฐ ๋ฌธ์žฅ ํ‘œํ˜„ ์—…๋ฐ์ดํŠธ

  • ์ „์—ญ ์ˆ˜์ค€(Global Level) - ํ•˜์ดํผ๊ทธ๋ž˜ํ”„ ์ž๊ธฐ์ฃผ์˜(Hypergraph Self-Attention, HGSAT):
  • ์˜ˆ์ธก: MLP๋กœ ์ด์ง„ ๋ถ„๋ฅ˜(ํฌํ•จ/์ œ์™ธ) ์ˆ˜ํ–‰
  • Originality

    Limitation & Further Study

    Evaluation

    ์ดํ‰: ๊ณผํ•™ ๋…ผ๋ฌธ ์ถ”์ถœ ์š”์•ฝ์„ ์œ„ํ•ด ๊ณ„์ธต ๊ตฌ์กฐ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ™œ์šฉํ•˜๋Š” ์ฐธ์‹ ํ•œ ์ ‘๊ทผ์œผ๋กœ, ์ง€์—ญ-์ „์—ญ ์ˆ˜์ค€์˜ ๋ถ„๋ฆฌ์  ๋ชจ๋ธ๋ง์ด ๊ฐ•์ ์ด๋‚˜, ํ•˜์ดํผ์—ฃ์ง€ ๊ตฌ์„ฑ์˜ ๋ช…์‹œ์„ฑ ๋ถ€์žฌ์™€ LLM ์‹œ๋Œ€์˜ ์˜์˜ ์ œ์‹œ ๋ณด์™„์ด ํ•„์š”ํ•จ.

    ๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

    ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
    Tree-of-table ๋“ฑ ๊ณ„์ธต์  ํ‘œํ˜„ ํ•™์Šต๊ณผ LLM reasoning ๊ด€๋ จ ์—ฐ๊ตฌ๊ฐ€ Scientific Document Summarization์˜ ๊ณ„์ธต์  attention ์„ค๊ณ„์— ๊ธฐ์ดˆ ์ž๋ฃŒ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
    ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
    HeLM ๋…ผ๋ฌธ์€ ํ‘œ-ํ…์ŠคํŠธ ๊ฐ„ ์ฆ๊ฑฐ ๊ฐ•์กฐ๋กœ ์š”์•ฝ ์„ฑ๋Šฅ์„ ๋†’์ด๋ฉฐ, HAESum์˜ ๊ทธ๋ž˜ํ”„ ๊ตฌ์กฐํ™” ์š”์•ฝ ์ ‘๊ทผ์— ์‹ค์งˆ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
    ๋‹ค๋ฅธ ์ ‘๊ทผ
    ๋…ผ๋ฌธ ๋‚ด ์ฃผ์š” ๋‚ด์šฉ ์ถ”์ถœ๊ณผ ์š”์•ฝ์—์„œ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์‹ฌ์ธต์ ์œผ๋กœ ๋‹ค๋ฃจ์–ด, KGSum๊ณผ ๋‹ค์–‘ํ•œ ์š”์•ฝ ๋ฐฉ์‹ ์„ฑ๋Šฅ์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
    ๋‹ค๋ฅธ ์ ‘๊ทผ
    564๋ฒˆ ๋…ผ๋ฌธ์€ ๋‹ค์ค‘ LLM ํ˜‘๋ ฅ ๊ธฐ๋ฐ˜ ๊ณผํ•™๋ฌธ์„œ ์บก์…˜ ์ƒ์„ฑ์— ์ฃผ๋ชฉํ•ด, 401๋ฒˆ์˜ ๊ทธ๋ž˜ํ”„ ์š”์•ฝ ์ ‘๊ทผ๊ณผ ์˜๋ฏธ ์ถ”์ถœ ํŒจ๋Ÿฌ๋‹ค์ž„์—์„œ ๋Œ€์ฒด์  ๊ด€์ ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
    ๋‹ค๋ฅธ ์ ‘๊ทผ
    ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ์•„์ด๋””์–ด ๊ด€๊ณ„ ์ถ”๋ก ์œผ๋กœ, ๊ณ„์ธต์  attention graph์™€ ๋น„๊ตํ•ด๋ณผ ๋งŒํ•ฉ๋‹ˆ๋‹ค.
    ๋‹ค๋ฅธ ์ ‘๊ทผ
    SurveyX ๋…ผ๋ฌธ์€ ๊ณผํ•™ ๋…ผ๋ฌธ์˜ ์žฅ๋ฌธ ์š”์•ฝ ๋ฐ ์ถ”์ถœ์„ ์œ„ํ•ด ๊ทธ๋ž˜ํ”„ ๋ฐ ๊ณ„์ธต์  ์ฃผ์˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜์˜ ๊ตฌํ˜„ ๋ฐ ์„ฑ๋Šฅ์„ ๋‹ค๋ฅด๊ฒŒ ๋‹ค๋ฃจ๋Š” ๋Œ€์•ˆ์  ์ ‘๊ทผ๋ฒ•์ž…๋‹ˆ๋‹ค.
    ํ›„์† ์—ฐ๊ตฌ
    ๊ณผํ•™ ๋…ผ๋ฌธ ์š”์•ฝ์—์„œ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๋‹ค๋ฌธ์„œ ์š”์•ฝ์„ ๋ชฉํ‘œ๋กœ ํ•œ ์—ฐ๊ตฌ๋Š” ๊ณ„์ธต ์ฃผ์˜ ๊ทธ๋ž˜ํ”„ ์š”์•ฝ ๋ชจํ˜•์˜ ์‹ค์ œ ๊ตฌ์กฐํ™” ์ ์šฉ์„ ๊ตฌ์ฒด์ ์œผ๋กœ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
    ํ›„์† ์—ฐ๊ตฌ
    ๋…ผ๋ฌธ์˜ ๊ด€๊ณ„๋ฅผ ์„ธ๋ฐ€ํ•˜๊ฒŒ ์ถ”์ถœํ•˜๋Š” Hierarchical attention graph(401)์€ 742์˜ ์—ฐ๊ตฌ ๊ด€๋ จ์„น์…˜ ์ž๋™ ์ƒ์„ฑ framework๋ฅผ ํ•œ์ธต ๊ณ ๋„ํ™”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
    ← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

    ๐ŸŽง Audio Overview

    ์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
    โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •