์ ์: Pancheng Wang, Shasha Li, Kunyuan Pang, Liangliang He, Dong Li, Jintao Tang, Ting Wang | ๋ ์ง: 2022 | DOI: ๋ฏธ์ ๊ณต 📄 PDF
Essence
Figure 1: ์
๋ ฅ ๊ณผํ ๋
ผ๋ฌธ์ ์ด๋ก๊ณผ ๊ธํ์ค ์์ฝ์์ ๊ตฌ์ฑ๋ ์ง์ ๊ทธ๋ํ
๋ณธ ๋
ผ๋ฌธ์ ์ง์ ๊ทธ๋ํ(Knowledge Graph, KG)๋ฅผ ์ค์ฌ์ผ๋ก ๋ค์ค ๋ฌธ์ ๊ณผํ ๋
ผ๋ฌธ ์์ฝ(Multi-Document Scientific Summarization, MDSS)์ ์ํํ๋ KGSum ๋ชจ๋ธ์ ์ ์ํ๋ค. ์ธ์ฝ๋ฉ๊ณผ ๋์ฝ๋ฉ ์ ๊ณผ์ ์์ ์ง์ ๊ทธ๋ํ๋ฅผ ํ์ฉํ์ฌ ๋
ผ๋ฌธ์ ์ฃผ์ ๋ด์ฉ๊ณผ ๋
ผ๋ฌธ ๊ฐ ๊ด๊ณ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ๋ชจ๋ธ๋งํ๋ค.
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ์ง์ ๊ทธ๋ํ ๊ตฌ์กฐ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ํ์ฉํ ์ฐฝ์์ ์ธ MDSS ์ ๊ทผ๋ฒ์ ์ ์ํ๋ฉฐ, ๋ ๋จ๊ณ ๋์ฝ๋ ๊ตฌ์กฐ๋ฅผ ํตํด ์ค๊ฐ ์ง์ ํํ์ ๋ช
์์ ์ผ๋ก ํ์ฉํ๋ ์ ์ด ์ธ์์ ์ด๋ค. ๋ค๋ง ์ถ์ถ ๊ธฐ๋ฐ ์ง์ ๊ทธ๋ํ์ ๋
ธ์ด์ฆ ๋ฌธ์ ์ ๊ณ์ฐ ๋ณต์ก๋ ์ธก๋ฉด์ ๊ฐ์ ์ด ํ์ํ๋ฉฐ, ๋ ๋ค์ํ ํ๊ฐ๋ฅผ ํตํ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ ๊ฒ์ฆ์ด ์๊ตฌ๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Neural Related Work Summarization์ ์ฐธ๊ณ ๋ฌธํ ๊ทธ๋ํ ์ ๋ณด๋ฅผ ํ์ฉํ ๋
ผ๋ฌธ ๊ด๋ จ ์ฐ๊ตฌ ์์ฝ์ผ๋ก, knowledge graph๋ฅผ ๊ธฐ๋ฐํ ๊ณผํ ๋
ผ๋ฌธ ์์ฝ์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ๋ค์ค๋ฌธ์ ์์ฝ ๋ฐฉ๋ฒ๋ก ์ผ๋ก, ๊ฒ์-์์ฝ-์์ฑ ๋ชจ๋์ ํ์ดํ๋ผ์ธ์์ ์ธ์ฉ ์ ๋ณด ํ์ฉ๊ณผ ์ ๋์ ๊ตฌ์กฐํ ๋ฐฉ๋ฒ์ ํ ๋๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ๊ณผํ ๋
ผ๋ฌธ ์์ฝ์ ๋ค๋ฃฌ 563๋ฒ ๋
ผ๋ฌธ์ด full-text ๊ธฐ๋ฐ graph ์ ์ฝrelated work ์์ฑ์ ์ด๋ก ์ ๊ธฐ๋ฐ์
๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ค์ค ๋
ผ๋ฌธ ์์ฝ์ ์ํ LLM ๊ธฐ๋ฐ ํ๋ ์์ํฌ์ ์ค์ ์ง์ ๊ตฌ์กฐํ, ํ๊ฐ ๋ฐฉ์์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ง์ ํ์ ๋
ผ๋ฌธ์ ๊ตฌ์กฐ์ ์ผ๋ก ์์ฝํ๋ ๋ ๋ค๋ฅธ ์ ๊ทผ๋ฒ์ ์ ๊ณตํด, MDSS ๋ถ์ผ์ ๋ค์ํ ๊ธฐ๋ฒ์ ๋น๊ต ๋ถ์ํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋
ผ๋ฌธ ๋ด ์ฃผ์ ๋ด์ฉ ์ถ์ถ๊ณผ ์์ฝ์์ ๊ทธ๋ํ ๊ธฐ๋ฐ ๋ฉ์ปค๋์ฆ์ ์ฌ์ธต์ ์ผ๋ก ๋ค๋ฃจ์ด, KGSum๊ณผ ๋ค์ํ ์์ฝ ๋ฐฉ์ ์ฑ๋ฅ์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Glimpse๋ ๋ค์ค ๋ฌธ์ ์์ฝ์์ ์ค์ฉ์ฑ๊ณผ ์ ๋ณด ์ต์ ํ๋ฅผ ์ถ๊ตฌํด, KGSum์ ๋น๊ตํด ๋ค์ํ ๊ทธ๋ํยท์์ฝ ๊ธฐ๋ฐ ์ ๊ทผ๋ฐฉ์์ ํ๊ตฌํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
PaperRobot์ ์ง์ ๊ทธ๋ํ ์๋ ๊ตฌ์ถ ๋ฐ ์ฐ๊ตฌ ์์ด๋์ด ์์ฑ์ ํ์ฉํ๋ฉฐ, KGSum๊ณผ ์ ์ฌํ๊ฒ ๊ทธ๋ํ๋ฅผ ๋ค์ํ ์์ฑ ์์
์ ์์ฉํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
KGSum์ ๊ด๋ จ ์ฐ๊ตฌ ์์ฑ ๋ถ์ผ์์ ์ฐธ๊ณ ๋ฌธํ ๊ทธ๋ํ ์ ๋ณด๋ฅผ ์ฌํ ํ์ฉํด, ๋ณธ ๋
ผ๋ฌธ์ ๊ทธ๋ํ-์ถ์ถ์ ์์ฝ ๊ธฐ๋ฒ์ ๋ฐ์ ์ํจ๋ค.
ํ์ ์ฐ๊ตฌ
563๋ฒ ๋
ผ๋ฌธ์ ๊ทธ๋ํ ๊ธฐ๋ฐ์ ๊ณผํ์ ๋ฌธ์ ๋ค์ค ๋ฌธ์ ์์ฝ์ ์ด์ ์ ๋ง์ถฐ, 812๋ฒ ๊ทน๋จ์ ์์ฝ(TLDR) ์ฐ๊ตฌ๋ฅผ ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ๊ณผํ ๋ค์ค๋ฌธ์ ์์ฝ์ ๋ค๋ค, MS2 ๋ฐ์ดํฐ์
๊ธฐ๋ฐ ์๋ํ ์์ฝ๊ธฐ์ ์ ํ์ ๋ฐ์ ๋ฐฉํฅ์ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
Graphusion์ KG ๊ธฐ๋ฐ RAG ๊ธฐ๋ฒ์ ํ์ฉํ์ฌ ์๋ง์ ๋
ผ๋ฌธ์ ํตํฉ์ ์ผ๋ก ์์ฝยท์ดํดํ๋ ์ต์ ํ๋ ์์ํฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ ๋
ผ๋ฌธ ์์ฝ์์ ๊ทธ๋ํ ๊ธฐ๋ฐ ๋ค๋ฌธ์ ์์ฝ์ ๋ชฉํ๋ก ํ ์ฐ๊ตฌ๋ ๊ณ์ธต ์ฃผ์ ๊ทธ๋ํ ์์ฝ ๋ชจํ์ ์ค์ ๊ตฌ์กฐํ ์ ์ฉ์ ๊ตฌ์ฒด์ ์ผ๋ก ์ ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ ๋
ผ๋ฌธ์ ์ฃผ์ ์ ๋ณด(๋ฌธ๋งฅ, ๋ฐฉ๋ฒ ๋ฑ)๋ฅผ ์ง์ ๊ทธ๋ํ ๊ด์ ์์ ๊ตฌ์กฐ์ ์ผ๋ก ์ถ์ถยท์์ฝํ๋ ์์
์ผ๋ก, 520์ ๋๊ท๋ชจ ๋ฐ์ดํฐ์
๊ตฌ์ถ์ ๊ทธ๋ํ ๊ธฐ๋ฐ์ผ๋ก ํ์ฅํฉ๋๋ค.