Cited text spans for citation text generation

์ €์ž: Xiangci Li, Yiโ€Hui Lee, Jessica Ouyang | ๋‚ ์งœ: 2023 | DOI: N/A 📄 PDF


Essence

Figure 1

Overview of the proposed CTS-based citation generation approach. Context, Oracle, Keyword ์ „๋žต์„ ํ†ตํ•ด ์ธ์šฉ ๋…ผ๋ฌธ์—์„œ CTS๋ฅผ ๊ฒ€์ƒ‰ํ•˜๊ณ  ์ธ์šฉ ํ…์ŠคํŠธ๋ฅผ ์ƒ์„ฑ

๊ณผํ•™ ๋…ผ๋ฌธ์˜ ์ธ์šฉ ํ…์ŠคํŠธ ์ž๋™ ์ƒ์„ฑ์„ ์œ„ํ•ด ๊ธฐ์กด์˜ ์ดˆ๋ก(abstract)๋งŒ ์‚ฌ์šฉํ•˜๋Š” ๋ฐฉ์‹ ๋Œ€์‹ , ์‹ค์ œ ์ธ์šฉ๋˜๋Š” ํŠน์ • ํ…์ŠคํŠธ ๊ตฌ๊ฐ„(Cited Text Span, CTS)์„ ํ™œ์šฉํ•˜์—ฌ ๋” ์ •ํ™•ํ•˜๊ณ  ์ถฉ์‹คํ•œ ์ธ์šฉ ์ƒ์„ฑ์ด ๊ฐ€๋Šฅํ•จ์„ ๋ณด์—ฌ์ค€๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ์›๊ฐ€(distant labeling)๋ฅผ ํ†ตํ•ด ๋Œ€๊ทœ๋ชจ CTS ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ•˜๊ณ , ์‹ค์šฉ์ ์ธ ํ‚ค์›Œ๋“œ ๊ธฐ๋ฐ˜ CTS ๊ฒ€์ƒ‰ ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•œ๋‹ค.

Motivation

Achievement

Figure 2

์›๊ฐ€ ๋ ˆ์ด๋ธ”๋ง CTS๋Š” ์ƒ์œ„ 40๊ฐœ ๋ฌธ์žฅ์—์„œ CL-SciSumm์˜ 80%, AbuRa'ed์˜ 95% ์ธ๊ฐ„ ์ฃผ์„ CTS๋ฅผ ์ปค๋ฒ„

Figure 4

์›๊ฐ€ ๋ ˆ์ด๋ธ”๋ง CTS(์‹ค์„ )๋Š” ์ธ๊ฐ„ ์ฃผ์„ CTS(์ ์„ )๋ณด๋‹ค ๋†’์€ ROUGE-L ๋ฆฌ์ฝœ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ

  1. ์›๊ฐ€ ๋ ˆ์ด๋ธ”๋ง์˜ ํšจ๊ณผ์„ฑ: ROUGE ๊ธฐ๋ฐ˜ ์›๊ฐ€ ๋ ˆ์ด๋ธ”๋ง์ด ์ธ๊ฐ„ ์ฃผ์„๊ณผ ๋น„์Šทํ•œ ์ˆ˜์ค€์˜ ์ถฉ์‹ค์„ฑ(QuestEval, ANLI ํ‰๊ฐ€)์„ ๋ณด์ด๋ฉด์„œ๋„ ๋” ๋†’์€ ํ† ํฐ ์˜ค๋ฒ„๋žฉ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค. ์ด๋Š” ํ•˜๋‚˜์˜ ์ธ์šฉ์— ๋Œ€ํ•ด ์—ฌ๋Ÿฌ ๊ฐœ์˜ ํƒ€๋‹นํ•œ CTS๊ฐ€ ์กด์žฌํ•  ์ˆ˜ ์žˆ์Œ์„ ์‹œ์‚ฌํ•œ๋‹ค.
  2. ๋‹ค์šด์ŠคํŠธ๋ฆผ ์ž‘์—… ์„ฑ๋Šฅ: ์›๊ฐ€ ๋ ˆ์ด๋ธ”๋ง CTS๋กœ ํ•™์Šตํ•œ ๋ชจ๋ธ์ด ์ธ๊ฐ„ ์ฃผ์„ CTS ๊ธฐ๋ฐ˜ ๋ชจ๋ธ๊ณผ ๋น„์Šทํ•˜๊ฑฐ๋‚˜ ๋” ์šฐ์ˆ˜ํ•œ ์ธ์šฉ ์ƒ์„ฑ ์„ฑ๋Šฅ(BLEU, METEOR, ROUGE-L)์„ ๋‹ฌ์„ฑํ–ˆ์œผ๋ฉฐ, CL-SciSumm ๋ฐ์ดํ„ฐ์…‹์—์„œ๋Š” ์˜คํžˆ๋ ค ์šฐ์›”ํ–ˆ๋‹ค.
  3. ์‹ค์šฉ์  ๊ฐ€๋Šฅ์„ฑ: ์ดˆ๋ก ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ• ๋Œ€๋น„ CTS ๊ธฐ๋ฐ˜ ์ธ์šฉ ์ƒ์„ฑ์œผ๋กœ ๋ช…๋ฐฑํžˆ ๊ฐœ์„ ๋œ ์ถฉ์‹ค์„ฑ๊ณผ ์ •ํ™•๋„๋ฅผ ์ž…์ฆํ•จ์œผ๋กœ์จ, ์ „์ฒด ๋…ผ๋ฌธ ํ…์ŠคํŠธ ๊ธฐ๋ฐ˜ ์ธ์šฉ ์ƒ์„ฑ์˜ ํƒ€๋‹น์„ฑ ํ™•๋ณดํ–ˆ๋‹ค.

How

Figure 1

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ์ธ์šฉ ์ƒ์„ฑ ์‹œ์Šคํ…œ์—์„œ ์ดˆ๋ก์˜ ํ•œ๊ณ„๋ฅผ ์ง€์ ํ•˜๊ณ  CTS ๊ธฐ๋ฐ˜ ์ ‘๊ทผ์˜ ํƒ€๋‹น์„ฑ์„ ์ฒด๊ณ„์ ์œผ๋กœ ์ž…์ฆํ•œ ๊ฐ€์น˜ ์žˆ๋Š” ์—ฐ๊ตฌ์ด๋‹ค. ์›๊ฐ€ ๋ ˆ์ด๋ธ”๋ง์œผ๋กœ ์ˆ˜์ž‘์—… ์ฃผ์„์˜ ๋ถ€๋‹ด์„ ๊ฒฝ๊ฐํ•œ ์ ์ด ์‹ค๋ฌด์  ๊ธฐ์—ฌ๋„ ํฌ๋‹ค. ๋‹ค๋งŒ ์™„์ „ ์ž๋™ํ™”๋œ CTS ๊ฒ€์ƒ‰ ์‹คํ˜„ ๋ฐ ๋Œ€๊ทœ๋ชจ ์ƒ์„ฑ ๋ชจ๋ธ๊ณผ์˜ ํ†ตํ•ฉ ๊ฒ€์ฆ์ด ๋ณด์™„๋˜๋ฉด ์˜ํ–ฅ๋ ฅ์ด ๋”์šฑ ์ฆ๋Œ€๋  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Cited text spans for citation text generation ๋…ผ๋ฌธ์€ ์ธ์šฉ๋ฌธ์žฅ ์ƒ์„ฑ์˜ ํ…์ŠคํŠธ ๋ฒ”์œ„ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ๋ฉฐ 238๋ฒˆ์˜ ์ธ์šฉ๋ฌธ์žฅ ์ œ์–ด ์ ‘๊ทผ๋ฒ•์˜ ์‚ฌ์ „ ์—ฐ๊ตฌ๋กœ ์ฐธ๊ณ ํ•  ๋งŒํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
220์€ ์ธ์šฉ ํ…์ŠคํŠธ ์ž๋™ ์ƒ์„ฑ ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•˜์—ฌ, 882 ๋…ผ๋ฌธ์—์„œ ๋‹ค๋ฃจ๋Š” ์ธ์šฉ-LLM ์ƒํ˜ธ์ž‘์šฉ์˜ ์‹ค์งˆ์  ์˜ˆ์‹œ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Benchmark for evaluation and analysis of citation recommendation์€ ์ธ์šฉ ์ถ”์ฒœ ๋ฐ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ๊ธฐ์ดˆ ๋ฐ์ดํ„ฐ๋ฅผ ์ œ๊ณต, ์ธ์šฉ ํ…์ŠคํŠธ ์ƒ์„ฑ ์‹œ์Šคํ…œ์˜ ํ‰๊ฐ€ ๊ธฐ์ค€์œผ๋กœ ํ™œ์šฉ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Citation ํ…์ŠคํŠธ ์ƒ์„ฑ๊ณผ span ์ถ”์ฒœ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๊ด€๋ จ ์—ฐ๊ตฌ๋กœ, ILCiteR์˜ ์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ์ธ์šฉ ์ถ”์ฒœ ๋ฐฉ์‹์— ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ž๋™ ํ…์ŠคํŠธ ์ƒ์„ฑ์—์„œ ์„ฑ๋ณ„ ํŽธํ–ฅ์„ ๋ถ„์„ํ•˜๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
219๋Š” ํŠน์ • ๋…ผ๋ฌธ ๋‚ด ์ง€์—ญ์ (local) ๋งฅ๋ฝ์— ๊ธฐ๋ฐ˜ํ•ด ์ธ์šฉ๋ฌธ ์ƒ์„ฑ์„ ์‹œ๋„ํ•˜์—ฌ, 220์˜ ์ธ์šฉ๊ตฌ๊ฐ„ ํ™œ์šฉ ์ž๋™ ์ธ์šฉ ์ƒ์„ฑ๋ฒ•๊ณผ ํ‰๊ฐ€ ๋Œ€์กฐ์ ์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Citebart๋Š” local citation ์ƒ์„ฑ ๋ฌธ์ œ๋ฅผ LLM ๊ธฐ๋ฐ˜ sequence generation ์ ‘๊ทผ๋ฒ•์œผ๋กœ ํ’€์–ด, 273์˜ ๊ทธ๋ž˜ํ”„ ๋งํฌ ์˜ˆ์ธก ๋ฐฉ์‹๊ณผ ์„œ๋กœ ๋ณด์™„์ ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
220 ๋…ผ๋ฌธ์€ ์ธ์šฉ ์ •๋ณด๋กœ๋ถ€ํ„ฐ ์ธ๊ณผ์„ฑ์„ ๋„์ถœํ•˜๋ ค๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ, 3142์˜ ์œ ์ „์žํ˜•-ํ‘œํ˜„ํ˜• ์ธ๊ณผ ๊ด€๊ณ„ ํ•ด์„๊ณผ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
238์€ LLM ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ๋‚ด ์ธ์šฉ๋ฌธ ์ƒ์„ฑ์˜ ์ œ์–ด๊ฐ€๋Šฅํ•œ ํ”„๋ ˆ์ด๋ฐ ์ „๋žต์„ ์ œ์•ˆํ•˜์—ฌ, 220์˜ ์‹ค์ œ ์ธ์šฉ๊ตฌ๊ฐ„ ๋ฐ์ดํ„ฐ์…‹ ์‘์šฉ์„ ๊ตฌ์ฒด์  ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ํ™•์žฅํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๊ทผ๊ฑฐ ๊ธฐ๋ฐ˜์˜ ์ง€์—ญ์  ์ธ์šฉ ์ถ”์ฒœ ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ์— ์‹ค์ œ ์ ์šฉ๋œ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
SurveyX๋Š” ๋Œ€๊ทœ๋ชจ scholarly writing ์ž๋™ํ™” ์‹คํ—˜์„ ํ†ตํ•ด ์ธ์šฉ ํ…์ŠคํŠธ ์ƒ์„ฑ ๋“ฑ LLM ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ์ž‘์„ฑ ์ „์ฒด ๊ณผ์ •๊นŒ์ง€ ์ ์šฉ ๋ฒ”์œ„๋ฅผ ํ™•์žฅํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •