ILCiteR: Evidence-grounded interpretable local citation recommendation

์ €์ž: Sayar Ghosh Roy, Jiawei Han | ๋‚ ์งœ: 2024 | DOI: ๋ฏธ์ œ๊ณต 📄 PDF


Essence

๋ณธ ๋…ผ๋ฌธ์€ ํ•™์ˆ  ๋…ผ๋ฌธ ์ธ์šฉ ์ถ”์ฒœ ์ž‘์—…์— ํ•ด์„๊ฐ€๋Šฅ์„ฑ(interpretability)์„ ๋„์ž…ํ•˜๊ธฐ ์œ„ํ•ด, ์ฟผ๋ฆฌ(claim ๋˜๋Š” entity mention)์— ๋Œ€ํ•ด ์ธ์šฉํ•  ๋…ผ๋ฌธ์„ ์ถ”์ฒœํ•  ๋•Œ ๊ธฐ์กด ๋ฌธํ—Œ์—์„œ ์ถ”์ถœํ•œ ์œ ์‚ฌํ•œ ์ฆ๊ฑฐ ์ŠคํŒฌ(evidence span)์„ ๊ทผ๊ฑฐ๋กœ ์ œ์‹œํ•˜๋Š” ์ƒˆ๋กœ์šด ์ ‘๊ทผ๋ฐฉ์‹ ILCiteR์„ ์ œ์•ˆํ•œ๋‹ค.

Motivation

Achievement

  1. ์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ๋กœ์ปฌ ์ธ์šฉ ์ถ”์ฒœ ์ž‘์—… ์ •์˜: ๊ธฐ์กด์˜ ์ง์ ‘์  ๋งคํ•‘ ๋ฐฉ์‹์—์„œ ๋ฒ—์–ด๋‚˜ ์ฆ๊ฑฐ ์ŠคํŒฌ์„ ๋งค๊ฐœ๋ณ€์ˆ˜๋กœ ํ•˜๋Š” ์ƒˆ๋กœ์šด ๋ฌธ์ œ ์ •์˜๋ฅผ ๋„์ž…ํ•˜์—ฌ ๋ชจ๋“  ์ถ”์ฒœ์ด ๊ตฌ์ฒด์ ์ธ ๊ทผ๊ฑฐ๋ฅผ ๊ฐ–๋„๋ก ํ•จ.
  2. ๋Œ€๊ทœ๋ชจ ์ฆ๊ฑฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๊ตฌ์ถ•: Computer Science ๋ถ„์•ผ์˜ 3๊ฐ€์ง€ ์ฃผ์š” ์ฃผ์ œ(NER, SUMM, MT)์— ๋Œ€ํ•ด 200,000๊ฐœ ์ด์ƒ์˜ ๊ณ ์œ ํ•œ ์ฆ๊ฑฐ ์ŠคํŒฌ๊ณผ ์ธ์šฉ ๋…ผ๋ฌธ ์Œ์„ ํฌํ•จํ•˜๋Š” ๋ฐ์ดํ„ฐ์…‹ ๊ฐœ๋ฐœ (NER: 23,803๊ฐœ, SUMM: 79,345๊ฐœ, MT: 108,692๊ฐœ ์ŠคํŒฌ).
  3. ํ•™์Šต ์—†๋Š” ์ถ”์ฒœ ์‹œ์Šคํ…œ: ์›๊ฑฐ๋ฆฌ ๊ฐ์‹œ(distant supervision) ํ•™์Šต ๋ฐฉ์‹๊ณผ ์‚ฌ์ „ํ•™์Šต๋œ Transformer ์–ธ์–ด๋ชจ๋ธ์„ ํ™œ์šฉํ•˜์—ฌ ๋ช…์‹œ์ ์ธ ๋ชจ๋ธ ํ•™์Šต ์—†์ด ๋™์ž‘ํ•˜๋ฏ€๋กœ ๋…ผ๋ฌธ ํ’€ ์—…๋ฐ์ดํŠธ ์‹œ ์žฌํ•™์Šต์ด ๋ถˆํ•„์š”.
  4. ์กฐ๊ฑด๋ถ€ ์‹ ๊ฒฝ ์ˆœ์œ„ ์•™์ƒ๋ธ”: ์–ดํœ˜ ์œ ์‚ฌ์„ฑ๊ณผ ์˜๋ฏธ์  ์œ ์‚ฌ์„ฑ์„ ๊ฒฐํ•ฉํ•œ ์ˆœ์œ„ ์žฌ์ •๋ ฌ ๋ฐฉ์‹์ด ์ˆœ์ˆ˜ ๋ ‰์‹œ์ปฌ/์‹œ๋งจํ‹ฑ ๊ฒ€์ƒ‰ ๋ฐ ๋‹จ์ˆœ ์•™์ƒ๋ธ”๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ.

How

Figure 3

์กฐ๊ฑด๋ถ€ ์‹ ๊ฒฝ ์ˆœ์œ„ ์•™์ƒ๋ธ”: ์—ฌ๋Ÿฌ ์œ ์‚ฌ๋„ ์ ์ˆ˜๋ฅผ ๊ฒฐํ•ฉํ•˜์—ฌ ์ฆ๊ฑฐ ์ŠคํŒฌ ์žฌ์ˆœ์œ„ํ™”

์ฆ๊ฑฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๊ตฌ์ถ• (Section 5):

2๋‹จ๊ณ„ ์žฌ์ˆœ์œ„ํ™” ํ”„๋กœ์„ธ์Šค (Section 6):

  1. ์ฆ๊ฑฐ ์ŠคํŒฌ ์žฌ์ˆœ์œ„ํ™”:
    • ์–ดํœ˜ ์œ ์‚ฌ๋„(BM25)๋กœ m๊ฐœ์˜ ํ›„๋ณด ์ฆ๊ฑฐ ์ŠคํŒฌ ์‚ฌ์ „ ๋กœ๋”ฉ
    • ์กฐ๊ฑด๋ถ€ ์‹ ๊ฒฝ ์ˆœ์œ„ ์•™์ƒ๋ธ”์„ ์ด์šฉํ•ด ์‹œ๋งจํ‹ฑ ์œ ์‚ฌ๋„(SBERT ์ž„๋ฒ ๋”ฉ)์™€ ์–ดํœ˜ ์œ ์‚ฌ๋„ ๊ฒฐํ•ฉ
  2. ๋…ผ๋ฌธ ์ˆœ์œ„ํ™”:
    • ์„ ํƒ๋œ ์ฆ๊ฑฐ ์ŠคํŒฌ๋“ค๊ณผ ์—ฐ๊ด€๋œ ๋ชจ๋“  ๋…ผ๋ฌธ ํ›„๋ณด ์ถ”์ถœ
    • ๊ฐ ๋…ผ๋ฌธ์— ๋Œ€ํ•ด: (1) ์ตœ์  ๊ด€๋ จ ์ฆ๊ฑฐ ์ŠคํŒฌ์˜ ์ˆœ์œ„, (2) ๋ˆ„์  support ์ˆ˜, (3) ์ถœํŒ ์—ฐ๋„(์ตœ์‹ ์„ฑ)๋ฅผ ์ข…ํ•ฉ ๊ณ ๋ คํ•˜์—ฌ ์ตœ์ข… ์ˆœ์œ„ ๊ฒฐ์ •

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ํ•™์ˆ  ๋…ผ๋ฌธ ์ธ์šฉ ์ถ”์ฒœ์— ํ•ด์„๊ฐ€๋Šฅ์„ฑ์ด๋ผ๋Š” ์ค‘์š”ํ•œ ์ฐจ์›์„ ๋„์ž…ํ•œ ์˜๋ฏธ ์žˆ๋Š” ์—ฐ๊ตฌ๋กœ, ์›๊ฑฐ๋ฆฌ ๊ฐ์‹œ ๊ธฐ๋ฐ˜์˜ ์‹ค์šฉ์  ์„ค๊ณ„์™€ ๋Œ€๊ทœ๋ชจ ์ฆ๊ฑฐ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•์ด ์žฅ์ ์ด๋‹ค. ๋‹ค๋งŒ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก ์˜ ์ƒ์„ธ ์ œ์‹œ์™€ ์‹ค์ œ ์‚ฌ์šฉ์ž ์—ฐ๊ตฌ๋ฅผ ํ†ตํ•œ ํ•ด์„๊ฐ€๋Šฅ์„ฑ ๊ฒ€์ฆ์ด ์ด๋ฃจ์–ด์ง„๋‹ค๋ฉด ๋”์šฑ ๊ฐ•๋ ฅํ•œ ๋…ผ๋ฌธ์ด ๋  ์ˆ˜ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Citation ํ…์ŠคํŠธ ์ƒ์„ฑ๊ณผ span ์ถ”์ฒœ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๊ด€๋ จ ์—ฐ๊ตฌ๋กœ, ILCiteR์˜ ์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ์ธ์šฉ ์ถ”์ฒœ ๋ฐฉ์‹์— ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
CiteBART ๋“ฑ LLM ๊ธฐ๋ฐ˜ ์ธ์šฉ ์ƒ์„ฑ ํ•™์Šต ๋ชจ๋ธ ์—ฐ๊ตฌ๋Š” ํ•ด์„๊ฐ€๋Šฅํ•œ ์ธ์šฉ ์ถ”์ฒœ์˜ ๊ธฐ๋ฐ˜ ๊ธฐ์ˆ ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Benchmark for evaluation and analysis of citation recommendation(150)์€ ์ธ์šฉ ์ถ”์ฒœ ์„ฑ๋Šฅ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, 420์˜ ํ‰๊ฐ€ ์ฒด๊ณ„ ์„ค๊ณ„์— ๊ธฐ์ดˆ๋กœ ํ™œ์šฉ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
420์€ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ํ‘œํ˜„ ํ•™์Šต์ด๋‚˜ ํ˜‘๋ ฅ ๋„คํŠธ์›Œํฌ ๋ชจ๋ธ๋ง์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜์—ฌ hypergraph VAE ์„ค๊ณ„์— ํ™œ์šฉ๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋…ผ๋ฌธ ๊ธฐ๋ฐ˜ ์งˆ์˜์‘๋‹ต ๋ฐ ํƒ์ƒ‰์  ๋ฆฌ๋ทฐ ์ƒ์„ฑ agent ์—ฐ๊ตฌ์™€ ์—ฐ๊ฒฐ, citation recommendation๊ณผ ์ž๋™ํ™”๋œ ๋ฆฌ๋ทฐ ์‹œ์Šคํ…œ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ILCiteR ๋…ผ๋ฌธ์€ ๋…ผ๋ฌธ ์ธ์šฉ ์ถ”์ฒœ์„ ํ•ด์„๊ฐ€๋Šฅ์„ฑ๊ณผ ๊ทผ๊ฑฐ ์œ„์ฃผ๋กœ ์ˆ˜ํ–‰ํ•˜๋ฉฐ, HLM-Cite์—์„œ ์ œ๊ธฐ๋œ ์ธ์šฉ ๊ตฌ๋ถ„ ๋ฌธ์ œ์˜ ๋‹ค์–‘ํ•œ ํ•ด๊ฒฐ์ฑ…์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
420๋ฒˆ ๋…ผ๋ฌธ์€ ๊ทผ๊ฑฐ ๊ธฐ๋ฐ˜ ์ธ์šฉ ์ถ”์ฒœ ๋ฐ ํ•ด์„ ๊ฐ€๋Šฅ ํ˜„์ง€ ์ธ์šฉ ์ƒ์„ฑ ๋ชจ๋ธ(ILCiteR)์„ ๋‹ค๋ฃจ์–ด, 219๋ฒˆ CiteBART์™€ ๋™์ผ ๋ฌธ์ œ์— ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ฐœ์ธํ™”๋œ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์ธ์šฉ ์ถ”์ฒœ ๋ฐ evidence span ๋งคํ•‘์˜ LLM ํ™œ์šฉ ์‚ฌ๋ก€๋ฅผ ํ†ตํ•ด, ILCiteR๊ณผ ์ƒ์ดํ•œ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ธ์šฉ ์ถ”์ฒœ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ์ ‘๊ทผํ•˜๋Š” ๋Œ€์•ˆ์  ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ธ์šฉ ์ถ”์ฒœ ์‹œ์Šคํ…œ์„ ๋‹ค๋ฅธ ๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜๋กœ ๊ตฌํ˜„ํ•œ ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
CiteCheck๊ฐ€ ์ธ์šฉ ์˜ค๋ฅ˜ ํƒ์ง€์— ์ง‘์ค‘ํ•˜๋Š” ๋ฐ˜๋ฉด, ILCiteR์€ ์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ํ•ด์„๊ฐ€๋Šฅ ์ถ”์ฒœ์„ ๋ชฉํ‘œ๋กœ ํ•˜์—ฌ ์ธ์šฉ ์ž๋™ํ™”์˜ ์ƒํ˜ธ๋ณด์™„์  ์ ‘๊ทผ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋‹ค์ค‘ ๊ทธ๋ ˆ์ด๋„ˆ์ง€๋กœ ์ธ์šฉ ์ถ”์ฒœ๊ณผ ์ธ์šฉ ์ด์œ  ์ƒ์„ฑ์˜ ํ†ตํ•ฉ์  ๊ด€์ ์—์„œ, 420์—์„œ ์ œ์•ˆ๋œ ํ•ด์„๊ฐ€๋Šฅํ•œ ์ง€์—ญ ์ธ์šฉ ์ถ”์ฒœ ๊ธฐ๋ฒ•์„ ์ฒด๊ณ„์ ์œผ๋กœ ํ™•์žฅํ•œ ์ตœ์‹  ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Interesting Scientific Idea Generation using Knowledge Graph(434)์€ ์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ์ถ”์ฒœ ์ ‘๊ทผ์„ ํ™•์žฅํ•˜์—ฌ, 420์—์„œ ์ œ์•ˆํ•œ ์ฆ๊ฑฐ ์ค‘์‹ฌ ์ธ์šฉ ์ถ”์ฒœ์˜ ํ•™์ˆ ์  ํ™œ์šฉ๋„๋ฅผ ๋ณด์—ฌ์ค€๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๊ทผ๊ฑฐ ๊ธฐ๋ฐ˜์˜ ์ง€์—ญ์  ์ธ์šฉ ์ถ”์ฒœ ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ์— ์‹ค์ œ ์ ์šฉ๋œ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •