Benchmark for evaluation and analysis of citation recommendation models

์ €์ž: Puja Maharjan | ๋‚ ์งœ: 2024 | DOI: N/A 📄 PDF


Essence

Figure 3

Figure 3: Data distribution of papers according to various

๋ณธ ๋…ผ๋ฌธ์€ citation recommendation ๋ชจ๋ธ๋“ค์„ ์ฒด๊ณ„์ ์œผ๋กœ ํ‰๊ฐ€ํ•˜๊ณ  ๋น„๊ตํ•˜๊ธฐ ์œ„ํ•œ standardized benchmark๋ฅผ ์ œ์•ˆํ•œ๋‹ค. S2ORC์™€ S2AG ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ๋ถ€ํ„ฐ ์ƒ์„ฑ๋œ diagnostic dataset์„ ํ†ตํ•ด local citation recommendation ์‹œ์Šคํ…œ์˜ ์„ฑ๋Šฅ์„ ๋‹ค์–‘ํ•œ ๋ฉ”ํŠธ๋ฆญ์œผ๋กœ ํ‰๊ฐ€ํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•œ๋‹ค.

Motivation

Achievement

Figure 5

Figure 5: Citation count distribution based on fields, where

How

Figure 2

Figure 2: Combined preceding POS of the citation.

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ citation recommendation ๋ถ„์•ผ์—์„œ ์˜ค๋žซ๋™์•ˆ ํ•„์š”๋กœ ํ–ˆ๋˜ ํ‘œ์ค€ํ™”๋œ benchmark๋ฅผ ์ œ์•ˆํ•œ๋‹ค๋Š” ์ ์—์„œ ์˜๋ฏธ๊ฐ€ ์žˆ์œผ๋‚˜, diagnostic dataset์˜ ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ์€ ์ œ์‹œํ•˜๊ณ  ์žˆ์œผ๋‚˜ ์‹ค์ œ ์—ฌ๋Ÿฌ ๋ชจ๋ธ์— ๋Œ€ํ•œ ๋ฒค์น˜๋งˆํฌ ๊ฒฐ๊ณผ๊ฐ€ ๋ถ€์กฑํ•˜์—ฌ ๊ทธ ์œ ์šฉ์„ฑ์„ ์‹ค์ฆํ•˜์ง€ ๋ชปํ•˜๊ณ  ์žˆ๋‹ค. ์ถ”๊ฐ€์ ์œผ๋กœ global๊ณผ local ๋ฐฉ๋ฒ•์˜ ํ†ตํ•ฉ ํ‰๊ฐ€ ๋ฐ ๋” ๋‹ค์–‘ํ•œ ๋ชจ๋ธ์— ๋Œ€ํ•œ ์„ฑ๋Šฅ ๋น„๊ต๊ฐ€ ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
When large language models meet citation ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์ธ์šฉ ๋ฌธ์ œ์— ๋Œ€ํ•œ ์„œ๋ฒ ์ด๋กœ์„œ, ์ธ์šฉ ์ถ”์ฒœ ์‹œ์Šคํ…œ์˜ ํ‰๊ฐ€ ๊ธฐ์ค€์„ ์ด๋ก ์ ์œผ๋กœ ๋’ท๋ฐ›์นจํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Benchmark for evaluation and analysis of citation recommendation์€ ์ธ์šฉ ์ถ”์ฒœ ๋ฐ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ๊ธฐ์ดˆ ๋ฐ์ดํ„ฐ๋ฅผ ์ œ๊ณต, ์ธ์šฉ ํ…์ŠคํŠธ ์ƒ์„ฑ ์‹œ์Šคํ…œ์˜ ํ‰๊ฐ€ ๊ธฐ์ค€์œผ๋กœ ํ™œ์šฉ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
219 ๋…ผ๋ฌธ์€ local citation generation์„ ํ•™์Šตํ•˜๋Š” ๊ธฐ๋ฐ˜ ๋ชจ๋ธ๋กœ, 150์˜ ์ธ์šฉ ์ถ”์ฒœ ์‹œ์Šคํ…œ ํ‰๊ฐ€ ์ง€์นจ ์„ค์ •์— ์ฐธ๊ณ ๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Benchmark for evaluation and analysis of citation recommendation(150)์€ ์ธ์šฉ ์ถ”์ฒœ ์„ฑ๋Šฅ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, 420์˜ ํ‰๊ฐ€ ์ฒด๊ณ„ ์„ค๊ณ„์— ๊ธฐ์ดˆ๋กœ ํ™œ์šฉ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ธ์šฉ ๋„คํŠธ์›Œํฌ ๋ฐ citation recommendation task์—์„œ taxonomy/๊ณ„์ธต์  ๊ตฌ์กฐ ๋ถ„์„์€ 150๋ฒˆ ๋…ผ๋ฌธ์˜ ์ฃผ์š” ์—ฐ๊ตฌ ์˜์—ญ์ž…๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ธ์šฉ ๋ฌธ์žฅ ์ƒ์„ฑ์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ•™์ˆ  ๋ฌธํ—Œ ๊ฒ€์ƒ‰ ๋ฐ ์ธ์šฉ ์ถ”์ฒœ์˜ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ธ์šฉ ์ถ”์ฒœ ์‹œ์Šคํ…œ์˜ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก ์„ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
150๋ฒˆ ๋…ผ๋ฌธ์€ citation recommendation task๋ฅผ ์œ„ํ•œ ํ‰๊ฐ€ ๋ฐ ๋ฒค์น˜๋งˆํฌ ๊ตฌ์ถ•๋ฒ•์— ์ดˆ์ ์„ ๋งž์ถ”์–ด, 702์™€ ๋ฌธ์ œ ์ ‘๊ทผ๋ฒ•์ด ๋‹ค๋ฆ…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋…ผ๋ฌธ ์ธ์šฉ ๋„คํŠธ์›Œํฌ ๋ถ„์„ ๋˜๋Š” ์ถ”์ฒœ ์‹œ์Šคํ…œ์˜ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ธ์šฉ ์ถ”์ฒœ ๋ฒค์น˜๋งˆํฌ ๋˜๋Š” ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ์˜ ์œ ์‚ฌํ•œ ์ ‘๊ทผ ๋ฐฉ์‹์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
OARelatedWork๋Š” citation-related section ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ, 150์˜ ์ธ์šฉ์ถ”์ฒœ ๋ฒค์น˜๋งˆํฌ ์„ค๊ณ„์—์„œ ์‹ค์ œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์‹ค์งˆ์  ๋ฐ์ดํ„ฐ์™€ ์‘์šฉ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Benchmark for evaluation and analysis of citation recommendations ๋…ผ๋ฌธ์€ ๋‹ค์–‘ํ•œ ์ธ์šฉ ๋ถ„๋ฅ˜์™€ ์ถ”์ฒœ ํƒœ์Šคํฌ์˜ ๋ฒค์น˜๋งˆํฌ๋กœ ์‹ค์ œ ํ‰๊ฐ€ ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์‹ฌ์‚ฌ ๋ฐฐ์ • ๋ฐ ์ธ์šฉ์ถ”์ฒœ์˜ ๊ณต์ •์„ฑ, ๋ฉ”ํŠธ๋ฆญ ์ผ๊ด€์„ฑ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ค„ 870๋ฒˆ ๋…ผ๋ฌธ์˜ MLํ•™ํšŒ ์‹ฌ์‚ฌ์‹œ์Šคํ…œ ์ทจ์•ฝ์„ฑ ๋ฌธ์ œ์™€ ์ง์ ‘์ ์œผ๋กœ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
579 ๋…ผ๋ฌธ์€ ๋ฏธ๊ตญ NSF ๋ฐ์ดํ„ฐ์—์„œ ๊ณผํ•™์  ์ธ์šฉ ๋„คํŠธ์›Œํฌ๋ฅผ ์ถ”์ถœ ๋ฐ ๋ถ„์„ํ•˜๋ฉฐ, 150์˜ ์ธ์šฉ ์ถ”์ฒœ ๋ฒค์น˜๋งˆํฌ ํ™œ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ๋ฐ์ดํ„ฐ ์Šค์ผ€์ผ์—์„œ ํ™•์žฅํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Scirgc ๋…ผ๋ฌธ์€ ๋‹ค์–‘ํ•œ ์ธ์šฉ ์ถ”์ฒœ ๋ฐ ์ธ์šฉ ๊ฐ•๊ฑด์„ฑ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•˜์—ฌ ์ธ์šฉ๋ฌธํ—Œ ์ถ”์ฒœ ๋ฒค์น˜๋งˆํฌ ์—ฐ๊ตฌ๋ฅผ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Benchmark for evaluation and analysis of citation recommenda ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์ฐฝ์˜ ๋ถ„์•ผ ํ‰๊ฐ€ ๋ฐ ์ถ”์ฒœ ๋ฌธ์ œ์— ์ดˆ์ ์„ ๋งž์ถ”์–ด, ์ฐฝ์ž‘ ๋„๊ตฌ์˜ ์„ฑ๋Šฅ ํ‰๊ฐ€ ์ง€์ ๊ณผ ์ด์–ด์ง„๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์ธ์šฉ์ถ”์ฒœ, ์‹ฌ์‚ฌ ๋ฐฐ์ •, reviewer-author ๊ฐ„ ์ธ์šฉ ํŒจํ„ด ๋“ฑ ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ์˜ ์‹ค์งˆ์  ์ทจ์•ฝ์„ฑ ๋ฐ ์กฐ์ž‘ ๋ฆฌ์Šคํฌ ๋…ผ์˜๋ฅผ ํ™•๋Œ€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •