Essence
Figure 3: Data distribution of papers according to various
๋ณธ ๋
ผ๋ฌธ์ citation recommendation ๋ชจ๋ธ๋ค์ ์ฒด๊ณ์ ์ผ๋ก ํ๊ฐํ๊ณ ๋น๊ตํ๊ธฐ ์ํ standardized benchmark๋ฅผ ์ ์ํ๋ค. S2ORC์ S2AG ๋ฐ์ดํฐ์
์ผ๋ก๋ถํฐ ์์ฑ๋ diagnostic dataset์ ํตํด local citation recommendation ์์คํ
์ ์ฑ๋ฅ์ ๋ค์ํ ๋ฉํธ๋ฆญ์ผ๋ก ํ๊ฐํ๋ ๊ฒ์ ๋ชฉํ๋ก ํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ citation recommendation ๋ถ์ผ์์ ์ค๋ซ๋์ ํ์๋ก ํ๋ ํ์คํ๋ benchmark๋ฅผ ์ ์ํ๋ค๋ ์ ์์ ์๋ฏธ๊ฐ ์์ผ๋, diagnostic dataset์ ์์ฑ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๊ณ ์์ผ๋ ์ค์ ์ฌ๋ฌ ๋ชจ๋ธ์ ๋ํ ๋ฒค์น๋งํฌ ๊ฒฐ๊ณผ๊ฐ ๋ถ์กฑํ์ฌ ๊ทธ ์ ์ฉ์ฑ์ ์ค์ฆํ์ง ๋ชปํ๊ณ ์๋ค. ์ถ๊ฐ์ ์ผ๋ก global๊ณผ local ๋ฐฉ๋ฒ์ ํตํฉ ํ๊ฐ ๋ฐ ๋ ๋ค์ํ ๋ชจ๋ธ์ ๋ํ ์ฑ๋ฅ ๋น๊ต๊ฐ ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
When large language models meet citation ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์ธ์ฉ ๋ฌธ์ ์ ๋ํ ์๋ฒ ์ด๋ก์, ์ธ์ฉ ์ถ์ฒ ์์คํ
์ ํ๊ฐ ๊ธฐ์ค์ ์ด๋ก ์ ์ผ๋ก ๋ท๋ฐ์นจํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Benchmark for evaluation and analysis of citation recommendation์ ์ธ์ฉ ์ถ์ฒ ๋ฐ ํ๊ฐ๋ฅผ ์ํ ๊ธฐ์ด ๋ฐ์ดํฐ๋ฅผ ์ ๊ณต, ์ธ์ฉ ํ
์คํธ ์์ฑ ์์คํ
์ ํ๊ฐ ๊ธฐ์ค์ผ๋ก ํ์ฉ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
219 ๋
ผ๋ฌธ์ local citation generation์ ํ์ตํ๋ ๊ธฐ๋ฐ ๋ชจ๋ธ๋ก, 150์ ์ธ์ฉ ์ถ์ฒ ์์คํ
ํ๊ฐ ์ง์นจ ์ค์ ์ ์ฐธ๊ณ ๊ฐ ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Benchmark for evaluation and analysis of citation recommendation(150)์ ์ธ์ฉ ์ถ์ฒ ์ฑ๋ฅ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ๋ฉฐ, 420์ ํ๊ฐ ์ฒด๊ณ ์ค๊ณ์ ๊ธฐ์ด๋ก ํ์ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ธ์ฉ ๋คํธ์ํฌ ๋ฐ citation recommendation task์์ taxonomy/๊ณ์ธต์ ๊ตฌ์กฐ ๋ถ์์ 150๋ฒ ๋
ผ๋ฌธ์ ์ฃผ์ ์ฐ๊ตฌ ์์ญ์
๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ธ์ฉ ๋ฌธ์ฅ ์์ฑ์ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ์ ๋ฌธํ ๊ฒ์ ๋ฐ ์ธ์ฉ ์ถ์ฒ์ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ธ์ฉ ์ถ์ฒ ์์คํ
์ ํ๊ฐ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
150๋ฒ ๋
ผ๋ฌธ์ citation recommendation task๋ฅผ ์ํ ํ๊ฐ ๋ฐ ๋ฒค์น๋งํฌ ๊ตฌ์ถ๋ฒ์ ์ด์ ์ ๋ง์ถ์ด, 702์ ๋ฌธ์ ์ ๊ทผ๋ฒ์ด ๋ค๋ฆ
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋
ผ๋ฌธ ์ธ์ฉ ๋คํธ์ํฌ ๋ถ์ ๋๋ ์ถ์ฒ ์์คํ
์ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ธ์ฉ ์ถ์ฒ ๋ฒค์น๋งํฌ ๋๋ ํ๊ฐ ๋ฉํธ๋ฆญ์ ์ ์ฌํ ์ ๊ทผ ๋ฐฉ์์ด๋ค.
ํ์ ์ฐ๊ตฌ
OARelatedWork๋ citation-related section ๋ฐ์ดํฐ์
์ผ๋ก, 150์ ์ธ์ฉ์ถ์ฒ ๋ฒค์น๋งํฌ ์ค๊ณ์์ ์ค์ ์ฌ์ฉํ ์ ์๋ ์ค์ง์ ๋ฐ์ดํฐ์ ์์ฉ ์ฌ๋ก๋ฅผ ์ ๊ณตํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Benchmark for evaluation and analysis of citation recommendations ๋
ผ๋ฌธ์ ๋ค์ํ ์ธ์ฉ ๋ถ๋ฅ์ ์ถ์ฒ ํ์คํฌ์ ๋ฒค์น๋งํฌ๋ก ์ค์ ํ๊ฐ ๋ฐฉํฅ์ ์ ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์ฌ์ฌ ๋ฐฐ์ ๋ฐ ์ธ์ฉ์ถ์ฒ์ ๊ณต์ ์ฑ, ๋ฉํธ๋ฆญ ์ผ๊ด์ฑ ๋ฌธ์ ๋ฅผ ๋ค๋ค 870๋ฒ ๋
ผ๋ฌธ์ MLํํ ์ฌ์ฌ์์คํ
์ทจ์ฝ์ฑ ๋ฌธ์ ์ ์ง์ ์ ์ผ๋ก ์ฐ๊ฒฐ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
579 ๋
ผ๋ฌธ์ ๋ฏธ๊ตญ NSF ๋ฐ์ดํฐ์์ ๊ณผํ์ ์ธ์ฉ ๋คํธ์ํฌ๋ฅผ ์ถ์ถ ๋ฐ ๋ถ์ํ๋ฉฐ, 150์ ์ธ์ฉ ์ถ์ฒ ๋ฒค์น๋งํฌ ํ์ฉ ๊ฐ๋ฅ์ฑ์ ๋ฐ์ดํฐ ์ค์ผ์ผ์์ ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
Scirgc ๋
ผ๋ฌธ์ ๋ค์ํ ์ธ์ฉ ์ถ์ฒ ๋ฐ ์ธ์ฉ ๊ฐ๊ฑด์ฑ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ์ฌ ์ธ์ฉ๋ฌธํ ์ถ์ฒ ๋ฒค์น๋งํฌ ์ฐ๊ตฌ๋ฅผ ํ์ฅํฉ๋๋ค.
์์ฉ ์ฌ๋ก
Benchmark for evaluation and analysis of citation recommenda ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์ฐฝ์ ๋ถ์ผ ํ๊ฐ ๋ฐ ์ถ์ฒ ๋ฌธ์ ์ ์ด์ ์ ๋ง์ถ์ด, ์ฐฝ์ ๋๊ตฌ์ ์ฑ๋ฅ ํ๊ฐ ์ง์ ๊ณผ ์ด์ด์ง๋ค.
์์ฉ ์ฌ๋ก
์ธ์ฉ์ถ์ฒ, ์ฌ์ฌ ๋ฐฐ์ , reviewer-author ๊ฐ ์ธ์ฉ ํจํด ๋ฑ ํ๊ฐ ๋ฉํธ๋ฆญ์ ์ค์ง์ ์ทจ์ฝ์ฑ ๋ฐ ์กฐ์ ๋ฆฌ์คํฌ ๋
ผ์๋ฅผ ํ๋ํ ์ ์์ต๋๋ค.