์ ์: Kalp Pandya, Khushi Shah, Nirmal Shah, N. Shah, Bhaskar Chaudhury | ๋ ์ง: 2026 | DOI: 10.48550/arXiv.2602.07664 📄 PDF
Figure 1: Overview of the data processing pipeline used to assess the scholarly impact
LXCat ์คํ์ก์ธ์ค ํ๋ซํผ์ ์ ์จ ํ๋ผ์ฆ๋ง ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ์ ๋ํ ์ํฅ์ NLP ๊ธฐ๋ฐ ์ ๋ฌธ ํ ์คํธ scientometrics๋ก ์ฒด๊ณ์ ์ผ๋ก ์ ๋ํํ ์ฐ๊ตฌ์ด๋ค. ์ธ์ฉ ์๋ฅผ ๋์ด ๋ฐ์ดํฐ ์ฌ์ฉ ํจํด, ํํ ๋ฌผ์ง, ๋ฐ์ดํฐ๋ฒ ์ด์ค ํ์ฉ๋, ์ฃผ์ ์งํ ๋ฑ์ ์ถ์ถํ๋ ๋๋ฉ์ธ ์ค๋ฆฝ์ ์ด๊ณ ์ด์ ๊ฐ๋ฅํ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค.
Figure 2:
Figure 3: Overview of the database mention extraction pipeline. Starting from plain
์ดํ: ๋ณธ ์ฐ๊ตฌ๋ ์ธ์ฉ ๊ธฐ๋ฐ scientometrics์ ํ๊ณ๋ฅผ NLP ๊ธฐ๋ฐ full-text ๋ถ์์ผ๋ก ๊ทน๋ณตํ ์ ๋์ ์ฌ๋ก๋ก, ORI ์ธํ๋ผ์ ์ค์ง์ ์ํฅ์ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ํํ๋ ๋๋ฉ์ธ ์ค๋ฆฝ์ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. ์คํ์์ค ๊ณต๊ฐ์ ๋์ ์ด์ ๊ฐ๋ฅ์ฑ์ผ๋ก ํฅํ ์คํ ์ฌ์ด์ธ์ค ์ ์ฑ ์๋ฆฝ ๋ฐ ์ธํ๋ผ ํ๊ฐ์ ์ค์ง์ ๊ธฐ์ฌํ ๊ฒ์ผ๋ก ๊ธฐ๋๋๋ค.