CS-KG 2.0: A Large-scale Knowledge Graph of Computer Science

์ €์ž: Danilo Dessรญ, Francesco Osborne, Davide Buscaldi, Diego Reforgiato Recupero, Enrico Motta | ๋‚ ์งœ: 2025-06-09 | DOI: 10.1038/s41597-025-05200-8 📄 PDF


Essence

Figure 1

Fig. 1โ€‚ The modules used to create our resource from the SCICERO52 pipeline.

150๋งŒ ๊ฐœ์˜ ์ปดํ“จํ„ฐ๊ณผํ•™ ๋…ผ๋ฌธ์—์„œ ์ž๋™ ์ถ”์ถœํ•œ 2,500๋งŒ ๊ฐœ ์—”ํ‹ฐํ‹ฐ์™€ 6,700๋งŒ ๊ฐœ ๊ด€๊ณ„๋กœ ๊ตฌ์„ฑ๋œ CS-KG 2.0 ์ง€์‹๊ทธ๋ž˜ํ”„๋ฅผ ์ œ์‹œํ•˜๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ์—ฐ๊ตฌ ํŠธ๋ Œ๋“œ ๋ถ„์„, ๊ฐ€์„ค ์ƒ์„ฑ, ์ง€๋Šฅํ˜• ๋ฌธํ—Œ ๊ฒ€์ƒ‰ ๋“ฑ์„ ์ง€์›ํ•œ๋‹ค.

Motivation

Achievement

Figure 2

Fig. 2โ€‚ The distribution of the entities across the classes Method, Task, Material, Metric, and OtherEntity.

How

Figure 1

Fig. 1โ€‚ The modules used to create our resource from the SCICERO52 pipeline.

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: CS-KG 2.0์€ ์ž๋™ํ™”๋œ ๋Œ€๊ทœ๋ชจ ํ•™์ˆ  ์ง€์‹๊ทธ๋ž˜ํ”„๋กœ์„œ ๊ธฐ์กด์˜ ํ•œ๊ณ„๋ฅผ ์ƒ๋‹น ๋ถ€๋ถ„ ๊ทน๋ณตํ•˜์˜€์œผ๋ฉฐ, OpenAlex ๊ธฐ๋ฐ˜์˜ ์ง€์† ๊ฐ€๋Šฅํ•œ ์ธํ”„๋ผ์™€ ์‹œ๊ฐ„ ์ •๋ณด ํ†ตํ•ฉ์„ ํ†ตํ•ด ํ•™์ˆ  ๋ฌธํ—Œ ๋ถ„์„ ์—ฐ๊ตฌ์— ํ˜์‹ ์ ์ธ ์ž์›์„ ์ œ๊ณตํ•œ๋‹ค. ๋‹ค๋งŒ ์‹œ๊ฐ„ ๋ฒ”์œ„์™€ ํ•™๋ฌธ ๋ถ„์•ผ ์ œํ•œ, ์ž๋™ ์ถ”์ถœ์˜ ์ •ํ™•์„ฑ ๊ฐœ์„ ์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Œ€๊ทœ๋ชจ ํ•™์ˆ  ์ฝ”ํผ์Šค ๊ตฌ์ถ•์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Œ€๊ทœ๋ชจ ์ง€์‹๊ทธ๋ž˜ํ”„๋ฅผ ๊ตฌ์ถ•ํ•˜์—ฌ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋ฐœ๊ฒฌ์˜ ์ง€์‹ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
CS-KG 2.0 ์ง€์‹๊ทธ๋ž˜ํ”„๊ฐ€ GoAI์˜ ๊ต์œก์šฉ ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ตฌ์ถ•์˜ ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ๋กœ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์ง€์‹ ์ฒ˜๋ฆฌ ๊ธฐ์ˆ ์˜ ๊ธฐ๋ฐ˜์ด ๋˜๋Š” ๋ฐฉ๋ฒ•๋ก ์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ปดํ“จํ„ฐ๊ณผํ•™ ์—ฐ๊ตฌ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ตฌ์ถ•์˜ ์œ ์‚ฌํ•œ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ์ ‘๊ทผํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฌธํ—Œ ๊ฐ„ ์œ ์‚ฌ์„ฑ์„ ์ธก์ •ํ•˜๋Š” ๋‹ค๋ฅธ ์„œ์ง€๊ณ„๋Ÿ‰ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•˜๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ์—ฐ๊ตฌ ์ƒํƒœ๊ณ„์˜ ๊ตฌ์กฐ์™€ ์ง„ํ™”๋ฅผ ์ •๋Ÿ‰์ ์œผ๋กœ ๋ถ„์„ํ•˜๋Š” ์œ ์‚ฌํ•œ ๋ชฉ์ ์˜ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋Œ€๊ทœ๋ชจ ํ•™์ˆ  ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ตฌ์ถ•๊ณผ ํ™œ์šฉ์„ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ์ ‘๊ทผํ•œ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์˜ ์œ ์‚ฌํ•œ ์ ‘๊ทผ ๋ฐฉ์‹์„ ๋‹ค๋ฃจ๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋Œ€๊ทœ๋ชจ ํ•™์ˆ  ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ตฌ์ถ• ๋ฐ ์—ฐ๊ตฌ ํŠธ๋ Œ๋“œ ๋ถ„์„์˜ ๋Œ€์•ˆ์  ๋ฐฉ๋ฒ•๋ก ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ์ด์šฉํ•œ ๊ณผํ•™ ์ง€์‹ ์ถ”์ถœ๊ณผ ๊ตฌ์กฐํ™”๋ฅผ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์œผ๋กœ ์ ‘๊ทผํ•œ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Knowledge Graph์™€ ๋ฒกํ„ฐ ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰์„ ๊ฒฐํ•ฉํ•œ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์ •๋ณด ์ฒ˜๋ฆฌ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋น„๊ตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋ฌธํ—Œ์—์„œ ์ง€์‹์„ ์ž๋™ ์ถ”์ถœํ•˜์—ฌ ๊ทธ๋ž˜ํ”„๋ฅผ ๊ตฌ์ถ•ํ•˜๋Š” ์œ ์‚ฌํ•œ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
OpenAlex ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•œ ํ•™์ˆ  ๋ถ„์„์„ ํŠน์ • ๋งฅ๋ฝ์—์„œ ํ™•์žฅํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ปดํ“จํ„ฐ๊ณผํ•™ ์ง€์‹๊ทธ๋ž˜ํ”„๋ฅผ ๋” ํ™•์žฅํ•˜๊ฑฐ๋‚˜ ์ •๊ตํ™”ํ•œ ํ›„์† ์—ฐ๊ตฌ์™€ ์—ฐ๊ฒฐ๋œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI๋ฅผ ํ™œ์šฉํ•œ ๊ณผํ•™ ์—ฐ๊ตฌ ์ง€์› ์‹œ์Šคํ…œ์— ์ง€์‹๊ทธ๋ž˜ํ”„๋ฅผ ์ ์šฉํ•˜์—ฌ ์—ฐ๊ตฌ๋ฅผ ํ™•์žฅํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์ง€์‹๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ํ•™์ˆ  ๋ฌธํ—Œ ๋ฐœ๊ฒฌ ์‹œ์Šคํ…œ์„ ์ปดํ“จํ„ฐ๊ณผํ•™ ์—ฐ๊ตฌ ๋ถ„์•ผ์— ์ ์šฉํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •