Data, measurement and empirical methods in the science of science
์ ์: Lu Liu, Benjamin F. Jones, Brian Uzzi, Dashun Wang | ๋ ์ง: 2023.06 | DOI: 10.1038/s41562-023-01562-4 📄 PDF
Essence
๋ณธ ๋
ผ๋ฌธ์ science of science ๋ถ์ผ์ ๋ฐ์ดํฐ, ์ธก์ , ์ค์ฆ์ ๋ฐฉ๋ฒ๋ก ์ ๊ดํ ์ข
ํฉ์ ๋ฆฌ๋ทฐ๋ก, ๋๊ท๋ชจ ๋ฐ์ดํฐ์
๊ณผ ๋ค์ํ ๊ณ์ฐ ๋ฐฉ๋ฒ๋ก ์ ํตํด ๊ณผํ ์ฐ๊ตฌ์ ์๋ ์๋ฆฌ์ ๊ณผํ์ ์ง๋ณด๋ฅผ ์ดํดํ๋ ์๋ก์ด ๊ฒฝํ์ ์ ๊ทผ๋ฒ๋ค์ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ๊ณ ๋น๊ตํ๋ค.
Motivation
- Known: Scientometrics, metascience, ๊ณผํ๊ฒฝ์ ํ, ๊ณผํ๊ธฐ์ ํ(STS), ๊ณผํ์ฌํํ ๋ฑ ๋ค์ํ ํ๋ฌธ๋ถ์ผ์์ ๊ณผํ์ ์๋ ๋ฐฉ์์ ์ฐ๊ตฌํด์์ผ๋, ์ด๋ค ์ปค๋ฎค๋ํฐ๋ ํ๋ฌธ์ ๊ฒฝ๊ณ๋ฅผ ๋ฐ๋ผ ๋จํธํ๋์ด ์์ผ๋ฉฐ ์๋ก ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ก ๊ณผ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํด์๋ค.
- Gap: ๋ค์ํ ํ๋ฌธ ๋ถ์ผ์์ ๊ณผํ์ ์ฐ๊ตฌํ๋ ๋ฐฉ๋ฒ๋ก ์ด ๋ฐ์ ํ์ผ๋, ์ด๋ค ์ ๊ทผ๋ฒ์ ๊ฐ์ ๊ณผ ํ๊ณ, ๊ทธ๋ฆฌ๊ณ ์ ์ ํ ์ฌ์ฉ ์์ ์ ๋ํ ํตํฉ์ ์ดํด์ ๊ฐ์ด๋๊ฐ ๋ถ์ฌํ์ฌ ์ฐ๊ตฌ์๋ค์ด ์์ ์ ๋ถ์ผ ๋ฐ์ ๋ฐฉ๋ฒ๋ก ์ ์ดํดํ๊ณ ํ์ฉํ๊ธฐ ์ด๋ ต๋ค.
- Why: ๊ณผํ ์ ์ฑ
์๋ฆฝ๊ณผ ๊ณผํ ๊ธฐ๊ด ์ค๊ณ, ๊ณผํ์ ์ง๋ณด ์ด์ง์ ์ํด์๋ ๊ณผํ์ด ์ด๋ป๊ฒ ์๋ํ๋์ง์ ๋ํ ๊น์ ์ดํด๊ฐ ํ์์ ์ด๋ฉฐ, ๋จํธํ๋ ๋ฐฉ๋ฒ๋ก ๋ค์ ํตํฉ์ ์ผ๋ก ์ดํดํ๊ณ ํ์ฉํ ์ ์๋ ํ๋ ์์ํฌ ์ ๊ณต์ด ์ค์ํ๋ค.
- Approach: Web of Science, PubMed, CrossRef, OpenAlex ๋ฑ์ ๊ณต๊ฐ ๋ฐ์ดํฐ์
๊ณผ funding, patent, peer review ์ ๋ณด๋ฅผ ํฌํจํ ๋ค์ธต์ ๋ฐ์ดํฐ ํตํฉ์ ํตํด, publication-based measure, funding impact, citation patterns ๋ฑ ๋ค์ํ ์ธก์ ๊ตฌ์กฐ๋ฅผ ๊ตฌ์ฑํ๊ณ , regression analysis, causal inference, machine learning prediction, network analysis ๋ฑ์ ์ค์ฆ์ ๋ฐฉ๋ฒ๋ก ์ ๋น๊ต ๋ถ์ํ๋ค.
Achievement
๋๊ท๋ชจ ๋ฐ์ดํฐ์ ๊ฐ์ฉ์ฑ ์ฆ๋: ๊ณผ๊ฑฐ ์์์
๊ธฐ๋ฐ์ ๋ฐ์ดํฐ ์์ง์์ ํ๋์ ๋๊ท๋ชจ ๊ณต๊ฐ ๋ฐ์ดํฐ์
(์๋ฐฑ๋ง ๊ฐ์ ๋
ผ๋ฌธ, ํ๋ฉ, ํนํ ๋ฑ)์ผ๋ก์ ์ ํ์ผ๋ก ์ฐ๊ตฌ ๋ฒ์์ ๊ท๋ชจ๊ฐ ํ๊ธฐ์ ์ผ๋ก ํ๋๋จ. ์ธก์ ๋๊ตฌ์ ๋ค์ํ: ๋
ผ๋ฌธ์ novelty, interdisciplinarity, impact ๋ฑ ๊ธฐ์กด์ ์ ๋ํํ๊ธฐ ์ด๋ ค์ ๋ ๊ฐ๋
๋ค์ ๊ตฌ์ฒด์ ์ผ๋ก ์ธก์ ๊ฐ๋ฅํ๊ฒ ํจ. ๋ฐฉ๋ฒ๋ก ์ ๋ค์์ฑ: regression, causal inference, machine learning, network analysis ๋ฑ ๋ค์ํ ์ค์ฆ์ ์ ๊ทผ๋ฒ๋ค์ ์ ๋ฆฌํ๊ณ ๊ฐ๊ฐ์ ์ ์ฉ ์กฐ๊ฑด์ ๋ช
์ํจ. ์ ์ฑ
๊ด๋ จ ์ง๋ฌธ์ ๋ํ ์ค์ฆ์ ๋ต๋ณ: ๊ณผํ ํฌ์์ ์ ์ ๊ท๋ชจ, ํ์ ์ ๊ณผํ์ ์กฐ๊ฑด, ๋ณด์ ์ฒด๊ณ์ ์ํฅ, ์ฌํ์ฑ ์์ธ ๋ฑ ํต์ฌ ์ ์ฑ
์ง๋ฌธ๋ค์ ๋ํ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ๋ถ์ ๊ฐ๋ฅ์ฑ ์ ์.
How
Fig. 2 | An example of prediction with machine learning. This figure illustrates
- ๋ค์ค ๋ฐ์ดํฐ ํตํฉ: Publication data (WoS, PubMed, CrossRef, OpenAlex), Funding data (NIH, NSF, UMETRICS), Patent data, Peer review data, Training genealogy, Policy documents ๋ฑ์ ์ฐ๊ฒฐ ๊ฐ๋ฅํ ์๋ณ์(ORCID, DOI ๋ฑ)๋ฅผ ํตํด ํตํฉ.
- ๋ค์ธต์ ์ธก์ ๊ตฌ์กฐ ๊ฐ๋ฐ: ์ ์, ๋
ผ๋ฌธ, ๊ธฐ๊ด, ํ, ํ๋ฉ ์์ค์์์ ๋ค์ํ ์ฑ๊ณผ ์งํ(h-index, citation impact, novelty score, interdisciplinarity index ๋ฑ) ์ ์.
- ๋ค์ํ ์ค์ฆ ๋ฐฉ๋ฒ๋ก ๋น๊ต: Descriptive analysis, correlation analysis, regression (OLS, logistic), causal inference (instrumental variable, natural experiment, regression discontinuity, difference-in-differences), machine learning (supervised learning for prediction, representation learning), network analysis (collaboration network, citation network).
- ๋ฐฉ๋ฒ๋ก ์ ํ ๊ฐ์ด๋: ์ฐ๊ตฌ ์ง๋ฌธ์ ํน์ฑ์ ๋ฐ๋ผ (descriptive vs. causal vs. predictive) ์ต์ ์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๊ณ ๊ฐ ๋ฐฉ๋ฒ์ ๊ฐ์ ๊ณผ ํ๊ณ๋ฅผ ๋ช
์.
Originality
- ํตํฉ์ ๋ฆฌ๋ทฐ์ ์ ์ : ๊ณผ๊ฑฐ์ ๋ถ์ฐ๋์ด ์๋ scientometrics, metascience, STS, ๊ณผํ๊ฒฝ์ ํ ๋ฑ์ ํ๋์ ํ๋ ์์ํฌ ์๋์์ ๋น๊ต ๋ถ์ํ ์ฒซ ๋ฒ์งธ ์ข
ํฉ์ ์๋.
- ๋ฐ์ดํฐ ์ํ๊ณ ๋งคํ: Fig. 1์์ ๋ณด์ฌ์ฃผ๋ ๋ฐ์ ๊ฐ์ด, publication๋ถํฐ funding, patent, peer review, policy document, training genealogy, clinical trials์ ์ด๋ฅด๋ ์ข
ํฉ์ ๋ฐ์ดํฐ ์ํ๊ณ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ์๊ฐํํ๊ณ ๋ถ๋ฅํ ํ์ ์ ๊ธฐ์ฌ.
- ์ค์ฆ ๋ฐฉ๋ฒ๋ก ์ ๊ท๋ฒํ: ๋ค์ํ ํ๋ฌธ ๋ถ์ผ์์ ํฉ์ด์ ธ ์๋ ์ค์ฆ์ ์ ๊ทผ๋ฒ๋ค์ ํ์คํ๋ ํ ์์์ ์ ๋ ฌํ๊ณ , ๊ฐ ๋ฐฉ๋ฒ์ ์ ์ฉ ์์ ๊ณผ ์ ์ฝ ์กฐ๊ฑด์ ๋ช
ํํ ํจ.
Limitation & Further Study
- ๊ธฐ์ ์ ์ธ๋ถ์ฌํญ์ ์ ํ์ ์ ๊ณต: ๋
ผ๋ฌธ์ ๊ฐ ๋ฐฉ๋ฒ๋ก ์ ๊ฐ๋ต์ ๊ฐ์๋ง ์ ๊ณตํ๋ฉฐ, ๊ตฌ์ฒด์ ๊ธฐ์ ์ ๊ตฌํ ๋ฐฉ๋ฒ์ ๋ค๋ฅธ ์ ๋ฌธ ๋ฌธํ์ ์ฐธ์กฐํ๋๋ก ํจ์ผ๋ก์จ, ๋
์๊ฐ ์ค์ ๋ถ์์ ์ํํ๋ ๋ฐ ํ์ํ ์ถฉ๋ถํ ๊ธฐ์ ์ ์ง์นจ ๋ถ์กฑ.
- ์ธ๊ณผ์ถ๋ก ์ ์ธ์๋ก ์ ํ๊ณ: ๋ง์ science of science ์ฐ๊ตฌ๊ฐ observational data ๊ธฐ๋ฐ์ด๊ธฐ ๋๋ฌธ์ ์ธ๊ณผ์ฑ ํ๋ฆฝ์ ์ด๋ ค์. Natural experiment๋ instrumental variable ๋ฑ์ ํตํด ๋ณด์ํ๋ ค ํ์ง๋ง, ์์ ํ ์ธ๊ณผ ์ถ๋ก ์ ์ ํ์ .
- ๋ฐ์ดํฐ ๊ฐ์ฉ์ฑ์ ํธํฅ์ฑ: WoS, PubMed, CrossRef ๋ฑ ์ฃผ์ ๋ฐ์ดํฐ์
๋ค์ด ์์ด๊ถ ํ์ ํ๋๊ณผ ์ฃผ๋ฅ ๊ณผํ ๋ถ์ผ์ ํธํฅ๋์ด ์์ผ๋ฉฐ, ๊ฐ๋ฐ๋์๊ตญ์ ๊ณผํ ํ๋๊ณผ ๋น์ฃผ๋ฅ ํ๋ฌธ ๋ถ์ผ๋ฅผ ์ถฉ๋ถํ ๋ํํ์ง ๋ชปํจ.
- ์ ์ฑ
์ ์ฉ์ ๋ณต์ก์ฑ: ์ค์ฆ์ ๋ฐ๊ฒฌ์ด ์ง์ ์ ์ผ๋ก ์ ์ฑ
์ผ๋ก ์ ํ๋๊ธฐ ์ด๋ ค์ด ์ . ๊ณผํ ์์คํ
์ ๋ณต์ก์ฑ๊ณผ ๋งฅ๋ฝ์์กด์ฑ์ผ๋ก ์ธํด ํ ๋งฅ๋ฝ์์์ ๋ฐ๊ฒฌ์ด ๋ค๋ฅธ ๋งฅ๋ฝ์์ ์ผ๋ฐํ๋์ง ์์ ์ ์์.
- ํ์ ์ฐ๊ตฌ ๋ฐฉํฅ: ์ธก์ ๋๊ตฌ์ ํ๋น์ฑ ๊ฒ์ฆ, ๋คํ์ ๊ฐ ๋ฐ์ดํฐ ํ์คํ, ์ ์๋ ๊ตญ๊ฐ ํฌํจ, ๋จ๊ธฐ ๋๋น ์ฅ๊ธฐ ์ํฅ์ ํ๊ฐ ๋ฑ์์์ ๊ฐ์ ํ์์ฑ.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 5/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋ฆฌ๋ทฐ๋ ๊ณผํ ์ฐ๊ตฌ ์์ฒด๋ฅผ ๊ณผํ์ ๋์์ผ๋ก ์ผ๋ science of science ๋ถ์ผ์ ๋ฐ์ดํฐ, ์ธก์ , ๋ฐฉ๋ฒ๋ก ์ ์ข
ํฉ์ ์ผ๋ก ์ ๋ฆฌํ ์ค์ํ ๊ธฐ์ฌ๋ฌผ๋ก, ๋ค์ํ ํ๋ฌธ ๋ถ์ผ์ ๋จํธํ๋ ์ ๊ทผ๋ฒ์ ํตํฉ์ ์ผ๋ก ์ดํดํ ์ ์๋ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ๋ค. ๊ณผํ ์ ์ฑ
์๋ฆฝ๊ณผ ๊ณผํ ๊ธฐ๊ด ์ค๊ณ์ ๋ํ ์ง์ ์ ์ธ ํจ์๋ฅผ ์ ์ํ๋ฉฐ, ํฅํ science of science ์ฐ๊ตฌ์ ํ์ค ์ฐธ๊ณ ๋ฌธํ์ด ๋ ๊ฒ์ผ๋ก ์์๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ๊ณผํ ๋ถ์ผ์ ์ค์ฆ์ ์ฐ๊ตฌ ๋ฐฉ๋ฒ๋ก ์ ๋ํ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ๊ณผํ ๋ถ์ผ์ ๋ฐ์ดํฐ ๋ฐ ์ธก์ ๋ฐฉ๋ฒ๋ก ์ ๋ํ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ์ฐฝ์์ ์ฐ๊ตฌ ์์ด๋์ด ์์ฑ ๋ฅ๋ ฅ์ ์ธ๊ฐ๊ณผ ๋น๊ต ํ๊ฐํ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ์ ๊ณผํ ๋ถ์ผ์์ ๋ฐ์ดํฐ์ ์ธก์ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฅธ ๊ด์ ์์ ๋ค๋ฃฌ ์ฐ๊ด ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ์ ์ง์ ์ ์ธก์ ํ๊ธฐ ์ํ ๋ค๋ฅธ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ ์ฐ๊ตฌ์ ์ค์ฆ์ ๋ถ์ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฅธ ์ ๊ทผ๋ฒ์ผ๋ก ๋ค๋ฃจ๋ ์ ์ฌ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ์ ์๋ฃยท์ธก์ ยท๋ฐฉ๋ฒ๋ก ์ธก๋ฉด์์ ์ฌํ์ฑ ์๊ธฐ์ ํ์ ์ ๋ฐฉ๋ฒ ๊ฐ์ ์ ํ์์ฑ์ ์ฌ๋ ์๊ฒ ๋
ผ์ํ๋ค.
ํ์ ์ฐ๊ตฌ
๊ธฐ๊ณํ์ต ๊ธฐ๋ฐ ๊ณผํ ์ฐ๊ตฌ์ ์ฌํ์ฑ ์ฒดํฌ๋ฆฌ์คํธ๋ฅผ ์ ์ํ์ฌ ์ค์ฆ์ ๋ฐฉ๋ฒ๋ก ๋
ผ์๋ฅผ ๋ณด์ํ๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ์ ๊ณผํ ๋ถ์ผ์ ๋ฐ์ดํฐ ๋ถ์์ ํน์ ๋ฌธ์ ์ ์ ์ฉํ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
AI๋ฅผ ํ์ฉํ ๊ณผํ ๋ถ์์ ํํฉ์ ๋ค๋ฃจ์ด ๊ณผํ์ ๊ณผํ ๋ฐฉ๋ฒ๋ก ๋
ผ์๋ฅผ ํ์ฅํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์