Statistical Physics in the Era of Big Data
์ ์: Dashun Wang | ๋ ์ง: 2013 | URL: http://hdl.handle.net/2047/d20003199 📄 PDF
Essence
Figure 2.5: Empirical validation of the lognormal decay (2.2) (a)
๋ณธ ๋ฐ์ฌํ์ ๋
ผ๋ฌธ์ ํต๊ณ๋ฌผ๋ฆฌํ์ ์ ๊ทผ๋ฒ์ Big Data ๋ถ์์ ์ ์ฉํ์ฌ ์ธ ๊ฐ์ง ํต์ฌ ์ฃผ์ ๋ฅผ ๋ค๋ฃฌ๋ค: (1) ๋
ผ๋ฌธ ์ธ์ฉ ๋์ญํ์ ๋ณดํธ์ ์๊ฐ ํจํด ๋ฐ๊ฒฌ, (2) ์ ๋ณด ํ์ฐ ๊ณผ์ ์์์ ๋งฅ๋ฝ์ ์์ธ ๋ถ์, (3) ํด๋์ ํ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ ๊ฐ์ธ ๊ถค์ ์ ์ฌ์ฑ ๊ธฐ๋ฐ ์ฌํ ๊ด๊ณ ์์ธก.
Motivation
- Known: ํต๊ณ๋ฌผ๋ฆฌํ์ ๋ณต์ก๊ณ์ ๊ฑฐ์์ ๊ฑฐ๋์ ์ค๋ช
ํ๋ ๋ฐ ์ฑ๊ณต์ ์ผ๋ก ์ ์ฉ๋์ด ์์ผ๋ฉฐ, Big Data์ ์๋์ ์๋ก์ด ๊ธฐํ๋ฅผ ์ ๊ณตํ๋ค. ์ธ์ฉ ๋์ญํ, ์ ๋ณด ํ์ฐ, ์ธ๊ฐ ์ด๋ ํจํด ๋ฑ์ ๊ฐ๊ฐ์ ๋ถ์ผ์์ ๊ฐ๋ณ์ ์ผ๋ก ์ฐ๊ตฌ๋์ด ์์ผ๋ ํตํฉ์ ํต๊ณ๋ฌผ๋ฆฌํ์ ๋ถ์์ ์๋ก์ด ์ ๊ทผ์ด๋ค.
- Gap: ๊ธฐ์กด ์ฐ๊ตฌ๋ค์ ๊ฐ๊ฐ์ ๋ถ์ผ์์ ๊ณ ๋ฆฝ๋ ๋ถ์์ ์ํํ์ผ๋, ํต๊ณ๋ฌผ๋ฆฌํ์ ๊ด์ ์์ ์ด๋ค ํ์์ ๋ณดํธ์ ํจํด๊ณผ ๋ฉ์ปค๋์ฆ์ ํตํฉ์ ์ผ๋ก ์ค๋ช
ํ๋ ์ฐ๊ตฌ๊ฐ ๋ถ์กฑํ๋ค. ํนํ ๋๊ท๋ชจ ๋ฐ์ดํฐ์
์ ํ์ฉํ ์๊ฐ-๊ณต๊ฐ-์ฌํ ์ ๋ณด์ ๋์ ๋ถ์ ๊ธฐํ๋ฅผ ํ์ฉํ ์ฐ๊ตฌ๊ฐ ์ ํ์ ์ด์๋ค.
- Why: ์ธ์ฉ ๋์ญํ์ ๋ณดํธ์ ํจํด ๋ฐ๊ฒฌ์ ๊ณผํ ์ํฅ๋ ฅ์ ๊ทผ๋ณธ ๋ฉ์ปค๋์ฆ์ ์ดํดํ๋ ๋ฐ ์ค์ํ๋ฉฐ, ์ ๋ณด ํ์ฐ์ ๋งฅ๋ฝ์ ์์ธ ๋ถ์์ ์ฌํ ์์คํ
์ดํด์ ํ์์ ์ด๊ณ , ํด๋์ ํ ๋ฐ์ดํฐ ํ์ฉ์ ๋๊ท๋ชจ ๊ฐ์ธ ๋คํธ์ํฌ ์์ธก ๊ฐ๋ฅ์ฑ์ ์ฒ์ ์ ์ํ์ฌ Big Data์ ์ค์ง์ ๊ฐ์น๋ฅผ ์
์ฆํ๋ค.
- Approach: ์ธ ๊ฐ์ ๋
๋ฆฝ์ ์ด์ง๋ง ์ฐ๊ด๋ ์ฐ๊ตฌ๋ฅผ ํตํด ์งํ๋๋ค: (1) Minimal Citation Model (MiC) ๊ฐ๋ฐ์ ํตํ ์ธ์ฉ ์ญํ ๋ถ์, (2) ์กฐ์ง ๋ฐ ์ฌํ ๋งฅ๋ฝ์์์ ์ ๋ณด ํ์ฐ ๊ณผ์ ์ค์ฆ ๋ถ์ ๋ฐ ํ๋ฅ ๋ชจ๋ธ๋ง, (3) ํด๋์ ํ ๋ฐ์ดํฐ์์ ๊ฐ๋ณ ๊ถค์ ๊ฐ ์ ์ฌ์ฑ๊ณผ ์ฌํ ์ฐ๊ฒฐ๊ณ ๋ฆฌ์ ์๊ด๊ด๊ณ ๋ถ์ ๋ฐ link prediction ์์คํ
๊ตฌ์ถ.
Achievement
Figure 2.5: Empirical validation of the lognormal decay (2.2) (a)
์ฅ์ 1: ๋
ผ๋ฌธ ์ธ์ฉ ์ญํ์ ๋ณดํธ์ ์๊ฐ ํจํด(lognormal decay) ๋ฐ๊ฒฌ์ผ๋ก citation trajectory์ ๊ธฐ๋ณธ ๋ฉ์ปค๋์ฆ ๊ท๋ช
. ์ฅ์ 2: ์ ๋ณด ํ์ฐ ๊ณผ์ ์์ ๋งฅ๋ฝ์ ์ํฅ์ ์ ๋ํํ๋ฉด์๋ ๋จ์ ํ๋ฅ ๋ชจ๋ธ๋ก ๊ฑฐ์์ ํน์ฑ์ ์ค๋ช
๊ฐ๋ฅํจ์ ์
์ฆ. ์ฅ์ 3: ํด๋์ ํ ์ด๋ ๊ถค์ ์ผ๋ก๋ถํฐ ์ฌํ ๊ด๊ณ๋ฅผ ์์ธกํ ์ ์์์ ์ฒ์ ์ ์ํ์ฌ Big Data์ ์ค์ฉ์ฑ ์
์ฆ.
How
Figure 2.5: Empirical validation of the lognormal decay (2.2) (a)
โข Minimal Citation Model (MiC): ์ธ ๊ฐ์ง ๊ธฐ๋ณธ ๊ฐ์ (reinforcement, fitness, aging)์ ๊ธฐ๋ฐํ ํ๋ฅ ๋ฏธ๋ถ๋ฐฉ์ ์ ์ ๋ ๋ฐ ํด์์ ํ์ด โข Maximum Likelihood Estimation์ ํตํ ๋ชจ๋ธ ๋งค๊ฐ๋ณ์ ์ถ์ ๋ฐ ๊ฒ์ฆ โข Physical Review Corpus ๋ฐ Web of Science ๋ฐ์ดํฐ์
ํ์ฉํ ๋๊ท๋ชจ ์ค์ฆ ๊ฒ์ฆ โข Stochastic model์ ํตํ ์ ๋ณด ํ์ฐ ๊ณผ์ ๋ชจ๋ธ๋ง โข Network proximity ๋ฐ Mobile homophily ๊ฐ๋
์ ์ ํ ์๊ด๊ด๊ณ ๋ถ์ โข Progressive sampling ๊ธฐ๋ฐ link prediction ์คํ ์ค๊ณ
Originality
โข ํต๊ณ๋ฌผ๋ฆฌํ์ spin system ๊ฐ๋
์ ๊ฐ์ธ ์ด๋ ๊ถค์ ๋ถ์์ ์ฒ์ ์ ์ฉํ ํ์ ์ ์ ๊ทผ โข Citation dynamics์ ๋ณดํธ์ ์๊ฐ ํจํด์ ๋ฉ์ปค๋์ฆ์ผ๋ก๋ถํฐ ์ ๋ํ ์ต์ด์ ๋ชจ๋ธ ๊ธฐ๋ฐ ์ค๋ช
โข Big Data์ ๋ค์ธต ์ ๋ณด(์๊ฐ, ๊ณต๊ฐ, ์ฌํ์ ๊ด๊ณ)๋ฅผ ํตํฉํ์ฌ ์ธ๊ฐ ํ๋์ ์์ธก ๊ฐ๋ฅ์ฑ์ ์
์ฆ
Limitation & Further Study
โข ๊ฐ ์ฅ(Chapter)์ ์ฐ๊ตฌ๋ค์ด ๊ฐ๋
์ ์ผ๋ก๋ ์ฐ๊ด๋์ด ์์ผ๋ ๋ฐฉ๋ฒ๋ก ๊ณผ ๋ฐ์ดํฐ๊ฐ ์์ดํ์ฌ ํตํฉ์ฑ์ด ์ ํ์ โข ์ธ์ฉ ๋ชจ๋ธ์ Physics ๋ถ์ผ ๋ฐ์ดํฐ์ ๊ธฐ๋ฐํ์ฌ ํ๋ถ์ผ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ ๋ฏธ๊ฒ์ฆ โข ์ ๋ณด ํ์ฐ ๋ชจ๋ธ์ macroscopic ๊ฒ์ฆ์ด ์ ํ์ โข Mobile phone ๊ธฐ๋ฐ link prediction์ ํน์ ์ง์ญ/ํต์ ์ฌ ๋ฐ์ดํฐ์ด๋ฏ๋ก generalizability ์ ํ โข ๊ฐ์ธ ์ ๋ณด ๋ณดํธ ๊ด๋ จ ์ค๋ฆฌ์ ๋
ผ์ ๋ถ์ฌ
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ํต๊ณ๋ฌผ๋ฆฌํ ๋๊ตฌ๋ฅผ Big Data ๋ถ์์ ์ ์ฉํ์ฌ ๊ณผํ ์ํฅ๋ ฅ, ์ ๋ณด ํ์ฐ, ์ธ๊ฐ ๋คํธ์ํฌ์ ๊ทผ๋ณธ ๋ฉ์ปค๋์ฆ์ ๊ท๋ช
ํ ํ์๋
ผ๋ฌธ์ผ๋ก์ ์๋นํ ํ์ ์ ๊ฐ์น๋ฅผ ์ง๋๋ค. ํนํ ๋๊ท๋ชจ ์ค๋ฐ์ดํฐ ๊ธฐ๋ฐ ๊ฒ์ฆ๊ณผ ์๋ก์ด ์์ฉ ๊ฐ๋ฅ์ฑ(citation prediction, link prediction) ์ ์๋ ํฅํ ์ฐ๊ตฌ์ ์ค์ํ ํ ๋๋ฅผ ๋ง๋ จํ์ผ๋, ๊ฐ๋ณ ์ฐ๊ตฌ๋ค ๊ฐ ํตํฉ์ฑ ๊ฐํ์ ํ๋ถ์ผ ์ผ๋ฐํ ๊ฒ์ฆ์ด ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ธ์ฉ ๋์ญํ์ ๋ณดํธ์ ํจํด์ ๊ท๋ช
ํ ์ฐ๊ตฌ๋ก์ ๋ณธ ๋
ผ๋ฌธ์ ์ธ์ฉ ๋์ญํ ๋ถ์์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ์์ฐ์ฑ์ ์์ ์ฃผ๊ธฐ ํจํด์ ์ดํดํ๋ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋น
๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ์ธ๊ฐ ํ๋๊ณผ ์ฌํ ํ์์ ํต๊ณ์ ๋ถ์์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ณต์ก๊ณ ๋คํธ์ํฌ์ ํต๊ณ๋ฌผ๋ฆฌํ์ ๊ด์ ์์ ์ฌํ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๋ ์ ์ฌํ ๋ฐฉ๋ฒ๋ก ์ ๊ณต์ ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ธ์ฉ ์๊ฐ ํจํด๊ณผ ๊ณผํ์ ์ํฅ๋ ฅ์ ์๊ฐ์ ์ฐจ์์ ๋ถ์ํ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํต๊ณ๋ฌผ๋ฆฌํ์ ๋ฐฉ๋ฒ๋ก ์ ๊ณผํ ๊ณ๋ ๋ฐ์ดํฐ ๋ถ์์ ์ ์ฉํ๋ ์ ์ฌํ ์ ๊ทผ๋ฒ์ ์ทจํ๋ค.
ํ์ ์ฐ๊ตฌ
์ธ์ฉ ๋์ญํ์ ํต๊ณ๋ฌผ๋ฆฌํ์ ๋ถ์์ ํ์ฅํ ์ฐ๊ตฌ๋ก ๋ณธ ๋
ผ๋ฌธ์ ์ธ์ฉ ํจํด ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์