Reimagining urban science: Scaling causal inference with large language models

์ €์ž: Yutong Xia, Ao Qu, Yunhan Zheng, Yihong Tang, Dingyi Zhuang, Yuxuan Liang, Shenhao Wang, Cathy Wu, Lijun Sun, Roger Zimmermann, Jinhua Zhao | ๋‚ ์งœ: 2025 | DOI: arXiv:2504.12345 📄 PDF


Essence

Figure 1

๋…ผ๋ฌธ์˜ ๊ตฌ์กฐ์  ๋…ผ๋ฆฌ: ํ˜„ํ™ฉ ๊ฒ€ํ† ์—์„œ ํ”„๋ ˆ์ž„์›Œํฌ, ๊ทธ๋ฆฌ๊ณ  ๊ด‘๋ฒ”์œ„ํ•œ ๋…ผ์˜๋กœ ์ง„ํ–‰๋˜๋Š” ๊ณ„์ธต์  ๊ตฌ์กฐ

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์„ ํ™œ์šฉํ•˜์—ฌ ๋„์‹œ ์ธ๊ณผ ์ถ”๋ก (Urban Causal Inference) ์—ฐ๊ตฌ์˜ ์ž๋™ํ™”์™€ ํ™•์žฅ์„ฑ์„ ๋‹ฌ์„ฑํ•˜๋Š” UrbanCIA ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•œ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๊ฐ€์„ค ์ƒ์„ฑ๋ถ€ํ„ฐ ์ •์ฑ… ํ•ด์„๊นŒ์ง€ ์ „์ฒด ๋„์‹œ๊ณผํ•™ ์—ฐ๊ตฌ ํŒŒ์ดํ”„๋ผ์ธ์„ ์ง€๋Šฅํ˜• ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์œผ๋กœ ์žฌ๊ตฌ์„ฑํ•˜๊ณ ์ž ํ•œ๋‹ค.

Motivation

Achievement

Figure 3

๋„์‹œ ์ธ๊ณผ ์ถ”๋ก ์˜ ์ฃผ์š” ๊ฒฉ์ฐจ: (a) ์ฃผ์ œ/์ง€์—ญ/๋ฐ์ดํ„ฐ/์„ค๊ณ„ ๋ฐฉ๋ฒ•์˜ ๋ถˆ๊ท ํ˜• ๋ถ„ํฌ, (b) ์ง€์—ญ ๊ฐ„ ์‹ฌ๊ฐํ•œ ๋ถˆ๊ท ํ˜•, (c) ๋‹ค์ค‘์–‘์‹ ๋ฐ์ดํ„ฐ ํ™œ์šฉ ๋ถ€์กฑ

  1. ํฌ๊ด„์  ํ˜„ํ™ฉ ์ง„๋‹จ: 2012-2021๋…„ Cities ์ €๋„ 2,428๊ฐœ ๋…ผ๋ฌธ์„ LLM+๊ณ ์ „ ๋จธ์‹ ๋Ÿฌ๋‹+์ „๋ฌธ๊ฐ€ ๊ฒ€์ฆ์œผ๋กœ ๋ถ„์„ํ•˜์—ฌ 219๊ฐœ ์ธ๊ณผ ์ถ”๋ก  ๋…ผ๋ฌธ ์‹๋ณ„. ์‹œ๊ฐ„์— ๋”ฐ๋ฅธ ์ฆ๊ฐ€ ์ถ”์„ธ(2012๋…„ 3.0% โ†’ 2020๋…„ 15.2%), ์ง€์—ญ ๋ถˆ๊ท ํ˜•, ๊ตฌ์กฐํ™” ๋ฐ์ดํ„ฐ ๊ณผ์˜์กด(64%), ๋‚ฎ์€ ์žฌํ˜„์„ฑ์„ ์ •๋Ÿ‰ํ™”.
  2. UrbanCIA ํ”„๋ ˆ์ž„์›Œํฌ: 4๊ฐœ ๋ชจ๋“ˆ์‹ ์—์ด์ „ํŠธ(๊ฐ€์„ค ์ƒ์„ฑ, ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง, ์‹คํ—˜ ์„ค๊ณ„ ๋ฐ ์‹คํ–‰, ๊ฒฐ๊ณผ ํ•ด์„)๋กœ ๊ตฌ์„ฑ๋œ ๊ฐœ๋…์  ํ”„๋ ˆ์ž„์›Œํฌ ์ œ์‹œ. ๊ธฐ์กด ์ˆ˜๋™ ์›Œํฌํ”Œ๋กœ์šฐ์™€ ๊ณ ๋ฆฝ๋œ AI ๋„๊ตฌ์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ณ , ์ธ๊ฐ„ ํŒ๋‹จ๊ณผ ๋„๋ฉ”์ธ ์ „๋ฌธ์„ฑ ๋ณด์กด.
  3. ๋‹ค์ฐจ์› ํ‰๊ฐ€ ํ”„๋กœํ† ์ฝœ: ๋ฐฉ๋ฒ•๋ก ์ , ์œค๋ฆฌ์ , ๋ฐฐํฌ ๊ด€๋ จ ํ‰๊ฐ€ ์ง€ํ‘œ๋ฅผ ํฌํ•จํ•˜์—ฌ AI ์ƒ์„ฑ ์ธ๊ณผ ์—ฐ๊ตฌ์˜ ์—„๊ฒฉ์„ฑ, ์ฐธ์‹ ์„ฑ, ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ์„ ํ‰๊ฐ€ํ•˜๋Š” ์ฒด๊ณ„์  ๊ธฐ์ค€ ์ œ์•ˆ.
  4. ํฌ์šฉ์  ๋„์‹œ๊ณผํ•™ ์‹คํ˜„: ์‹œ๋ฏผ ์กฐ์ง, ์ง€๋ฐฉ์ •๋ถ€, ์ง€์—ญ ์‚ฌํšŒ ๋“ฑ ๊ด‘๋ฒ”์œ„ํ•œ ์ฐธ์—ฌ์ž์˜ ์ ‘๊ทผ์„ฑ ๊ฐ•ํ™”๋กœ Jane Jacobs์˜ "๋ชจ๋‘๊ฐ€ ๋งŒ๋“œ๋Š” ๋„์‹œ" ๋น„์ „ ๊ตฌํ˜„.

How

Figure 2

๋„์‹œ ์ธ๊ณผ ์—ฐ๊ตฌ์˜ ์ƒ์Šน ์ถ”์„ธ: 2012-2021๋…„ Cities ์ €๋„์˜ ๋…ผ๋ฌธ ์ˆ˜(ํŒŒ๋ž€ ๋ง‰๋Œ€)์™€ ์ธ๊ณผ ์ถ”๋ก  ๋ฐฉ๋ฒ• ํ™œ์šฉ(๋นจ๊ฐ„ ๋ง‰๋Œ€) ๋น„์œจ

์‹œ์Šคํ…œ ์„ค๊ณ„ ์›์น™:

ํ”„๋ ˆ์ž„์›Œํฌ์˜ 4๋‹จ๊ณ„:

  1. ๊ฐ€์„ค ์ƒ์„ฑ(Phase 1): Reader ์—์ด์ „ํŠธ๊ฐ€ ๋ฌธํ—Œ, ๋ฐ์ดํ„ฐ, ์ •์ฑ… ์ด์Šˆ๋กœ๋ถ€ํ„ฐ ์—ฐ๊ตฌ ์งˆ๋ฌธ ์ถ”์ถœ
  2. ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง(Phase 2): Data Engineer๊ฐ€ ๋‹ค์ค‘ ์†Œ์Šค ๋ฐ์ดํ„ฐ์˜ ์ˆ˜์ง‘, ์ •์ œ, ํ†ตํ•ฉ
  3. ์‹คํ—˜ ์„ค๊ณ„ ๋ฐ ์‹คํ–‰(Phase 3): Methodologist๊ฐ€ ๊ฐ€์ • ๊ฒ€์ฆ ๋ฐ ์ธ๊ณผ ์ถ”๋ก  ๋ฐฉ๋ฒ• ์„ ํƒ, Analyst๊ฐ€ ๋ถ„์„ ์ˆ˜ํ–‰
  4. ๊ฒฐ๊ณผ ํ•ด์„(Phase 4): ์ •์ฑ… ์ˆ˜๋ฆฝ์ž๋ฅผ ์œ„ํ•œ ์ข…ํ•ฉ ๋ณด๊ณ ์„œ ์ƒ์„ฑ(์ธ๊ณผ ์ถ”์ •์น˜, ์†Œ์ง‘๋‹จ ๋ถ„์„, ๊ถŒ๊ณ ์‚ฌํ•ญ ํฌํ•จ)

LLM ํ™œ์šฉ ๋ฐฉ์‹:

Originality

Limitation & Further Study

ํ›„์† ์—ฐ๊ตฌ ๋ฐฉํ–ฅ:

Evaluation

Novelty: 4/5 Technical Soundness: 3.5/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ๋„์‹œ ์ธ๊ณผ ์—ฐ๊ตฌ์˜ ํ˜„ํ™ฉ์„ ์ฒซ ๋Œ€๊ทœ๋ชจ๋กœ ์ง„๋‹จํ•˜๊ณ , LLM ๊ธฐ๋ฐ˜ ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์œผ๋กœ ์ „์ฒด ์ธ๊ณผ ์ถ”๋ก  ํŒŒ์ดํ”„๋ผ์ธ ์ž๋™ํ™”๋ผ๋Š” ์•ผ์‹ฌ์ฐฌ ๋น„์ „์„ ์ œ์‹œํ•œ๋‹ค๋Š” ์ ์—์„œ ๋งค์šฐ ์˜๋ฏธ ์žˆ๋‹ค. ํŠนํžˆ ์ง€์—ญ ๋ถˆ๊ท ํ˜•, ๊ตฌ์กฐํ™” ๋ฐ์ดํ„ฐ ๊ณผ์˜์กด, ๋‚ฎ์€ ์žฌํ˜„์„ฑ ๋“ฑ ๋„์‹œ๊ณผํ•™์˜ ์‹ค์ œ ๋ฌธ์ œ๋ฅผ ์ •๋Ÿ‰ํ™”ํ•˜๊ณ  ๊ธฐ์ˆ ์  ์†”๋ฃจ์…˜์„ ์ œ์•ˆํ•œ ์ ์ด ๊ฐ•์ ์ด๋‹ค. ๋‹ค๋งŒ ๊ฐœ๋…์  ํ”„๋ ˆ์ž„์›Œํฌ์— ์น˜์ค‘๋˜์–ด ์žˆ์œผ๋ฉฐ, ์‹ค์ œ ๊ตฌํ˜„, ์‹ค์ฆ์  ๊ฒ€์ฆ, LLM์˜ ํ™˜๊ฐ๊ณผ ํŽธํ–ฅ ์ œ์–ด ๋ฐฉ์•ˆ์ด ๊ตฌ์ฒด์ ์œผ๋กœ ์ œ์‹œ๋˜์ง€ ์•Š์•„ ๊ธฐ์ˆ ์  ๊ฑด์ „์„ฑ์—์„œ ๊ฐœ์„  ์—ฌ์ง€๊ฐ€ ์žˆ๋‹ค. ํ–ฅํ›„ ํ”„๋กœํ† ํƒ€์ž… ๊ตฌํ˜„๊ณผ ๋‹ค์–‘ํ•œ ๋„์‹œ ์‚ฌ๋ก€ ๊ฒ€์ฆ์ด ๋…ผ๋ฌธ์˜ ์ฃผ์žฅ์„ ๊ฐ•ํ™”ํ•  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์‚ฌํšŒ์  ์ฑ…์ž„ AI์˜ ์ธ๊ณผ์  ์ถ”๋ก  ๋ฐ ์‹ค์„ธ๊ณ„ ์ ์šฉ์— ๋Œ€ํ•œ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Systems Biology ์ž๋™ํ™” ์‹œ์Šคํ…œ์— ๊ด€ํ•œ ๋…ผ๋ฌธ์œผ๋กœ, ๋ณต์žก๊ณ„ ๊ณผํ•™ ๋„๋ฉ”์ธ์—์„œ LLM ์—์ด์ „ํŠธ์˜ ์ „์ฒด ํŒŒ์ดํ”„๋ผ์ธ ์ž๋™ํ™” ์—ฐ๊ตฌ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ๊ฐ€์ ธ์˜ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
627๋ฒˆ์€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์ถ”๋ก  ์ผ๋ฐ˜ํ™”๋ฅผ ์ฃผ์žฅํ•˜๊ณ , 660๋ฒˆ์€ ๋„์‹œ ์ธ๊ณผ์—ฐ๊ตฌ ํŒŒ์ดํ”„๋ผ์ธ ์ „์ฒด๋ฅผ ์ž๋™ํ™”ํ•œ ์‹ค์ œ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ๊ตฌ์ฒดํ™”์‹œํ‚จ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Hypothesis Generation for Materials Discovery and Design ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ LLM ๊ธฐ๋ฐ˜ ์ธ๊ณผ์ถ”๋ก ์  ๊ฐ€์„ค ์ƒ์„ฑ์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ๋„์‹œ๊ณผํ•™ ์ž๋™ํ™”์—๋„ ์ ์šฉํ•  ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Researchtown ๋…ผ๋ฌธ์€ ๋„์‹œ๊ณผํ•™ ๋Œ€์‹  ์ „์ฒด ์—ฐ๊ตฌ์ž ์ปค๋ฎค๋‹ˆํ‹ฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ LLM์œผ๋กœ ์ง„ํ–‰ํ•ด 660์ด ์ง€ํ–ฅํ•˜๋Š” ์—ฐ๊ตฌ์ž ์ง‘๋‹จ์˜ ๋™์  ์ž๋™ํ™” ๋ฌธ์ œ์—์„œ ๋Œ€์ฒด์  ์ ‘๊ทผ๋ฒ•์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋”ฅ ์”ฝํ‚น๊ณผ ๊ฒ€์ƒ‰ ๋Šฅ๋ ฅ์ด ๊ฒฐํ•ฉ๋œ ๋ณต์žกํ•œ ์ธ๊ณผ์ถ”๋ก  ๋ฌธ์ œ์— LLM์ด ์–ด๋–ป๊ฒŒ ์ ‘๊ทผํ•˜๋Š”์ง€ ๋Œ€์•ˆ์ ์œผ๋กœ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Reimagining urban science ๋…ผ๋ฌธ์€ ๋„์‹œ๊ณผํ•™ ๋ฐ ์˜์ƒ๋ช…๊ณผํ•™ ๋“ฑ ์ „๋ฌธ ์˜์—ญ์—์„œ LLM์„ ํ™œ์šฉํ•œ ๋ณต์žกํ•œ ์ •๋ณด ์ถ”๋ก  ๋ฐ ๋งž์ถคํ˜• ์ „๋žต ๋„์ถœ์„ ์‹œ๋„ํ•˜๋Š” ๋Œ€์•ˆ ์—ฐ๊ตฌ์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ํฌ๋กœ์Šค ๋„๋ฉ”์ธ ์ •์ฑ… ์ „์ด์˜ ํŠน์ • ์ธก๋ฉด์„ ํ™•์žฅํ•˜์—ฌ ๋‹ค๋ฃจ๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
SciReplicate-Bench๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์  ์žฌํ˜„ ์‹คํ—˜์„ ๋ฒค์น˜๋งˆํฌํ™”ํ•˜์—ฌ, ๋„์‹œ ์ธ๊ณผ ์ถ”๋ก  ์—ฐ๊ตฌ ์ž๋™ํ™” ์‹œ์Šคํ…œ์˜ ๊ฐ๊ด€์  ํ‰๊ฐ€ ๋ฐ ํ™•์žฅ์— ์ฐธ๊ณ ํ•  ๋งŒํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๋„์‹œ ์ธ๊ณผ ์ถ”๋ก  ๋ฐ ์ •์ฑ…ํ•ด์„๊ณผ ๊ฐ™์€ ๋ณตํ•ฉ์  ๊ณผํ•™ ์˜์‚ฌ์†Œํ†ต ๋ฐ ํ”ผ๋“œ๋ฐฑ์ด ํ•„์š”ํ•œ ํ˜‘๋ ฅ ์‚ฌ๋ก€์— ์˜๋ฏธ๊ทธ๋ž˜ํ”„ ์ ‘๊ทผ ๋ฐฉ์‹์ด ์ ์šฉ๋  ์ˆ˜ ์žˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
594๋ฒˆ์˜ OSDA Agent์™€ ๊ฐ™์ด LLM์ด ๋„๋ฉ”์ธ ํŠนํ™” ๊ณผํ•™์„ค๊ณ„ ํŒŒ์ดํ”„๋ผ์ธ์„ ์ž๋™ํ™”ํ•˜๋Š” ๊ตฌ์กฐ๋Š” 660๋ฒˆ UrbanCIA์˜ ํ™•์žฅ์  ์ ์šฉ ์‚ฌ๋ก€๊ฐ€ ๋œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
660๋ฒˆ์˜ UrbanCIA ํ”„๋ ˆ์ž„์›Œํฌ๋Š” LLM ๊ธฐ๋ฐ˜์œผ๋กœ ๋„์‹œ ์ธ๊ณผ์ถ”๋ก  ๋“ฑ ์ƒˆ๋กœ์šด ๊ณผํ•™์  ์—ฐ๊ตฌ ์ž๋™ํ™”์˜ ๊ตฌ์ฒด์  ์˜ˆ์‹œ๋ฅผ ์ œ์‹œํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๋Œ€๊ทœ๋ชจ causal inference ๋ฐ city-scale ๊ณผํ•™ ๋ฐœ๊ฒฌ์—์„œ LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ ์‹ ๋ขฐ์™€ ์„ ํƒ์  ํƒ์ƒ‰ ๋ฐฉ๋ฒ•๋ก ์ด ํ™•์žฅ ํ™œ์šฉ๋œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •