Language models surface the unwritten code of science and society

์ €์ž: Honglin Bao, Siyang Wu, Jiwoong Choi, Yingrong Mao, James A. Evans (University of Chicago) | ๋‚ ์งœ: 2025 | DOI: arXiv:2505.18942 📄 PDF


Essence

Figure 1

์ž๊ธฐ-๊ฐ•ํ™”(self-reinforcement)๋ฅผ ํ†ตํ•ด ์•”๋ฌต์  ๊ทœ๋ฒ”์„ ์ ์ง„์ ์œผ๋กœ ์ฆํญ์‹œ์ผœ ๋ชจ๋ธ์ด ๋ช…์‹œ์ ์œผ๋กœ ํ‘œํ˜„ํ•˜๋„๋ก ์œ ๋„ํ•˜๋Š” ๊ฐœ๋…์  ํ‹€

๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์ด ๋‚ด์žฌ๋œ ํŽธํ–ฅ์„ ์ง„๋‹จ ๋„๊ตฌ๋กœ ํ™œ์šฉํ•˜์—ฌ ๊ณผํ•™๊ณผ ์‚ฌํšŒ์˜ "๋ถˆ๋ฌธ์œจ(unwritten code)" โ€” ์•”๋ฌต์  ๊ณ ์ •๊ด€๋…, ํœด๋ฆฌ์Šคํ‹ฑ, ์•”์ˆ˜์ •์ธ ๊ทœ๋ฒ” โ€” ์„ ๋ช…์‹œ์ ์œผ๋กœ ๋“œ๋Ÿฌ๋‚ด๊ณ  ๋น„ํŒ ๋Œ€์ƒ์œผ๋กœ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค๋Š” ์ฃผ์žฅ.

Motivation

Achievement

Figure 2

๊ฐ€์„ค ํƒ์ƒ‰์„ ํ†ตํ•œ ์„ ํ—˜์  ์‹ ๋…์—์„œ ์‚ฌํ›„์  ์‹ ๋…์œผ๋กœ์˜ ์ „ํ™˜ ๊ณผ์ •

  1. ์€ํ๋œ ๋™๋ฃŒ์‹ฌ์‚ฌ ๊ธฐ์ค€ ๋ฐœ๊ตด: 46๊ฐœ ํ•™์ˆ  ์ปจํผ๋Ÿฐ์Šค์˜ 26,731ํŽธ ๋…ผ๋ฌธ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„์„ํ•˜์—ฌ, ์‹ฌ์‚ฌ์ž๋“ค์ด ๋ช…์‹œ์ ์œผ๋กœ ์–ธ๊ธ‰ํ•˜์ง€ ์•Š์œผ๋ฉด์„œ๋„ ์•”๋ฌต์ ์œผ๋กœ ๋ณด์ƒํ•˜๋Š” ํ‰๊ฐ€ ๊ธฐ์ค€์„ ์‹๋ณ„. ์ด๋ก ์  ์—„๋ฐ€์„ฑ(theoretical rigor)์€ LLM์˜ ์„ ํ—˜์  ์‹ ๋…๊ณผ ๋ถ€ํ•ฉํ•˜์ง€๋งŒ(์ƒ๊ด€๊ณ„์ˆ˜=0.49), ๋งฅ๋ฝํ™”์™€ ์Šคํ† ๋ฆฌํ…”๋ง(contextualization & storytelling)์€ ์‹ฌ์‚ฌ์ž๋“ค์ด ๋ช…์‹œ์ ์œผ๋กœ ํ”ผํ•˜๋ฉด์„œ(์ƒ๊ด€๊ณ„์ˆ˜=-0.14) ๋™์‹œ์— ์ ์ˆ˜๋กœ๋Š” ์•”๋ฌต์ ์œผ๋กœ ๋ณด์ƒํ•จ.
  2. ์ผ๊ด€๋œ ํŽธํ–ฅ ํŒจํ„ด ํ™•์ธ: ์„ ํ—˜์  ์‹ ๋…์˜ ์šฐ์œ„์—์„œ ์‚ฌํ›„์  ํŒ๋‹จ์œผ๋กœ์˜ ์ „ํ™˜์ด ๋‹ค์–‘ํ•œ ๋ชจ๋ธ๊ณผ ํ‘œ๋ณธ ์™ธ(out-of-sample) ํ‰๊ฐ€์—์„œ ๊ฐ•๊ฑดํ•˜๊ฒŒ ๋‚˜ํƒ€๋‚จ. 4๋ผ์šด๋“œ ๋ฐ˜๋ณต ํƒ์ƒ‰์œผ๋กœ 20๊ฐœ ๊ฐ€์„ค์ด 97%์˜ ์‚ฌ๋ก€๋ฅผ ์„ค๋ช….

How

Figure 4

์„ ํ—˜์  ์‹ ๋… ๋Œ€๋น„ ์‚ฌํ›„์  ์‹ ๋…: ๊ฐ ๊ฐ€์„ค์˜ ์ง€์ˆ˜๋Š” ์„ ํ—˜ ๋นˆ๋„ ๋ณ€ํ™”์˜ ์ˆœ์œ„๋ฅผ ๋‚˜ํƒ€๋ƒ„

๋ฐฉ๋ฒ•๋ก ์  ํŠน์ง•:

Originality

Limitation & Further Study

ํ›„์† ์—ฐ๊ตฌ:

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.2/5

์ดํ‰: ์ด ๋…ผ๋ฌธ์€ LLM์˜ ํŽธํ–ฅ์„ ์‚ฌํšŒ ์ง„๋‹จ์˜ ๋„๊ตฌ๋กœ ์žฌํ•ด์„ํ•˜๋Š” ํ˜์‹ ์  ๊ด€์ ์„ ์ œ์‹œํ•˜๋ฉฐ, ๊ณผํ•™ ํ‰๊ฐ€์˜ ์•”๋ฌต์  ๊ธฐ์ค€์„ ์ตœ์ดˆ๋กœ ๊ทœ๋ช…ํ•œ ์—„๋ฐ€ํ•œ ์‹ค์ฆ ์—ฐ๊ตฌ๋‹ค. ๋‹ค๋งŒ ์ธ๊ณผ์„ฑ ํ™•๋ฆฝ, ์‹ค์ œ ์ œ๋„ ๊ฐœ์„  ํšจ๊ณผ ๊ฒ€์ฆ, ๊ทธ๋ฆฌ๊ณ  ์ด๋Ÿฌํ•œ "๋ถˆ๋ฌธ์œจ" ๊ณต๊ฐœ์˜ ์œค๋ฆฌ์  ํ•จ์˜์— ๋Œ€ํ•œ ๋” ๊นŠ์€ ์„ฑ์ฐฐ์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์—ฐ๊ตฌ๋น„ ๋ฐฐ๋ถ„์˜ ๋™๋ฃŒํ‰๊ฐ€ ํŽธํ–ฅ ๋ฌธ์ œ๋ฅผ ์ด๋ก ์ ์œผ๋กœ ๋ถ„์„ํ•œ ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์—์ด์ „ํ‹ฑ AI๊ฐ€ ๊ณผํ•™์  ๊ทœ๋ฒ” ๋ฐ ๊ฐ€์„คํ™”์— ๋ฏธ์น˜๋Š” ๊ตฌ์กฐ์  ์˜ํ–ฅ์— ๋Œ€ํ•œ ํฌ๊ด„์  ์„œ๋ฒ ์ด๋กœ, '๋ถˆ๋ฌธ์œจ' ์ฝ”๋“œ ์ง„๋‹จ์˜ ์ด๋ก ์  ๋ฐ”ํƒ•์„ ์ œ๊ณตํ•จ.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์˜ ๋ฌธํ™”ยท์‚ฌํšŒ์  ์ง„ํ™” ๋ฐ ์ง‘๋‹จ์  ๊ทœ๋ฒ” ํ•™์Šต์„ LLM ๊ตฐ์ง‘ ์ˆ˜์ค€์—์„œ ๋‹ค๋ฃจ์–ด, ์•”๋ฌต์  ๊ทœ๋ฒ” ๋“œ๋Ÿฌ๋‚ด๊ธฐ์™€ ์—ฐ๊ฒฐ๋จ.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹ค์ค‘ ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ์‹ฌ์‚ฌ์™€ ์‚ฌํšŒ์  ๊ฒ€ํ† ๋ฅผ ํ†ตํ•ด ๊ทœ๋ฒ”/ํŽธํ–ฅ ํ‘œ์ถœ ํšจ์šฉ์„ฑ์„ ๋ณด์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์‹ ๋ขฐ์„ฑ๊ณผ ์žฌํ˜„์„ฑ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ํ•ด๊ฒฐํ•˜๋ ค๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
BiasFilter(158)๋Š” LLM์˜ ํŽธํ–ฅ ํƒ์ง€ ๋ฐ ์ˆ˜์ •์ด๋ผ๋Š” ์œ ์‚ฌ ๋ฌธ์ œ์— ๋Œ€ํ•ด ์‹ค์งˆ์  ๋””๋ฐ”์ด์‹ฑ ๊ธฐ๋ฒ•์œผ๋กœ ์ ‘๊ทผํ•ด 460์˜ ์ง„๋‹จ์—์„œ ๊ฐœ์ž…๊นŒ์ง€ ๋…ผ์˜๋ฒ”์œ„๋ฅผ ๋„“ํž ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ํŽ€๋”ฉ ๋ฐ ์—ฐ๊ตฌ ์ง€์› ์‹œ์Šคํ…œ์˜ ๊ฐœํ˜์„ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ์ ‘๊ทผํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ํ‰๊ฐ€์˜ ์œค๋ฆฌ์  ๊ณ ๋ ค์‚ฌํ•ญ์„ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM์˜ ์ธ์šฉ ํŽธํ–ฅ ๋ฐ ๋งˆํƒœ ํšจ๊ณผ ๊ฐ•ํ™” ํ˜„์ƒ์ด ์•”๋ฌต์  ๊ทœ๋ฒ” ๋“œ๋Ÿฌ๋‚ด๊ธฐ ๋…ผ์˜์™€ ๋งž๋‹ฟ์•„ ์žˆ์–ด, ์ƒํ˜ธ ๊ด€์  ๋ณด์™„์— ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM์ด ์ธ๊ฐ„์˜ ์ธ๊ณผ์  ํŽธํ–ฅ ๋ฐ ์‹ฌ๋ฆฌ์  ์ฝ”๋“œ๊นŒ์ง€ ๋“œ๋Ÿฌ๋‚ด๊ณ  ๋น„ํŒ ๋Œ€์ƒ์œผ๋กœ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค๋Š” ๋ถ„์„์ด ๋ณธ ๋…ผ๋ฌธ์˜ ์‹คํ—˜์  ํ™•์žฅ์ž…๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
LLM์˜ ํŽธํ–ฅ๊ณผ ๊ณต์ •์„ฑ ๋ฌธ์ œ๋ฅผ self-debiasing ๋ฐฉ์‹์œผ๋กœ ์ฒ˜๋ฆฌํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๋‹ค๋ฃจ์–ด, ์•”๋ฌต์  ๊ทœ๋ฒ” ํƒ์ƒ‰์˜ ์‹ค์งˆ์  ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•จ.
๋ฐ˜๋ก /๋น„ํŒ
AI ๋„๊ตฌ ํ™œ์šฉ์ด ์ฝ˜ํ…์ธ  ๋‹ค์–‘์„ฑ ๊ฐ์†Œ ๋“ฑ ๋ถ€์ •์  ์ธก๋ฉด์„ ๋‹ค๋ฃจ์–ด LLM ๋‚ด์žฌ ํŽธํ–ฅ/๊ทœ๋ฒ” ๋…ธ์ถœํšจ๊ณผ์™€ ๋น„๊ต ๋น„ํŒ์ ์œผ๋กœ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •