How do humans and language models reason about creativity? a comparative analysis

์ €์ž: Antonio Laverghetta Jr., Tuhin Chakrabarty, Tom Hope, Jimmy Pronchick, Krupa Bhawsar, Roger E. Beaty | ๋‚ ์งœ: 2025 | DOI: arXiv:2502.03253v2 📄 PDF


Essence

Figure 3

์ธ๊ฐ„๊ณผ GPT-4O-MINI์˜ ์ฐฝ์˜์„ฑ ์ ์ˆ˜ ๋น„๊ต

๋ณธ ๋…ผ๋ฌธ์€ STEM ๋ถ„์•ผ์˜ ์ฐฝ์˜์„ฑ ํ‰๊ฐ€์—์„œ ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€์™€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์ด ์–ด๋–ป๊ฒŒ ๋‹ค๋ฅด๊ฒŒ ์ถ”๋ก ํ•˜๋Š”์ง€๋ฅผ ๋น„๊ต ๋ถ„์„ํ•œ๋‹ค. ์˜ˆ์‹œ ์ œ๊ณต ์—ฌ๋ถ€์— ๋”ฐ๋ฅธ ์ฐฝ์˜์„ฑ ํ‰๊ฐ€ ๋ฐฉ์‹์˜ ๋ณ€ํ™”๋ฅผ ํ†ตํ•ด ์ธ๊ฐ„๊ณผ AI์˜ ์ธ์ง€ ๋ฉ”์ปค๋‹ˆ์ฆ˜๊ณผ ํŽธํ–ฅ์˜ ์ฐจ์ด๋ฅผ ๊ทœ๋ช…ํ•œ๋‹ค.

Motivation

Achievement

Figure 1

์ธ๊ฐ„ ํ”ผ์–ด์Šจ ์ƒ๊ด€๊ณ„์ˆ˜ ๋น„๊ต

Figure 2

LLM ํ”ผ์–ด์Šจ ์ƒ๊ด€๊ณ„์ˆ˜ ๋น„๊ต

  1. ์ธ๊ฐ„์˜ ์ธ์ง€ ๊ณผ์ •์˜ ์ฐจ๋ณ„ํ™”:
    • ์˜ˆ์‹œ ๋ฏธ์ œ๊ณต ์ „๋ฌธ๊ฐ€: ๋น„๊ต ์–ธ์–ด("๋” ๋‚˜์Œ/๋ชปํ•จ") ๊ณผ๋‹ค ์‚ฌ์šฉ, ์ฐธ์‹ ์„ฑ ๊ฐ•์กฐ โ†’ ๋ฉ”๋ชจ๋ฆฌ ๊ฒ€์ƒ‰ ๊ธฐ๋ฐ˜ ๋น„๊ต ์˜์กด
    • ์˜ˆ์‹œ ์ œ๊ณต ์ „๋ฌธ๊ฐ€: ๋” ์ •๊ตํ•œ ํ‰๊ฐ€ ์„ค๋ช…, ๋‹ค์–‘ํ•œ ํ‰๊ฐ€ ๊ธฐ์ค€ ๊ณ ๋ ค
    • ๊ฐ™์€ ์ˆ˜์ค€์˜ ์ •ํ™•๋„์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์ธ์ง€ ํ”„๋กœ์„ธ์Šค ์ƒ์ด
  2. LLM์˜ ๋™์งˆํ™”๋œ ํ‰๊ฐ€ ๋ฉ”์ปค๋‹ˆ์ฆ˜:
    • ์˜ˆ์‹œ ๋ฏธ์ œ๊ณต: ์ฐธ์‹ ์„ฑ๊ณผ ์›๊ฑฐ๋ฆฌ์„ฑ ์šฐ์„ ์‹œ (์˜๋ฏธ ์œ ์‚ฌ์„ฑ ๊ธฐ๋ฐ˜)
    • ์˜ˆ์‹œ ์ œ๊ณต: ์ •ํ™•๋„ ํ–ฅ์ƒํ•˜๋‚˜, ์„ธ ๊ฐ€์ง€ ์ธก๋ฉด๊ณผ ์ฐธ์‹ ์„ฑ ๊ฐ„ ์ƒ๊ด€๊ณ„์ˆ˜ 0.99 ์ด์ƒ์œผ๋กœ ๊ธ‰์ฆ โ†’ ๊ฐœ๋ณ„ ์ธก๋ฉด์˜ ๋™์งˆํ™”/๊ตฌ๋ณ„ ๋ถˆ๊ฐ€

How

Figure 4

์ธ๊ฐ„๊ณผ GPT-4O-MINI ์„ค๋ช… ๋น„๊ต

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ STEM ์ฐฝ์˜์„ฑ ํ‰๊ฐ€์—์„œ ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€์™€ LLM์˜ ์ธ์ง€ ๋ฉ”์ปค๋‹ˆ์ฆ˜์˜ ๊ทผ๋ณธ์  ์ฐจ์ด๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ๊ทœ๋ช…ํ•˜๋Š” ์˜๋ฏธ ์žˆ๋Š” ์—ฐ๊ตฌ๋กœ, ๋งฅ๋ฝ ์ •๋ณด์˜ ์˜ํ–ฅ๊ณผ LLM์˜ ๋™์งˆํ™” ํ˜„์ƒ์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ๋ฐœ๊ฒฌ์„ ์ œ์‹œํ•œ๋‹ค. ๋‹ค๋งŒ ํ‘œ๋ณธ ๊ทœ๋ชจ ํ™•๋Œ€์™€ ๋‹ค์–‘ํ•œ ๋ชจ๋ธ ๋น„๊ต๋ฅผ ํ†ตํ•œ ์ผ๋ฐ˜ํ™” ๊ฐ•ํ™”๊ฐ€ ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
411์˜ ์ธ๊ฐ„๊ณผ ์–ธ์–ด๋ชจ๋ธ์˜ ์ฐฝ์˜์„ฑ ๋ฐ ์‚ฌ๊ณ ๊ณผ์ • ๋น„๊ต๋Š” 179์˜ LLM ์‹ฌ๋ฆฌํ•™ ์‹คํ—˜ ์žฌํ˜„ ๊ฒฐ๊ณผ ํ•ด์„์— ์ธ์ง€์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
411 ๋…ผ๋ฌธ์€ ์ธ๊ฐ„๊ณผ LLM์˜ ์ฐฝ์˜์  ์ถ”๋ก  ์ฐจ์ด๋ฅผ ์‚ฌ๋ก€๋ณ„๋กœ ๋ถ„์„ํ•˜์—ฌ, 186์˜ ํ‰๊ฐ€ ์ง€ํ‘œ ๊ฐœ๋ฐœ์— ์ฃผ์š” ์ธ์‚ฌ์ดํŠธ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
411 ๋…ผ๋ฌธ์€ ์ธ๊ฐ„ยทLLM์˜ ์ฐฝ์˜์„ฑ/์ƒ์ƒ๋ ฅ ๋‚ด์žฌํ™” ๊ธฐ์ œ๋ฅผ ์‹คํ—˜์ ์œผ๋กœ ํƒ์ƒ‰ํ•ด, 753์˜ shared imagination ๊ฐœ๋…์„ ๋’ท๋ฐ›์นจํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
AI ์•„์ด๋””์–ด์™€ ์ธ๊ฐ„ ์ฐฝ์˜์„ฑ, ๋‹ค์–‘์„ฑ, ์ง„ํ™”์— ๋Œ€ํ•œ ๋Œ€๊ทœ๋ชจ ์‹คํ—˜์  ์ฆ๊ฑฐ๋ฅผ ์ œ๊ณตํ•˜์—ฌ 411์˜ ์ธ๊ฐ„-AI ์ฐฝ์˜์„ฑ ๋น„๊ต ์—ฐ๊ตฌ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ๊ฐ•ํ™”ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ธ๊ฐ„๊ณผ LLM์˜ ์ฐฝ์˜์„ฑ ๋ฐ ์ธ์ง€๋ฐฉ์‹ ์ฐจ์ด๋ฅผ ์‹ค์ฆ์ ์œผ๋กœ ๋ถ„์„ํ•˜์—ฌ, LLM์˜ ์ธ๊ณผ ์ถ”๋ก  ํŽธํ–ฅ์ด ์ธ๊ฐ„ ์ธ์ง€์™€ ์–ด๋–ป๊ฒŒ ์—ฐ๊ฒฐ๋˜๋Š”์ง€ ๊ทผ๊ฑฐ๋ฅผ ๋งˆ๋ จํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
411 ๋…ผ๋ฌธ์€ ์ธ๊ฐ„ยทLLM ์ฐฝ์˜์„ฑ ๋น„๊ต๋ถ„์„์„ ํ†ตํ•ด 565์˜ ์ƒ์„ฑ ๋‹ค์–‘์„ฑ ๋ฐ ์‹ ๊ทœ์„ฑ ํ‰๊ฐ€ยท์„ค๊ณ„์˜ ํ‰๊ฐ€ ์ง€์นจ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ธ๊ฐ„ ์ฐฝ์˜์„ฑ ๊ฐœ๋… ๋ฐ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ณ ์ฐฐํ•˜๊ณ  ์žˆ๊ธฐ ๋•Œ๋ฌธ์—, ์ธ๊ฐ„-LLM ์ฐฝ์˜์„ฑ ๋น„๊ต ์—ฐ๊ตฌ์— ๊ธฐ๋ฐ˜์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ฐฝ์˜์„ฑ ํ‰๊ฐ€์—์„œ ์ธ๊ฐ„๊ณผ LLM๊ฐ„ reasoning ์ฐจ์ด๋ฅผ ๊ทœ๋ช…ํ•œ ๋…ผ๋ฌธ์ด์— ๊ธฐ๋ฐ˜ํ•ด, Idea-Catalyst ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์ฐฝ์˜์„ฑ ์ง€์› ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๊ฒ€์ฆ ๋…ผ์˜๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
How do humans and language models reason about creativity ๋…ผ๋ฌธ์€ LLM์ด ๊ณผํ•™์  ์ฐฝ์˜์„ฑ, ํ‘œ์ ˆ, ์˜ค๋ฅ˜ ๋ฐœ์ƒ์—์„œ ์ธ๊ฐ„๊ณผ ์–ด๋–ค ์ฐจ์ด๋ฅผ ๋ณด์ด๋Š”์ง€ ์‹ค์ฆ์ ์œผ๋กœ ๋‹ค๋ฃจ์–ด ChatGPT์˜ ๊ด‘๋ฒ”์œ„ํ•œ ๊ณผํ•™ ์˜ํ–ฅ ๋งฅ๋ฝ์—์„œ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ combinatorial creativity์™€ ์•„์ด๋””์–ด ์ƒ์„ฑ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋ฉฐ, ์ฐฝ์˜์„ฑ ์ถ”๋ก  ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๋ถ„์„์— ์ฐธ๊ณ ํ•  ๋งŒํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹ค์ค‘ LLM ํ˜‘์—…์— ์˜ํ•œ ๊ณผํ•™ ์•„์ด๋””์–ด ์ƒ์„ฑ ์—ฐ๊ตฌ๋Š” ์ธ๊ฐ„-LLM ๋˜๋Š” LLM ๊ฐ„ reasoning, ์ฐฝ์˜์„ฑ ๋ฐœํ˜„ ์ฐจ์ด๋ฅผ ๋น„๊ต ๋ถ„์„ํ•˜๋Š”๋ฐ ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™์  ์ฐฝ์˜์„ฑ ํ‰๊ฐ€์—์„œ LLM๊ณผ ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€์˜ ์‹ค์ œ ์•„์ด๋””์–ด ์ƒ์„ฑ ํ‰๊ฐ€๋ฅผ ์ •๋Ÿ‰์ ์œผ๋กœ ๋น„๊ตํ•˜๋ฏ€๋กœ, ์ธ์ง€ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๋ถ„์„์— ๋ณด์™„์ ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
411์€ ์ธ๊ฐ„๊ณผ LLM์˜ ์‹ฌ๋ฆฌยท์ธ๊ฒฉ ์˜ˆ์ธก ํ”„๋กœ์„ธ์Šค ์ฐจ์ด๋ฅผ ๋‹ค๊ฐ์ ์œผ๋กœ ๋ถ„์„ํ•˜์—ฌ 185์˜ ์‹ฌ๋ฆฌํ•™์  ์„ฑ๊ฒฉ ํŒ๋ณ„ ๊ฐœ์„ ๊ณผ ๋ณด์™„์  ๋…ผ์˜์— ์ฐธ๊ณ ํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์—ฐ๊ตฌ์ž๋“ค์ด LLM์„ ์—ฐ๊ตฌ ๋„๊ตฌ๋กœ ํ™œ์šฉํ•  ๋•Œ ์ธ๊ฐ„์  ์ถ”๋ก ๊ณผ์˜ ์ฐจ์ด ๋ฐ ์œค๋ฆฌ์  ์ธ์‹์„ ๋Œ€๊ทœ๋ชจ๋กœ ๋ถ„์„ํ•œ ์‹ค์ฆ ์—ฐ๊ตฌ๋กœ, ์ธ๊ฐ„-LLM ๋น„๊ต๋ถ„์„์— ์ƒํ˜ธ์ฐธ๊ณ ๋œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
411์€ ์ธ๊ฐ„๊ณผ LLM์˜ ์ฐฝ์˜๋ ฅ ์ถ”๋ก  ์ฐจ์ด๋ฅผ ์ถ”๊ฐ€์ ์œผ๋กœ ๋ถ„์„ํ•˜๋ฉฐ, 153์—์„œ ๋ฐœ๊ฒฌ๋œ AI-์ธ๊ฐ„ ๊ฐ„ ์ฐฝ์˜์„ฑ ๊ฒฉ์ฐจ์˜ ์‹ฌ์ธต์  ์ธ์ง€ ๊ตฌ์กฐ๋ฅผ ์กฐ๋ช…ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋‹ค์ค‘ ์—์ด์ „ํŠธ LLM ํ˜‘์—…์„ ํ†ตํ•œ ๊ณผํ•™์  ํ‰๊ฐ€(ํ”ผ์–ด ๋ฆฌ๋ทฐ) ์ƒ์„ฑ์œผ๋กœ, ์ธ๊ฐ„๊ณผ LLM ์ถ”๋ก  ๋ฐฉ์‹์˜ ํ˜‘๋ ฅ์ /์ฐจ๋ณ„์  ํŠน์„ฑ์„ ์‹ฌ์ธต ํƒ์ƒ‰ํ•  ์ˆ˜ ์žˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์ธ๊ฐ„๊ณผ LLM์˜ ์ฐฝ์˜์„ฑ ํ‰๊ฐ€ ์ฐจ์ด๋ฅผ ๋ถ„์„ํ•œ ๊ฒฐ๊ณผ๋Š” Interdisciplinary Inspiration ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ์–ด๋–ป๊ฒŒ ์‹ค์ œ ์ฐฝ์˜ ํ‘œํ˜„์— ์˜ํ–ฅ์„ ๋ฏธ์น˜๋Š”์ง€ ๊ฒ€์ฆํ•˜๋Š” ๊ทผ๊ฑฐ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
๋‚ด๋ถ€ ๊ตฌ์กฐ ๋ถ„์„์˜ ์ธ์ง€์  ํ•œ๊ณ„์™€ AI์™€ ์ธ๊ฐ„ ๊ฐ„ ์ถ”๋ก  ํŽธํ–ฅ์„ ๋‹ค๋ฃจ์–ด ๋‚ด๋ถ€ ๊ตฌ์กฐ์˜ ์˜๋ฏธ ํ•ด์„์— ๋น„ํŒ์  ์‹œ๊ฐ์„ ์ œ๊ณตํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •