How deep do large language models internalize scientific literature and citation practices? arXiv preprint arXiv:2504.02767, 2025.

์ €์ž: Andres Algaba, Vincent Holst, Floriano Tori, Melika Mobini, Brecht Verbeken, Sylvia Wenmackers, Vincent Ginis | ๋‚ ์งœ: 2025 | DOI: N/A 📄 PDF


Essence

Figure 1

๊ทธ๋ฆผ 1: ๋…ผ๋ฌธ์˜ ์ œ๋ชฉ, ์ €์ž, ์—ฐ๋„, ํ•™์ˆ ์ง€, ์ดˆ๋ก์„ ๊ธฐ๋ฐ˜์œผ๋กœ LLM์ด ์ƒ์„ฑํ•œ ์ฐธ๊ณ ๋ฌธํ—Œ๊ณผ ์ธ๊ฐ„์˜ ์ธ์šฉ ํŒจํ„ด์„ ๋น„๊ตํ•˜๋Š” ์‹คํ—˜ ๊ฐœ์š”

๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์ด ๊ณผํ•™ ๋…ผ๋ฌธ์˜ ์ฐธ๊ณ ๋ฌธํ—Œ ์ƒ์„ฑ ์‹œ ์ด๋ฏธ ์ธ์šฉ๋„๊ฐ€ ๋†’์€ ๋…ผ๋ฌธ๋“ค์„ ์ง€์†์ ์œผ๋กœ ์„ ํ˜ธํ•จ์œผ๋กœ์จ ์ธ์šฉ์˜ ๋งˆํƒœ ํšจ๊ณผ(Matthew effect)๋ฅผ ๊ฐ•ํ™”ํ•˜๋ฉฐ, ์ด๋Š” ํ•™๋ฌธ ์˜์—ญ ๊ฐ„ ํŽธํ–ฅ์˜ ์ฐจ์ด์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์ผ๊ด€๋˜๊ฒŒ ๋‚˜ํƒ€๋‚œ๋‹ค. ์ด๋Ÿฌํ•œ ํ˜„์ƒ์€ ๊ณผํ•™ ์ง€์‹์˜ ๋ฐœ๊ฒฌ๊ณผ ํ™•์‚ฐ ๋ฐฉ์‹์„ ์žฌํ˜•์„ฑํ•  ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ๋‹ค.

Motivation

Achievement

Figure 3

๊ทธ๋ฆผ 3: ํ•™๋ฌธ ์˜์—ญ๊ณผ ์‹œ๊ฐ„์— ๋”ฐ๋ฅธ ์ƒ์„ฑ ์ฐธ๊ณ ๋ฌธํ—Œ์˜ ์กด์žฌ์œจ(existence rate) ๋ฐ ์ธ์šฉ ํŠน์„ฑ ๋น„๊ต

  1. ๋งˆํƒœ ํšจ๊ณผ์˜ ๊ฐ•ํ™”(Matthew effect reinforcement): LLM์ด ์ƒ์„ฑํ•œ ์ฐธ๊ณ ๋ฌธํ—Œ ์ค‘ ์‹ค์ œ๋กœ ์กด์žฌํ•˜๋Š” ์ฐธ๊ณ ๋ฌธํ—Œ๋“ค(existence rate 42.6%)์€ ์ธ๊ฐ„์˜ ์ฐธ๊ณ ๋ฌธํ—Œ ๋Œ€๋น„ ํ˜„์ €ํžˆ ๋†’์€ ์ค‘์•™๊ฐ’ ์ธ์šฉ๋„๋ฅผ ๋ณด์ž„. ์ด๋Š” ์ด๋ฏธ ์ธ์šฉ๋„ ๋†’์€ ๋…ผ๋ฌธ์ด ๋”์šฑ ๋งŽ์€ ์ถ”๊ฐ€ ์ธ์šฉ์„ ๋ฐ›๋Š” ๋ˆ„์  ์šฐ์œ„ ํ˜„์ƒ์„ ์˜๋ฏธํ•˜๋ฉฐ, ๋ชจ๋“  ํ•™๋ฌธ ์˜์—ญ๊ณผ ์‹œ๊ฐ„ ๊ธฐ๊ฐ„์— ๊ฑธ์ณ ์ผ๊ด€๋˜๊ฒŒ ๊ด€์ฐฐ๋จ.
  2. ํ•™๋ฌธ ์˜์—ญ๋ณ„ ํŽธ์ฐจ: ์ธ๋ฌธํ•™๊ณผ ์‚ฌํšŒ๊ณผํ•™์—์„œ๋Š” 40-50%์˜ ๋†’์€ ์กด์žฌ์œจ์„ ๋ณด์ด๋Š” ๋ฐ˜๋ฉด, ์ •ํ™•ํ•œ ๊ณผํ•™(exact sciences)์—์„œ๋Š” ๋” ๋‚ฎ์€ ์กด์žฌ์œจ์„ ๋‚˜ํƒ€๋ƒ„. ์ด๋Š” ์ธ๋ฌธํ•™๊ณผ ์‚ฌํšŒ๊ณผํ•™์ด ๋” ์˜ค๋ž˜๋œ ์ฐธ๊ณ ๋ฌธํ—Œ์„ ์ธ์šฉํ•˜๋Š” ๊ฒฝํ–ฅ๊ณผ ๊ด€๋ จ๋จ.
  3. ์ฒด๊ณ„์ ์ธ ์ธ์šฉ ํŽธํ–ฅ: LLM์€ ๋” ์ตœ๊ทผ์˜ ์ฐธ๊ณ ๋ฌธํ—Œ(๋” ์งง์€ ์ œ๋ชฉ, ๋” ๋งŽ์€ ์ €์ž)์„ ์„ ํ˜ธํ•˜๋ฉฐ, ์ด๋Š” ์ธ๊ฐ„์˜ ์ธ์šฉ ํŒจํ„ด๊ณผ ์ผ๋ถ€ ์ฐจ์ด๋ฅผ ๋ณด์ž„. ์˜๋ฏธ๋ก ์  ์œ ์‚ฌ์„ฑ(textual embedding) ๋ถ„์„ ๊ฒฐ๊ณผ, ์ƒ์„ฑ๋œ ์ฐธ๊ณ ๋ฌธํ—Œ์˜ ์˜๋ฏธ์  ์ ์ ˆ์„ฑ์€ ์ธ๊ฐ„์˜ ์ฐธ๊ณ ๋ฌธํ—Œ๊ณผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋Š” ์ˆ˜์ค€์ด๋‚˜, ๋„คํŠธ์›Œํฌ ํŠน์„ฑ์—์„œ๋Š” ์ €์ž ์ž๊ธฐ์ธ์šฉ์„ ๊ฐ์†Œ์‹œํ‚ด.

How

Figure 4

๊ทธ๋ฆผ 4: ์ƒ์„ฑ๋œ ์ฐธ๊ณ ๋ฌธํ—Œ์˜ ์ฒด๊ณ„์  ํŽธํ–ฅ - ๋ฐœํ–‰์—ฐ๋„, ์ €์ž ์ˆ˜, ์ œ๋ชฉ ๊ธธ์ด ์„ ํ˜ธ๋„

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ LLM์ด ๊ณผํ•™ ์ฐธ๊ณ ๋ฌธํ—Œ ์ƒ์„ฑ ์‹œ ์ฒด๊ณ„์ ์œผ๋กœ ๋งˆํƒœ ํšจ๊ณผ๋ฅผ ๊ฐ•ํ™”ํ•˜๋ฉฐ ์ธ๊ฐ„์˜ ์ธ์šฉ ๊ด€ํ–‰๊ณผ ์ฐจ์ด๋ฅผ ๋ณด์ธ๋‹ค๋Š” ์ค‘์š”ํ•œ ๋ฐœ๊ฒฌ์„ ๋Œ€๊ทœ๋ชจ ์‹ค์ฆ ๋ฐ์ดํ„ฐ๋กœ ์ œ์‹œํ•˜์—ฌ, AI ๋„์ž…์ด ๊ณผํ•™์  ์ง€์‹ ๋ฐœ๊ฒฌ์˜ ํ˜•ํƒœ๋ฅผ ์žฌํŽธํ•  ์ˆ˜ ์žˆ์Œ์„ ์‹œ์‚ฌํ•œ๋‹ค. ๋‹ค๋งŒ ์ˆœ์ˆ˜ ๋งค๊ฐœ๋ณ€์ˆ˜ ์ง€์‹ ๊ธฐ๋ฐ˜ ํ‰๊ฐ€๋ผ๋Š” ์ œํ•œ๊ณผ ํ•™๋ฌธ ์˜์—ญ ํ‘œ๋ณธ ํŽธํ–ฅ์„ ๊ณ ๋ คํ•  ๋•Œ, ์‹ค์ œ ์šด์˜ ํ™˜๊ฒฝ์—์„œ์˜ ์˜ํ–ฅ์€ ์ถ”๊ฐ€ ๊ฒ€์ฆ์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
The Matthew effect in science funding ๋…ผ๋ฌธ์€ ์ธ์šฉ์˜ ๋งˆํƒœ ํšจ๊ณผ์— ๋Œ€ํ•œ ๊ณ ์ „์  ๋ถ„์„์„ ์ œ๊ณตํ•˜์—ฌ, LLM์ด ํ•™๊ณ„ ํŽธํ–ฅ์„ ๋ชจ๋ฐฉํ•œ๋‹ค๋Š” ๋ณธ ๋…ผ๋ฌธ ์ฃผ์ œ์™€ ์ง์ ‘์  ์—ฐ๊ด€์„ฑ์„ ๊ฐ–์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Google Scholar ํฌ๊ธฐ์™€ ์ธ์šฉ ๋„คํŠธ์›Œํฌ ๋ถ„์„ ์—ฐ๊ตฌ๋Š” LLM ์ธ์šฉ ํŽธํ–ฅ ํ˜„์ƒ๊ณผ ๊ทธ ์˜ํ–ฅ ๋ถ„์„์˜ ๊ทผ๊ฑฐ ์ž๋ฃŒ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
How deep do large language models internalize scientific literature ๋…ผ๋ฌธ์€ LLM์˜ ๊ณผํ•™์  ์‚ฌ์‹ค ๋‚ด๋ฉดํ™” ๊นŠ์ด์— ์ดˆ์ ์„ ๋‘์–ด, TrustLLM์˜ ์‹ ๋ขฐ์„ฑ ์ธก์ •๊ณผ ๊ทผ๋ณธ์ ์œผ๋กœ ์—ฐ๊ด€๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM์˜ ๊ณผํ•™์  ๋ฐœ๊ฒฌ, ์ธ์šฉ ๋ฐ ํŽธํ–ฅ ์ธก์ •์— ๋Œ€ํ•œ ์ฒด๊ณ„์  ๋ฒค์น˜๋งˆํ‚น์œผ๋กœ ์ธ์šฉ ๋™์—ญํ•™ ๋ถ„์„๊ณผ์˜ ์ ‘์ ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
How deep do large language models internalize scientific literature๋Š” LLM์ด ์‹ค์ œ ์ง€์‹์„ ๋‚ด์žฌํ™”ํ•œ ์ •๋„์™€ ํ™œ์šฉ์˜ ์ฐจ์ด๋ฅผ ๋ถ„์„ํ•ด ๋ณธ ๋…ผ๋ฌธ์˜ ๋ฐฐ๊ฒฝ์  ์ด๋ก ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
How deep do large language models internalize scientific literature ๋…ผ๋ฌธ์€ LLM์ด ๊ณผํ•™์  ์ง€์‹์„ ๋‚ด์žฌํ™”(memory)ํ•œ๋‹ค๋Š” LLM-Metrics์˜ ๊ธฐ๋ณธ๊ฐ€์„ค์— ๋Œ€ํ•œ ์‹ค์ฆ์  ๋ถ„์„์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
410๋ฒˆ 'How deep do large language models internalize scientific lit' ๋…ผ๋ฌธ์€ LLM์˜ ๊ณผํ•™ ์ง€์‹ ๋‚ด์žฌํ™” ์ ‘๊ทผ๋ฒ•์œผ๋กœ, ์‹คํ—˜์  ์ œ์–ดยท์ž๋™ํ™”(662)์™€๋Š” ๊ทผ๋ณธ์ ์œผ๋กœ ๋‹ค๋ฅธ ๋Œ€์•ˆ์  ์‹œ๊ฐ์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌยท์นดํ…Œ๊ณ ๋ฆฌ๋ณ„ ์ธ์šฉ ์ถ”๋ก  ๋ฐ ํŽธํ–ฅ ํ˜„์ƒ๊นŒ์ง€ ํฌํ•จํ•˜์—ฌ LLM์˜ ํ•™๋ฌธ ์ง€์‹ ๋‚ด์žฌํ™” ๋ฒ”์œ„๋ฅผ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋Œ€๊ทœ๋ชจ ํ•™์ˆ  ๋ฐ์ดํ„ฐ ์š”์•ฝยท์ •๋ ฌ๊ณผ LLM์˜ ์ธ์šฉยท์ง€์‹ ๋‚ด๋ถ€ํ™” ๋ฉ”์ปค๋‹ˆ์ฆ˜์˜ ์ƒํ˜ธ์ž‘์šฉ์„ ๋น„๊ต ๋ถ„์„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™์  ํ˜์‹ ์„ฑ ์ธก์ • ๋ฐฉ๋ฒ•๋ก ์„ ๋‹ค๋ฅธ ๊ด€์ ์—์„œ ์ ‘๊ทผํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ธ์šฉ ์ถ”์ฒœ ๋ฐ ์ƒ์„ฑ์—์„œ LLM์˜ ์ธ์šฉ ํŒจํ„ด, ๋งˆํƒœ ํšจ๊ณผ ํ™•๋Œ€ ๋“ฑ ํ˜„์ƒ์— ๋Œ€ํ•œ ํ†ต์ฐฐ์„ ์ฒด๊ณ„์ ์œผ๋กœ ์กฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ณผํ•™์  ๋…ผ๋ฌธ์—์„œ์˜ ๋งˆํƒœ ํšจ๊ณผ(ํŽธํ–ฅ) ๋‚ด์žฌํ™” ๋ถ„์„์„, LLM์ด ๋งŒ๋“ค์–ด๋‚ด๋Š” ์•”๋ฌต์  ๊ทœ๋ฒ” ๋“œ๋Ÿฌ๋‚ด๊ธฐ ๋…ผ์˜์™€ ์—ฐ๊ณ„ํ•˜์—ฌ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM์ด ๊ณผํ•™ ์ธ์šฉ ํŒจํ„ด, ๋งˆํƒœํšจ๊ณผ ๋“ฑ ์ง€์‹ ํ™•์‚ฐ๊ตฌ์กฐ๋ฅผ ๊ฐ•ํ™”ํ•˜๋Š” ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ๋Š” ๋…ผ์˜๊ฐ€ AI-๋ณด์กฐ ์ „์ฒด ์—ฐ๊ตฌ ์ƒ์• ์ฃผ๊ธฐ ๋…ผ๋ฌธ๊ณผ ์ง๊ฒฐ๋œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
LLM ๊ธฐ๋ฐ˜ ์ธ์šฉ ํŒจํ„ด ๊ฐ•ํ™”, ์žฌํ˜„์„ฑ ๋“ฑ AI ๋„์ž…์œผ๋กœ ์ธํ•œ ์ƒˆ๋กœ์šด ํ•™๋ฌธ ๊ตฌ์กฐ ๋ฌธ์ œ๋ฅผ ์ข…ํ•ฉ์ ์œผ๋กœ ๋‹ค๋ฃฌ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
LLM์˜ ๋…ผ๋ฌธ ์ธ์šฉ ํŽธํ–ฅ ๋ฌธ์ œ๋ฅผ ์ง€์‹ ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์ด ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋Š”์ง€, ์ ‘๊ทผ๋ฒ•์˜ ์ฐจ์ด๋ฅผ ๋น„๊ตํ•˜๋Š”๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •