Systematic Framework of Application Methods for Large Language Models in Language Sciences

์ €์ž: Kun Sun, Rong Wang | ๋‚ ์งœ: 2025-12-10 | DOI: 10.48550/arXiv.2512.09552 📄 PDF


Essence

๋ณธ ๋…ผ๋ฌธ์€ ์–ธ์–ด๊ณผํ•™ ๋ถ„์•ผ์—์„œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์˜ ๋ฌด๋ถ„๋ณ„ํ•œ ์ ์šฉ์œผ๋กœ ์ธํ•œ ๋ฐฉ๋ฒ•๋ก ์  ํ˜ผ๋ž€์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ์—ฐ๊ตฌ ๋ชฉํ‘œ์™€ LLM ๊ธฐ๋ฒ•์„ ์ฒด๊ณ„์ ์œผ๋กœ ์—ฐ๊ณ„ํ•˜๋Š” ๋‘ ๊ฐ€์ง€ ํฌ๊ด„์  ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•œ๋‹ค.

Motivation

Achievement

Figure 1: Systematic Framework for LLM-based Language Sciences

LLM ๊ธฐ๋ฐ˜ ์–ธ์–ด๊ณผํ•™ ์—ฐ๊ตฌ๋ฅผ ์œ„ํ•œ ์ฒด๊ณ„์  ํ”„๋ ˆ์ž„์›Œํฌ: ๋ฐฉ๋ฒ• ์„ ํƒ ํ”„๋ ˆ์ž„์›Œํฌ์™€ ๊ตฌํ˜„ ์„ค์ • ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๋‘ ๊ณ„์ธต ๊ตฌ์กฐ

  1. ๋ฐฉ๋ฒ•-์„ ํƒ ํ”„๋ ˆ์ž„์›Œํฌ(Method-Selection Framework): ์—ฐ๊ตฌ ๋ชฉํ‘œ์— ๋”ฐ๋ผ ์„ธ ๊ฐ€์ง€ ๊ธฐ๋ฒ•์„ ์ฒด๊ณ„ํ™”
    • ํ”„๋กฌํ”„ํŠธ ๊ธฐ๋ฐ˜ ์ƒํ˜ธ์ž‘์šฉ: ํƒ์ƒ‰์  ๋ถ„์„(exploratory analysis) ๋ฐ ๊ฐ€์„ค ์ƒ์„ฑ์šฉ
    • ํŒŒ์ธํŠœ๋‹: ์ด๋ก  ๊ธฐ๋ฐ˜ ๊ฒ€์ฆ์  ์กฐ์‚ฌ(confirmatory investigation) ๋ฐ ๊ณ ํ’ˆ์งˆ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ์šฉ
    • ๋งฅ๋ฝํ™”๋œ ์ž„๋ฒ ๋”ฉ(contextualized embeddings) ์ถ”์ถœ: ์ •๋Ÿ‰ ๋ถ„์„ ๋ฐ ๋ชจ๋ธ ๋‚ด๋ถ€ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ํƒ์นจ์šฉ
  2. ๊ตฌ์„ฑ ์„ค์ • ํ”„๋ ˆ์ž„์›Œํฌ(Configuration Framework): ๋‹ค๋‹จ๊ณ„ ์—ฐ๊ตฌ ํŒŒ์ดํ”„๋ผ์ธ์˜ ์‹ค์ œ ๊ตฌํ˜„์„ ์œ„ํ•œ ๊ตฌ์ฒด์  ์ง€์นจ ์ œ๊ณต์œผ๋กœ ์žฌํ˜„์„ฑ ๋ณด์žฅ
  3. ๊ฒฝํ—˜์  ๊ฒ€์ฆ: ํšŒ๊ณ ์  ๋ถ„์„(retrospective analysis), ์ „ํ–ฅ์  ์ ์šฉ(prospective application), ์ „๋ฌธ๊ฐ€ ํ‰๊ฐ€ ์กฐ์‚ฌ๋ฅผ ํ†ตํ•ด ํ”„๋ ˆ์ž„์›Œํฌ์˜ ํšจ๋Šฅ์„ฑ๊ณผ ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ ์ž…์ฆ

How

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.25/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ์–ธ์–ด๊ณผํ•™ ๋ถ„์•ผ์˜ LLM ์‘์šฉ์—์„œ ์˜ค๋ž˜๋œ ๋ฐฉ๋ฒ•๋ก ์  ํ˜ผ๋ž€์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ํฌ๊ด„์ ์ด๊ณ  ์ฒด๊ณ„์ ์ธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•จ์œผ๋กœ์จ, ํ•™๋ฌธ์  ์„ฑ์ˆ™๋„์™€ ์žฌํ˜„์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋Š” ์ค‘์š”ํ•œ ๊ธฐ์—ฌ๋ฅผ ํ•œ๋‹ค. ๋‹ค๋งŒ ๊ตฌ์ฒด์  ๋ฐ์ดํ„ฐ ํŽธํ–ฅ ๋Œ€์‘์ฑ…๊ณผ ์‹ ํฅ ๊ธฐ๋ฒ•์— ๋Œ€ํ•œ ์ง€์นจ ๊ฐ•ํ™”๊ฐ€ ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
A survey on large language model based autonomous agents ๋…ผ๋ฌธ์€ ๋‹ค์–‘ํ•œ LLM ๊ธฐ๋ฐ˜ agent ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๋ฐœ์ „ ๊ฒฝํ–ฅ ๋ถ„์„์œผ๋กœ ๋ณธ ๋…ผ๋ฌธ์˜ ๋ฐฉ๋ฒ•๋ก  ์ฒด๊ณ„ํ™” ๋…ผ์˜์™€ ์ง์ ‘ ์—ฐ๊ฒฐ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
A Survey of Large Language Models ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฒ•๊ณผ ํ™œ์šฉ๋ฐฉ์•ˆ์— ๋Œ€ํ•œ ํฌ๊ด„์ ์ธ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ ํ™œ์šฉ ๋ฐฉ๋ฒ•๋ก ์˜ ํ˜„ํ™ฉ๊ณผ ๋ถ„๋ฅ˜๋ฅผ ์‹ฌ๋„ ์žˆ๊ฒŒ ๋‹ค๋ค„ ๋ณธ ๋…ผ๋ฌธ์˜ ์ฒด๊ณ„์  ํ”„๋ ˆ์ž„์›Œํฌ์— ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM With Tools: A Survey ๋…ผ๋ฌธ์€ LLM ๋„๊ตฌ ์‚ฌ์šฉ ๋งฅ๋ฝ๋ณ„ ์ฒด๊ณ„ํ™”์— ๊ด€ํ•œ ๋…ผ์˜๋กœ, ๋ณธ ๋…ผ๋ฌธ์˜ LLM ๊ธฐ๋ฒ• ์ฒด๊ณ„ํ™” ๋ชฉ์ ๊ณผ ๋งž๋‹ฟ๋Š”๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Systematic Framework of Application Methods for Large Language Models ๋…ผ๋ฌธ์€ LLM์˜ ์‘์šฉ๋ฒ• ํ‰๊ฐ€์™€ ์—ฐ๊ณ„ํ•˜์—ฌ SciCode ๋ฒค์น˜๋งˆํฌ ํ™œ์šฉ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์–ธ์–ด๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์— ๊ด€ํ•œ Survey ๋…ผ๋ฌธ์€ LLM ์ ์šฉ ๋ฐฉ๋ฒ• ์ฒด๊ณ„ํ™” ํ•„์š”์„ฑ ๋…ผ์˜์˜ ๊ทผ๊ฐ„์ด ๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Towards an AI co-scientist ๋…ผ๋ฌธ์€ LLM์ด co-scientist๋กœ ์ž‘๋™ํ•  ๋•Œ ์š”๊ตฌ๋˜๋Š” ๋ฐฉ๋ฒ•๋ก  ๋ฐ ์œค๋ฆฌ์ , ์‹ ๋ขฐ์„ฑ ์ด์Šˆ๋ฅผ ๋…ผ์˜ํ•˜์—ฌ, ์ฒด๊ณ„์  LLM ์ ์šฉ ํ”„๋ ˆ์ž„์›Œํฌ์™€ ๋น„๊ต๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Structuring scientific innovation ๋…ผ๋ฌธ์€ ํ˜์‹ ์  ์—ฐ๊ตฌ ๋ฐฉ๋ฒ•๋ก ๊ณผ LLM ์ ์šฉ์„ ์—ฐ๊ฒฐํ•˜๋Š” ์ƒˆ๋กœ์šด ๋ถ„์„ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•ด ๋ฐฉ๋ฒ•๋ก  ์ฒด๊ณ„ํ™”์™€ ์œ ์‚ฌ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ๋ฐ ์–ธ์–ด๋ชจ๋ธ ์ ์šฉ ๋ฐฉ๋ฒ•์— ๋Œ€ํ•œ ๋‹ค์–‘ํ•œ ๊ด€์ ์„ ๋น„๊ตํ•ด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Agentic AI for Scientific Discovery: A Survey ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ์ถ”๋ก  ๋ฐ ๋‹ค์–‘ํ•œ ์ ์šฉ ์‚ฌ๋ก€/ํ•œ๊ณ„์ ์„ ํƒ๊ตฌํ•˜๋ฉฐ 784์˜ ์ฒด๊ณ„์  ๋ฐฉ๋ฒ•๋ก ๊ณผ ๊ด€์ ์„ ๊ณต์œ ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Systematic Framework of Application Methods ๋…ผ๋ฌธ์€ LLM ์ ์šฉ์˜ ์‹ ๋ขฐ์„ฑ ๋ฌธ์ œ์™€ ๋ฐฉ๋ฒ•๋ก ์  ํ˜ผ๋ˆ ํ•ด์†Œ๋ฅผ ์œ„ํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•ด, capability-reliability gap์˜ ์กฐ์ง์  ๋ถ„์„์„ ๋ณด์™„ํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์˜ ๋‹ค์–‘ํ•œ ์‘์šฉ๋ฒ• ์‚ฌ๋ก€๋ฅผ ์ฒด๊ณ„ํ™”ํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, 405์—์„œ์˜ ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• ๊ธฐ๋ฒ•์ด ๋‹ค๋ฅธ NLP ํƒœ์Šคํฌ์— ์–ด๋–ป๊ฒŒ ์ ์šฉ๋˜๋Š”์ง€ ํ†ต์ฐฐ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Systematic Framework of Application Methods ๋…ผ๋ฌธ์€ LLM์˜ ์ธ์ง€ ๋ฐ ํŽธํ–ฅ ๋ฌธ์ œ๋ฅผ ์–ธ์–ด๊ณผํ•™ ์—ฐ๊ตฌ์˜ ์ฒด๊ณ„์  ์ ์šฉ ํ”„๋ ˆ์ž„์›Œํฌ์™€ ์—ฐ๊ฒฐํ•˜์—ฌ ํ™œ์šฉ ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
ResearchGym์€ ์‹ค์ œ AI ์—ฐ๊ตฌ ๋…ผ๋ฌธ ์›Œํฌํ”Œ๋กœ์šฐ์—์„œ capability-reliability gap์„ ์‹ค์ฆ์ ์œผ๋กœ ๋“œ๋Ÿฌ๋‚ด์–ด, LLM ํ™œ์šฉ ํ”„๋ ˆ์ž„์›Œํฌ ์ ์šฉ์˜ ์‹ค์ œ ๋ฌธ์ œ๋ฅผ ๋ณด์—ฌ์ค€๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •