Large language models meet NLP: A survey

์ €์ž: Libo Qin, Qiguang Chen, Xiachong Feng, Yang Wu, Yongheng Zhang, Yinghui Li, Min Li, Wanxiang Che, Philip S. Yu | ๋‚ ์งœ: 2025 | DOI: https://doi.org/10.1007/sxxxxx-yyy-zzzz-1 📄 PDF


Essence

Figure 1

๋‹ค์–‘ํ•œ NLP ์ž‘์—…์— LLM ์ ์šฉ ์˜ˆ์‹œ (์ˆ˜ํ•™์  ์ถ”๋ก , ๊ธฐ๊ณ„ ๋ฒˆ์—ญ, ์ •๋ณด ์ถ”์ถœ, ๊ฐ์ • ๋ถ„์„)

๋ณธ ๋…ผ๋ฌธ์€ ChatGPT์™€ ๊ฐ™์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์˜ ์ž์—ฐ์–ธ์–ด์ฒ˜๋ฆฌ(NLP) ๋ถ„์•ผ ์‘์šฉ์„ ์ฒด๊ณ„์ ์œผ๋กœ ์กฐ์‚ฌํ•œ ์ฒซ ์ข…ํ•ฉ ์„œ๋ฒ ์ด๋กœ, LLM์ด ๊ธฐ์กด NLP ์ž‘์—…์„ ์–ด๋–ป๊ฒŒ ํ•ด๊ฒฐํ•˜๊ณ  ์žˆ์œผ๋ฉฐ ์•ž์œผ๋กœ์˜ ์ „๋ง์€ ๋ฌด์—‡์ธ์ง€๋ฅผ ๋‹ค๋ฃฌ๋‹ค.

Motivation

Achievement

Figure 2

ํŒŒ๋ผ๋ฏธํ„ฐ ๋™๊ฒฐ(a) ๋ฐ ํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹(b) ํŒจ๋Ÿฌ๋‹ค์ž„์˜ ๋ถ„๋ฅ˜์ฒด๊ณ„

  1. ์ฒซ ๋ฒˆ์งธ ์ข…ํ•ฉ ์„œ๋ฒ ์ด ์ œ๊ณต: LLM๊ณผ NLP์˜ ๊ด€๊ณ„๋ฅผ ๋‹ค๋ฃจ๋Š” ์ฒซ ์ฒด๊ณ„์  ์ข…ํ•ฉ ์กฐ์‚ฌ๋กœ, 3๊ฐ€์ง€ ํ•ต์‹ฌ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ๋‹ต๋ณ€ ์ œ์‹œ
  2. ์ƒˆ๋กœ์šด ๋ถ„๋ฅ˜ ์ฒด๊ณ„ ์ œ์•ˆ:
    • ํŒŒ๋ผ๋ฏธํ„ฐ ๋™๊ฒฐ ํŒจ๋Ÿฌ๋‹ค์ž„: ์ œ๋กœ์ƒท ํ•™์Šต, ํ“จ์ƒท ํ•™์Šต (ํŠœ๋‹ ๋ถˆํ•„์š”)
    • ํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹ ํŒจ๋Ÿฌ๋‹ค์ž„: ์ „์ฒด ํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹, ํŒŒ๋ผ๋ฏธํ„ฐ ํšจ์œจ์  ํŠœ๋‹ (LoRA, Prefix-tuning, QLoRA ๋“ฑ)
  3. ํŒจ๋Ÿฌ๋‹ค์ž„๋ณ„ ํŠน์„ฑ ๋ถ„์„:
  4. ์ƒˆ๋กœ์šด ์—ฐ๊ตฌ ๋ฐฉํ–ฅ ์ œ์‹œ: LLM for NLP์˜ ๋ฏธ๋ž˜ ๊ฒฝํ–ฅ๊ณผ ๊ด€๋ จ ๋„์ „ ๊ณผ์ œ ๋…ผ์˜
  5. ํ๋ ˆ์ด์…˜๋œ ์ž๋ฃŒ ์ œ๊ณต: ์˜คํ”ˆ์†Œ์Šค ๊ตฌํ˜„, ๊ด€๋ จ ์ฝ”ํผ์Šค, ์—ฐ๊ตฌ ๋…ผ๋ฌธ ๋ชฉ๋ก์„ ํฌํ•จํ•œ ์ฒซ LLM for NLP ์ž๋ฃŒ์ง‘ ๊ตฌ์ถ•

How

ํŒŒ๋ผ๋ฏธํ„ฐ ๋™๊ฒฐ ํŒจ๋Ÿฌ๋‹ค์ž„:

ํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹ ํŒจ๋Ÿฌ๋‹ค์ž„:

NLP ์ž‘์—…๋ณ„ ์ ์šฉ:

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.25/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ LLM ์‹œ๋Œ€ NLP ๋ถ„์•ผ์˜ ํ˜„ํ™ฉ์„ ์ตœ์ดˆ๋กœ ์ฒด๊ณ„์ ์œผ๋กœ ์ •๋ฆฌํ•œ ์ค‘์š”ํ•œ ์„œ๋ฒ ์ด๋กœ, ํŒŒ๋ผ๋ฏธํ„ฐ ๋™๊ฒฐ/ํŠœ๋‹ ์ด๋ถ„๋ฒ•์  ๋ถ„๋ฅ˜๋Š” ์‹ค๋ฌด์ž๋“ค์—๊ฒŒ ๋ช…ํ™•ํ•œ ์˜์‚ฌ๊ฒฐ์ • ๊ธฐ์ค€์„ ์ œ๊ณตํ•œ๋‹ค. ๋‹ค๋งŒ ์ œ๊ณต๋œ ๋ณธ๋ฌธ์ด ์ œํ•œ์ ์ด์–ด์„œ ๊ฐ NLP ์ž‘์—…๋ณ„ LLM์˜ ์‹ค์ œ ์„ฑ๋Šฅ ํ•œ๊ณ„ ๋ฐ ๋„์ „ ๊ณผ์ œ์— ๋Œ€ํ•œ ์‹ฌํ™” ๋…ผ์˜๊ฐ€ ์ถ”๊ฐ€๋œ๋‹ค๋ฉด ๋”์šฑ ์™„์„ฑ๋„ ๋†’์€ ์ž๋ฃŒ๊ฐ€ ๋  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์ถ”๋ก  ๊ธฐ๋ฒ• ์„œ๋ฒ ์ด๋ฅผ ํ†ตํ•ด NLP ๋ฐ ๋ฉ€ํ‹ฐํƒœ์Šคํ‚น LLM ๋ฐœ์ „ ํ๋ฆ„์„ ์ฒด๊ณ„์ ์œผ๋กœ ์ •๋ฆฌํ•œ ๋…ผ๋ฌธ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Large language models meet NLP ์„œ๋ฒ ์ด๋Š” NLP ์ž‘์—…์—์„œ LLM์˜ ์‘์šฉ ๋ฐ ํ–ฅ์ƒ ๋ฐฉ๋ฒ•์„ ๊ด‘๋ฒ”์œ„ํ•˜๊ฒŒ ์กฐ์‚ฌํ•˜๋ฏ€๋กœ Gemma 2์˜ ๊ฐœ์„  ๋ฐฉํ–ฅ์˜ ๋งฅ๋ฝ์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณผํ•™์  ์‚ฌ์‹ค ๊ฒ€์ฆ์—์„œ ๋‹ค์–‘ํ•œ NLP ๊ธฐ๋ฒ•์ด ์–ด๋–ป๊ฒŒ ์‚ฌ์šฉ๋˜๋Š”์ง€ ์„œ๋ฒ ์ดํ•˜๋Š” ๋…ผ๋ฌธ์œผ๋กœ, ์ง€์‹ ์†Œ์Šค์™€ IR ๊ธฐ๋ฒ• ๋น„๊ตํ‰๊ฐ€์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์˜ ์ „๋ฐ˜์ ์ธ ๋ฐœ์ „์„ ๋‹ค๋ฃจ๋ฉฐ ์žฅ๋ฌธ๋งฅ ๋ชจ๋ธ์˜ ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•˜๋Š” ์„œ๋ฒ ์ด์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Large language models meet NLP ๋…ผ๋ฌธ์€ LLM์˜ ๋‹ค์–‘ํ•œ NLP ํ™œ์šฉ๊ณผ ๊ทธ ํ•œ๊ณ„๋ฅผ ์ข…ํ•ฉ์ ์œผ๋กœ ์ •๋ฆฌํ•˜์—ฌ, ๊ธฐ์ˆ ์  ์ „๋ฌธ์„ฑ ๋ฐ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ ์ง„๋‹จ์˜ ์ด๋ก ์  ํ† ๋Œ€๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
475๋Š” LLM ๊ธฐ๋ฐ˜ ์ž์—ฐ์–ด์ฒ˜๋ฆฌ ๊ธฐ์ˆ ์ด ํ™”ํ•™ ๋ฐ ์ด‰๋งค ์˜ˆ์ธก ๋ฌธ์ œ์— ์–ด๋–ป๊ฒŒ ์ ์šฉ๋˜๋Š”์ง€ ์„œ๋ฒ ์ดํ•˜๋ฏ€๋กœ, 3269์˜ ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ์˜ˆ์ธก ์ ‘๊ทผ๊ณผ ์—ฐ๊ด€์ง€์–ด ์ฐธ๊ณ ํ•  ๋งŒํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
A survey of large language models ๋…ผ๋ฌธ์€ LLM์˜ ์ „๋ฐ˜์  ๋ฐœ์ „์‚ฌ๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, NLP ํŠนํ™” ์ ์šฉ๊ณผ ์ƒํ˜ธ๋ณด์™„์ ์œผ๋กœ ํ™œ์šฉ ๊ฐ€๋Šฅํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AutoML๊ณผ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์˜ ํ†ตํ•ฉ์— ๊ด€ํ•œ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Large language models meet NLP: A survey ๋…ผ๋ฌธ์€ ์žฌ๋ฃŒ๊ณผํ•™์ด ์•„๋‹Œ ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ์—์„œ ํŒŒ์šด๋ฐ์ด์…˜/LLM ๋ชจ๋ธ ์ ์šฉ ์‚ฌ๋ก€์™€ ํ•œ๊ณ„๋ฅผ ๋…ผ์˜ํ•ด, ๋น„๊ต ํ† ๋ก ์— ๋„์›€ ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM๊ณผ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ์‘์šฉ์— ๋Œ€ํ•œ ์„œ๋ฒ ์ด๋กœ, ์ƒ์„ฑํ˜• AI์™€ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ํ†ตํ•ฉ ๋ฐœ์ „์‚ฌ๋ฅผ ๋น„๊ต ๊ณ ์ฐฐํ•  ๋•Œ ํ•จ๊ป˜ ์ฐธ๊ณ ํ•˜๋ฉด ์‹œ๋„ˆ์ง€๊ฐ€ ํฌ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
475๋„ LLM์— ๊ด€ํ•œ ์ข…ํ•ฉ ์„œ๋ฒ ์ด๋กœ, 026์˜ ๋ฐœ์ „์‚ฌ ์š”์•ฝ์„ ์ข€ ๋” NLP ๋‚ด ์—ญํ• ๊ณผ ์„ฑ๋Šฅ ์ธก๋ฉด์—์„œ ํ™•์žฅ ํƒ๊ตฌํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Towards Scientific Discovery with Generative AI ์„œ๋ฒ ์ด๋Š” LLM์˜ ๊ณผํ•™์  ์‘์šฉ์— ์ดˆ์ ์„ ๋งž์ถ”์–ด ๋ณธ ๋…ผ๋ฌธ ๋…ผ์˜์˜ ์ง„๋ณด๋œ ์‚ฌ๋ก€๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM4SR ๋…ผ๋ฌธ์€ LLM์ด ๊ณผํ•™์  ์—ฐ๊ตฌ์—์„œ ์–ด๋–ป๊ฒŒ ํ™œ์šฉ๋˜๊ณ  ํ‰๊ฐ€๋˜๋Š”์ง€ ์„ธ๋ถ€์ ์œผ๋กœ ๋‹ค๋ฃจ์–ด, NLP ์ค‘์‹ฌ ์„œ๋ฒ ์ด์˜ ๋‚ด์šฉ์„ ๊ณผํ•™์  ๋ฌธ๋งฅ์— ํ™•์žฅํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
OpenAI O1์˜ AGI๊ธ‰ ์„ฑ๋Šฅ์„ ๋‹ค์–‘ํ•œ NLPยท๊ณผํ•™ ์ž‘์—…์— ์ ์šฉ ํ‰๊ฐ€ํ•œ ๋…ผ๋ฌธ์œผ๋กœ, LLM์ด NLP ์ž‘์—…์—์„œ ์–ด๋””๊นŒ์ง€ ์„ฑ๊ณผ๋ฅผ ๋‚ด๋Š”์ง€ ์‹ค์งˆ์ ์œผ๋กœ ๋ณด์—ฌ์ค€๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •