Large Language Models

์ €์ž: Michael R Douglas | ๋‚ ์งœ: 2023 | DOI: 10.1007/978-981-96-6259-3 📄 PDF


Essence

์ˆ˜ํ•™ ๋ฐ ๋ฌผ๋ฆฌํ•™ ๋ฐฐ๊ฒฝ์˜ ๋…์ž๋ฅผ ์œ„ํ•ด ์ž‘์„ฑ๋œ ๊ฐ•์˜๋…ธํŠธ๋กœ, GPT ์‹œ๋ฆฌ์ฆˆ์™€ ๊ฐ™์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์˜ ๋ฐœ์ „ ์—ญ์‚ฌ, ํŠธ๋žœ์Šคํฌ๋จธ ์•„ํ‚คํ…์ฒ˜, ๊ทธ๋ฆฌ๊ณ  ๋‹ค์Œ ๋‹จ์–ด ์˜ˆ์ธก ํ•™์Šต์ด ์–ด๋–ป๊ฒŒ ์ง€๋Šฅ์  ์ž‘์—… ์ˆ˜ํ–‰์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋Š”์ง€๋ฅผ ์„ค๋ช…ํ•œ๋‹ค.

Motivation

Achievement

  1. ํฌ๊ด„์  ์—ญ์‚ฌ์  ๋งฅ๋ฝ ์ œ๊ณต: ๊ธฐํ˜ธ์ฃผ์˜ AI(1950๋…„๋Œ€~)์—์„œ ์—ฐ๊ฒฐ์ฃผ์˜ AI, ๋”ฅ๋Ÿฌ๋‹์œผ๋กœ ์ด์–ด์ง€๋Š” 70๋…„๊ฐ„์˜ ๋ฐœ์ „ ๊ณผ์ •์„ ์ •๋ฆฌํ•˜์—ฌ, LLM์ด ๋‹จ์ˆœํ•œ ๊ธฐ์ˆ ์  ํ˜์‹ ์ด ์•„๋‹Œ AI ํŒจ๋Ÿฌ๋‹ค์ž„ ์ „ํ™˜์˜ ๊ฒฐ๊ณผ์ž„์„ ๋ณด์—ฌ์คŒ
  2. ๋ช…ํ™•ํ•œ ๊ธฐ์ˆ ์  ์„ค๋ช…: ๋‹จ์ˆœํ•œ ๋‹ค์Œ ๋‹จ์–ด ์˜ˆ์ธก(next-word prediction) ํ•™์Šต์ด ์–ด๋–ป๊ฒŒ ์ˆ˜ํ•™ ๋ฌธ์ œ ํ’€์ด, ์ฝ”๋”ฉ, ๋…ผ๋ฆฌ ์ถ”๋ก  ๊ฐ™์€ ๊ณ ์ฐจ์›์  ์ž‘์—…์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋Š”์ง€์˜ ์—ญ์„ค์  ์ƒํ™ฉ์„ ์ œ์‹œํ•˜๊ณ  ํ˜„์žฌ์˜ ์—ฌ๋Ÿฌ ํ•ด์„ ๊ด€์ ๋“ค์„ ์ œ์‹œ
  3. ํ˜„์‹ค์  ํ•œ๊ณ„ ์ธ์‹: LLM์˜ ์žฅ๊ธฐ ๋ฉ”๋ชจ๋ฆฌ ๋ถ€์กฑ, ํ™˜๊ฐ(hallucination), ๋…ผ๋ฆฌ ์ถ”๋ก ์˜ ์‹ ๋ขฐ์„ฑ ๋ฌธ์ œ, ๊ณ„ํš ๋Šฅ๋ ฅ ๋ถ€์žฌ ๋“ฑ ๊ตฌ์ฒด์  ํ•œ๊ณ„์ ๋“ค์„ ๋ช…์‹œํ•˜๋ฉฐ ๋‹จ์ˆœํ•œ ๊ทœ๋ชจ ํ™•๋Œ€(scaling)๋งŒ์œผ๋กœ๋Š” ๋ฌธ์ œ ํ•ด๊ฒฐ์ด ๋ถˆ๊ฐ€๋Šฅํ•  ์ˆ˜ ์žˆ์Œ์„ ์‹œ์‚ฌ

How

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 4/5 Significance: 5/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ์ด ๊ฐ•์˜๋…ธํŠธ๋Š” LLM์˜ ๊ธ‰์†ํ•œ ๋ฐœ์ „์ด๋ผ๋Š” ํ˜„์žฌ ์ง„ํ–‰ํ˜•์˜ ํ˜„์ƒ์„ ์—ญ์‚ฌ์  ๋งฅ๋ฝ๊ณผ ๊ธฐ์ดˆ ์ด๋ก ์œผ๋กœ ์ฒด๊ณ„ํ™”ํ•œ ๋งค์šฐ ๊ฐ€์น˜ ์žˆ๋Š” ๊ต์œก์ž๋ฃŒ์ด๋‹ค. ํŠนํžˆ ์ˆ˜ํ•™ ๋ฐ ๋ฌผ๋ฆฌํ•™ ๋ฐฐ๊ฒฝ์˜ ๊ณผํ•™์ž๋“ค์„ ๋Œ€์ƒ์œผ๋กœ AI์˜ ๊ธฐํ˜ธ์ฃผ์˜-์—ฐ๊ฒฐ์ฃผ์˜ ํŒจ๋Ÿฌ๋‹ค์ž„ ์ „ํ™˜์„ ๋ช…ํ™•ํžˆ ์„ค๋ช…ํ•˜๊ณ , "๋‹ค์Œ ๋‹จ์–ด ์˜ˆ์ธก์ด ์ง€๋Šฅ์„ ๋งŒ๋“œ๋Š”๊ฐ€"๋ผ๋Š” ๋ณธ์งˆ์  ์งˆ๋ฌธ์„ ์ œ๊ธฐํ•จ์œผ๋กœ์จ ๋‹จ์ˆœํ•œ ๊ธฐ์ˆ  ํ•ด์„ค์„ ๋„˜์–ด ๊ฐœ๋…์  ์ดํ•ด๋ฅผ ์ถ”๊ตฌํ•œ๋‹ค๋Š” ์ ์ด ๊ฐ•์ ์ด๋‹ค. ๋‹ค๋งŒ ์ถ”์ถœ๋œ ํ…์ŠคํŠธ๊ฐ€ ๋„์ž…๋ถ€์— ํ•ด๋‹นํ•˜์—ฌ ์‹ค์ œ ํ•ต์‹ฌ ๊ธฐ์ˆ  ๋‚ด์šฉ๊ณผ LLM ์ดํ•ด ๋ฉ”์ปค๋‹ˆ์ฆ˜์— ๋Œ€ํ•œ ๊ตฌ์ฒด์  ์„ค๋ช…์ด ํ‰๊ฐ€ ๋ถˆ๊ฐ€๋Šฅํ•˜๋ฉฐ, ๋ฏธํ•ด๊ฒฐ ๊ทผ๋ณธ ๋ฌธ์ œ๋“ค(ํ™˜๊ฐ, ๋…ผ๋ฆฌ ์ถ”๋ก , AGI ๋„๋‹ฌ ๊ฐ€๋Šฅ์„ฑ)์— ๋Œ€ํ•ด ๋ช…ํ™•ํ•œ ๊ณผํ•™์  ๋‹ต๋ณ€์„ ์ œ์‹œํ•˜๋Š”์ง€ ์ „์ฒด ์›๋ฌธ ๊ฒ€ํ† ๊ฐ€ ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
467์€ ๋Œ€ํ˜• ์–ธ์–ด๋ชจ๋ธ์˜ ์•„ํ‚คํ…์ฒ˜์™€ ์„ฑ๋Šฅ ๋ฒ”์œ„๋ฅผ ์ด๋ง๋ผํ•˜์—ฌ 801์˜ Llama 3 ๊ณ„์—ด ์ถœ์‹œ์™€ ์ง์ ‘์ ์œผ๋กœ ์—ฐ๋™ํ•ด ์ฝ์„๋งŒํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Large Language Models ๋…ผ๋ฌธ์€ ๋Œ€ํ˜• ์–ธ์–ด๋ชจ๋ธ์˜ ๊ตฌ์กฐ์  ํŠน์ง•๊ณผ ์ถ”๋ก  ํ•œ๊ณ„ ๋…ผ์˜๋ฅผ ํฌ๊ด„์ ์œผ๋กœ ๋‹ด์•„, RBF++์˜ ๋ฌธ์ œ ์„ค์ •์— ์ด๋ก ์  ๋งฅ๋ฝ์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
467์€ LLM์˜ ์ „๋žต์  reasoning ๋ฒค์น˜๋งˆํฌ ๋…ผ์˜๋กœ, 845์˜ ์ž๊ธฐ๊ฒ€์ฆ ๊ฐ•ํ™”ํ•™์Šต์˜ ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
GPT-4์˜ ๊ตฌ์กฐ์™€ ์„ฑ๋Šฅ์— ์ง‘์ค‘ํ•˜์—ฌ 467์˜ ๊ธฐ์ดˆ์  LLM ๊ฐ•์˜๋…ธํŠธ ๋‚ด์šฉ์„ ์ตœ์‹  ์—ฐ๊ตฌ๋กœ ํ™•์žฅ์‹œํ‚จ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM์˜ ์ธ์ง€ ๋ฐ ์ถ”๋ก  ๋Šฅ๋ ฅ์ด ์ž์œจ ์—์ด์ „ํŠธ๋กœ ์–ด๋–ป๊ฒŒ ํ™•์žฅ๋˜๋Š”์ง€ ์ข…ํ•ฉ์ ์œผ๋กœ ๋ถ„์„ํ•˜์—ฌ, ๊ต๊ณผ์„œ์  ์„ค๋ช… ์ด์ƒ์˜ ์‹ค์ œ์  ํ•จ์˜๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
355๋ฒˆ ๋…ผ๋ฌธ์€ LLM์˜ ๋ฉ”๋ชจ๋ฆฌ ๋ฉ”์ปค๋‹ˆ์ฆ˜๊ณผ, 467๋ฒˆ ๋…ผ๋ฌธ์˜ ํŠธ๋žœ์Šคํฌ๋จธ ๋ฐœ์ „์‚ฌ ๋…ผ์˜์— ๊ธฐ๋ฐ˜ํ•˜์—ฌ ๊ธฐ์–ต ๋ฐ ์„ธ๊ณ„๋ชจ๋ธ ๊ตฌ์ถ•์˜ ๊ธฐ์ˆ  ๋ฐœ์ „์„ ์‹ฌ์ธต์ ์œผ๋กœ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
379๋ฒˆ ๋…ผ๋ฌธ์€ LLM์„ ํ™œ์šฉํ•œ ์ž๋™ ์ •๋ฆฌ ์ฆ๋ช… ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ฃผ์–ด์„œ, 467๋ฒˆ์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์ด ์‹ค์ œ ์–ด๋–ค ์ˆ˜ํ•™ ๋ฌธ์ œ ํ•ด๊ฒฐ๋กœ ์ด์–ด์ง€๋Š”์ง€ ์—ฐ๊ฒฐํ•ด์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
LLM์„ ํ™œ์šฉํ•œ ์‹ค์ œ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ ์ž๋™ ๋ฌธํ—Œ QA ์‘์šฉ ์‚ฌ๋ก€๋กœ, 467์˜ LLM ๊ฐœ๋…์  ์„ค๋ช…์ด ์‹ค์งˆ์ ์œผ๋กœ ์—ฐ๊ตฌ์— ํ™œ์šฉ๋˜๋Š” ๋ฐฉ์‹์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Large Language Models ๋…ผ๋ฌธ์€ LLM์ด ์‹ค์ œ ์‚ฌ์šฉ์ž์™€ ์ƒํ˜ธ์ž‘์šฉํ•˜๋ฉฐ ์งˆ๋ฌธ ์ ์‘ ํ•™์Šต์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋‹ค์–‘ํ•œ ์‹คํ—˜์„ ํ†ตํ•ด LaMAI ๋ฐฉ๋ฒ•๋ก ์˜ ์‹ค์šฉ์„ฑ ๊ฒ€์ฆ์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
52๋Š” ์ƒ๋ช…/๋ฌผ๋ฆฌ๊ณผํ•™ ์ ‘์ ์—์„œ LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ ๊ธฐ์ˆ  ๋™ํ–ฅ๊ณผ ์œ„ํ—˜์„ฑ์„ ๊ฒ€ํ† ํ•ด, 467์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์— ํ˜„์‹ค์ ์ธ ๊ณผํ•™์  ํ•จ์˜๋ฅผ ๋”ํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์˜ ์‹ ๋ขฐ์„ฑ๊ณผ ํ™œ์šฉ ํ•œ๊ณ„๋ฅผ ์‹ค์ œ ๊ณผํ•™์  ๋งฅ๋ฝ์—์„œ ๋ถ„์„ํ•œ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
467 ๋…ผ๋ฌธ์€ LLM์˜ ๋ถˆํ™•์‹ค์„ฑ, ์˜ค๋‹ตยทํ™˜๊ฐ์— ๊ด€ํ•œ ์ข…ํ•ฉ์  ๋…ผ์˜๋ฅผ ์ œ์‹œํ•˜์—ฌ, 474์™€ ๊ฐ™์ด ์ธ๊ณผ ๊ตฌ์กฐ ์ถ”๋ก  ์‹œ ํ™˜๊ฐ ๋ฐ ์ง„์‹ค์„ฑ ์ด์Šˆ์˜ ํ•œ๊ณ„๋ฅผ ๋น„ํŒ์ ์œผ๋กœ ๊ณ ์ฐฐํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •