Empowering language models with active inquiry for deeper understanding

์ €์ž: Jing-Cheng Pang, Heng-Bo Fan, Pengyuan Wang, Jiahao Xiao, Nan Tang, Si-Hang Yang, Chengxing Jia, Sheng-Jun Huang, Yang Yu | ๋‚ ์งœ: 2024 | DOI: N/A 📄 PDF


Essence

Figure 1

Figure 1: ๋Šฅ๋™์  ๋ฌธ์˜๋ฅผ ํ†ตํ•œ ์–ธ์–ด๋ชจ๋ธ์˜ ์งˆ์˜ ์‘๋‹ต ๊ณผ์ •. (A) ๋ฌธ์˜ ์—†์ด ์ง์ ‘ ๋‹ต๋ณ€, (B) ์‚ฌ์šฉ์ž์—๊ฒŒ ๋ช…ํ™•ํ•œ ์งˆ๋ฌธ์„ ํ†ตํ•ด ๋Šฅ๋™์ ์œผ๋กœ ์ •๋ณด ์ˆ˜์ง‘

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€ํ˜• ์–ธ์–ด๋ชจ๋ธ(LLM)์ด ์‚ฌ์šฉ์ž์˜ ๋ชจํ˜ธํ•œ ์งˆ์˜๋ฅผ ๋ช…ํ™•ํžˆ ํ•˜๊ธฐ ์œ„ํ•ด ๋Šฅ๋™์ ์œผ๋กœ ์งˆ๋ฌธ์„ ์ œ๊ธฐํ•˜๋Š” LaMAI(Language Model with Active Inquiry) ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•œ๋‹ค. ๋Šฅ๋™ํ•™์Šต(active learning) ๊ธฐ๋ฒ•์„ ํ™œ์šฉํ•˜์—ฌ ๊ฐ€์žฅ ์ •๋ณด๋Ÿ‰์ด ๋งŽ์€ ์งˆ๋ฌธ์„ ์„ ํƒํ•จ์œผ๋กœ์จ LLM์˜ ์‘๋‹ต ์ •ํ™•๋„๋ฅผ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚จ๋‹ค.

Motivation

Achievement

Figure 2

Figure 2: LaMAI ๋ฉ”์„œ๋“œ์˜ ์ „์ฒด ์›Œํฌํ”Œ๋กœ์šฐ. (A) ์‚ฌ์šฉ์ž ์งˆ์˜์˜ ๋ถˆํ™•์‹ค์„ฑ ํ‰๊ฐ€, (B) ๋ถˆํ™•์‹ค์„ฑ ์ถ”์ • ๋ชจ๋“ˆ, (C) ๋Šฅ๋™ ๋ฌธ์˜ ๋ชจ๋“ˆ, (D) ๋‹ต๋ณ€ ์ƒ์„ฑ ๋ชจ๋“ˆ

  1. ์ •ํ™•๋„ ๋Œ€ํญ ํ–ฅ์ƒ: ๋ณต์žกํ•œ ๋ฐ์ดํ„ฐ์…‹์—์„œ ๊ธฐ์กด 31.9%์—์„œ 50.9%๋กœ ๋‹ต๋ณ€ ์ •ํ™•๋„ ํ–ฅ์ƒ, ๋‹ค๋ฅธ ์งˆ์˜์‘๋‹ต ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ดˆ๊ณผ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ
  2. ์ธ๊ฐ„ ํ‰๊ฐ€์—์„œ์˜ ์šฐ์ˆ˜์„ฑ: ์‹ค์ œ ์ธ๊ฐ„ ์ฐธ์—ฌ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ๊ธฐ์ค€ ๋ฐฉ๋ฒ• ๋Œ€๋น„ 82% ์ด์ƒ์˜ ๊ฒฝ์šฐ์—์„œ ๋™๋“ฑํ•˜๊ฑฐ๋‚˜ ์šฐ์ˆ˜ํ•œ ์‘๋‹ต ์ƒ์„ฑ
  3. ๋‹ค์–‘ํ•œ LLM๊ณผ์˜ ํ˜ธํ™˜์„ฑ: GPT-3.5, GPT-4 ๋“ฑ ๋‹ค์–‘ํ•œ ์–ธ์–ด๋ชจ๋ธ์— ํ†ตํ•ฉ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ๋ฐฉ๋ฒ•์˜ ๊ฒฌ๊ณ ์„ฑ๊ณผ ํ™•์žฅ์„ฑ ์ž…์ฆ

How

Figure 3

Figure 3: QMSum ๋ฐ์ดํ„ฐ์…‹์—์„œ์˜ LaMAI ๋น„๊ต ๋ฐ ๋ถ„์„ ๊ฒฐ๊ณผ

LaMAI๋Š” ๋‹ค์Œ ์„ธ ๊ฐ€์ง€ ํ•ต์‹ฌ ๊ตฌ์„ฑ์š”์†Œ๋กœ ๊ตฌ์„ฑ๋œ๋‹ค:

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4.0/5 Significance: 4.5/5 Clarity: 4.0/5 Overall: 4.25/5

์ดํ‰: LaMAI๋Š” LLM์ด ๋ชจํ˜ธํ•œ ์‚ฌ์šฉ์ž ์งˆ์˜๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ธฐ ์œ„ํ•ด ๋Šฅ๋™์ ์œผ๋กœ ๋ช…ํ™•ํ™” ์งˆ๋ฌธ์„ ์ œ๊ธฐํ•˜๋„๋ก ํ•˜๋Š” ์ฐฝ์˜์ ์ธ ์ ‘๊ทผ์œผ๋กœ, ๋ถˆํ™•์‹ค์„ฑ ์ถ”์ •๊ณผ ๋Šฅ๋™ํ•™์Šต์„ ์ฒด๊ณ„์ ์œผ๋กœ ๊ฒฐํ•ฉํ•˜์—ฌ ์ƒ๋‹นํ•œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค. ๋‹ค๋งŒ ํ˜„์‹ค ํ™˜๊ฒฝ์—์„œ์˜ ํ”ผ๋“œ๋ฐฑ ํ’ˆ์งˆ ๊ด€๋ฆฌ์™€ ์‚ฌ์šฉ์ž ๊ฒฝํ—˜ ์ตœ์ ํ™” ๊ด€๋ จ ๋” ๊นŠ์ด ์žˆ๋Š” ๋…ผ์˜๊ฐ€ ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
312๋ฒˆ ๋…ผ๋ฌธ์€ ์•กํ‹ฐ๋ธŒ ์ธ์ฟผ๋ฆฌ ๊ธฐ๋ฐ˜ LLM์˜ ์‹ฌ์ธต ํƒ๊ตฌ ์ „๋žต์ด ๊ฐ€์ƒ ์‹คํ—˜์‹ค ๋‚ด ์—ฐ๊ตฌ์ž ์—์ด์ „ํŠธ์˜ ์ง‘๋‹จ์  ๋ฌธ์ œ ํ•ด๊ฒฐ์— ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Šฅ๋™ํ•™์Šต ๊ธฐ๋ฐ˜ ์งˆ๋ฌธ ์ƒ์„ฑ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Šฅ๋™ ์งˆ์˜ ๋ฐ ์ ์‘์  ํ•™์Šต ๊ธฐ๋ฐ˜์˜ ์—ฐ์†์  task ์ ์‘์—์„œ LLM ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•๋ก ์˜ ๊ฐ€๋Šฅ์„ฑ์„ ์ด๋ก ์ ์œผ๋กœ ๊ฒ€ํ† ํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์งˆ๋ฌธ์‘๋‹ต ๊ธฐ๋ฐ˜ ๋Šฅ๋™ ์งˆ์˜ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ํฌ์†Œ ์ •๋ณด ์ƒํ™ฉ์—์„œ์˜ ํ†ต์ฐฐ๋ ฅ ๊ทน๋Œ€ํ™” ๋ฐฉ๋ฒ•๋ก ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์ด ์‚ฌ์šฉ์ž ์˜๋„๋ฅผ ํŒŒ์•…ํ•˜๊ธฐ ์œ„ํ•œ ๋Œ€์•ˆ์  ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
223์€ ๋ช…ํ™•ํ™” ์งˆ๋ฌธ ์ƒ์„ฑ์— LLM์˜ ๋ถˆํ™•์‹ค์„ฑ ์ถ”์ •์„ ํ™œ์šฉํ•˜๋Š” ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋Œ€ํ™” ์‹œ์Šคํ…œ์—์„œ ๋ช…ํ™•ํ™” ์งˆ๋ฌธ์„ ์ƒ์„ฑํ•˜๋Š” ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ ๋ถˆํ™•์‹ค์„ฑ ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•œ ๋Œ€์•ˆ์  ๋Šฅ๋™ ํ•™์Šต ํ”„๋ ˆ์ž„์›Œํฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
312๋Š” ๋Šฅ๋™์  ์งˆ์˜ ์„ ํƒ ๋ฐฉ์‹์„ ์ถ”๊ฐ€ ์ ์šฉํ•ด, ๋ช…ํ™•ํ™” ์งˆ๋ฌธ ์ž๋™ ์ƒ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ 223์—์„œ ํ•œ ๋‹จ๊ณ„ ๋ฐœ์ „์‹œํ‚ต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
312๋Š” LLM์„ ์•กํ‹ฐ๋ธŒ ์ธ์ฟผ๋ฆฌ(active inquiry)๋ฅผ ํ†ตํ•ด ๊นŠ์ด ์žˆ๋Š” ์ดํ•ด๋กœ ์œ ๋„ํ•˜๋Š” ์ „๋žต์„ ๋‹ค๋ฃจ์–ด, 222์˜ ๋ช…ํ™•ํ™” ์งˆ๋ฌธ ์ƒ์„ฑ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๋ฐœ์ „์— ์ง์ ‘์ ์œผ๋กœ ์‘์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM์˜ ๋Šฅ๋™์  ํƒ์ƒ‰ยท์งˆ๋ฌธ ๋Šฅ๋ ฅ์„ ์‹คํ—˜ํ™˜๊ฒฝ์—์„œ ํ‰๊ฐ€ํ•˜๋Š” ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์‚ฌ๋ก€๋กœ, ๋ณธ ๋…ผ๋ฌธ์˜ ํ‰๊ฐ€ํ™˜๊ฒฝ ํ™•๋Œ€ยทํ™•์žฅ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Trust, But Verify ๋…ผ๋ฌธ์€ ์ž๊ธฐ ํ™•์ธ(self-verification)์œผ๋กœ ์ •๋‹ต๋ฅ ์„ ๋†’์ด๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•˜์—ฌ LaMAI์˜ ์‘๋‹ต ํ’ˆ์งˆ ๊ฐœ์„ ์˜ ํ™•์žฅ ์—ฐ๊ตฌ๋กœ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜์˜ ์ ๊ทน์  ํƒ๊ตฌ(active inquiry)๋ฅผ ํ†ตํ•ด ๋‹จ์ผ์„ธํฌ ๋ฐ์ดํ„ฐ ํ•ด์„ ์„ฑ๋Šฅ ํ–ฅ์ƒ ๋ฐ ์ž๋™ํ™” ๊ฐ€๋Šฅ์„ฑ์„ ํƒ๊ตฌํ•œ ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์–ธ์–ด๋ชจ๋ธ์˜ ๋Šฅ๋™์  ํƒ๊ตฌ ๋ฐ ์‹ฌ์ธต์  ์˜๋ฏธ์ดํ•ด ๊ฐ•ํ™” ๋ฐฉ๋ฒ•์€ ๋น„์ง€๋„ ์ ์‘ ๋ฉด์—ญ ์ˆ˜์šฉ์ฒด ๋ถ„์„ ์›Œํฌํ”Œ๋กœ ๊ฐœ์„ ์—๋„ ์ ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Large Language Models ๋…ผ๋ฌธ์€ LLM์ด ์‹ค์ œ ์‚ฌ์šฉ์ž์™€ ์ƒํ˜ธ์ž‘์šฉํ•˜๋ฉฐ ์งˆ๋ฌธ ์ ์‘ ํ•™์Šต์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋‹ค์–‘ํ•œ ์‹คํ—˜์„ ํ†ตํ•ด LaMAI ๋ฐฉ๋ฒ•๋ก ์˜ ์‹ค์šฉ์„ฑ ๊ฒ€์ฆ์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
434๋Š” ์ง€์‹ ๊ทธ๋ž˜ํ”„๋ฅผ ์ด์šฉํ•œ ๊ณผํ•™ ์•„์ด๋””์–ด ์ƒ์„ฑ์—์„œ ๋Šฅ๋™์  ์งˆ๋ฌธ ์„ ํƒ ๋ฐฉ์‹์„ ์‹ค์ œ ์ฐฝ์˜์  ์•„์ด๋””์–ด ์ƒ์„ฑ์— ์ ์šฉํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •