CLAM: Selective clarification for ambiguous questions with generative language models

์ €์ž: Lorenz Kuhn, Yarin Gal, Sebastian Farquhar | ๋‚ ์งœ: 2023 | DOI: arXiv:2212.07769 📄 PDF


Essence

Figure 1

Figure 1. (a) ์ผ๋ฐ˜์ ์ธ ์–ธ์–ด๋ชจ๋ธ์˜ ๋™์ž‘ (b) CLAM: ์• ๋งคํ•œ ์งˆ๋ฌธ ๊ฐ์ง€ ๋ฐ ๋ช…ํ™•ํ™” ์งˆ๋ฌธ ์ƒ์„ฑ

๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์ด ์• ๋งคํ•œ ์‚ฌ์šฉ์ž ์งˆ๋ฌธ์— ๋Œ€ํ•ด ๋ช…ํ™•ํ™”๋ฅผ ์š”์ฒญํ•˜์ง€ ์•Š๊ณ  ๋ถ€์ •ํ™•ํ•œ ๋‹ต๋ณ€์„ ์ œ๊ณตํ•˜๋Š” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, CLAM ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ์ด๋Š” ์• ๋งคํ•œ ์งˆ๋ฌธ์„ ๊ฐ์ง€ํ•˜๊ณ  ๋ช…ํ™•ํ™” ์งˆ๋ฌธ์„ ์ƒ์„ฑํ•œ ํ›„ ์‚ฌ์šฉ์ž์˜ ๋ช…ํ™•ํ™” ์ •๋ณด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์ตœ์ข… ๋‹ต๋ณ€์„ ์ œ๊ณตํ•˜๋Š” ์„ ํƒ์  ๋ช…ํ™•ํ™”(selective clarification) ์ ‘๊ทผ๋ฒ•์ด๋‹ค.

Motivation

Achievement

Figure 2

Figure 2. ์„ ํƒ์  ๋ช…ํ™•ํ™”์˜ 4๋‹จ๊ณ„ ๊ณผ์ •

  1. CLAM ํ”„๋ ˆ์ž„์›Œํฌ ์ œ์•ˆ: ์• ๋งคํ•œ ์งˆ๋ฌธ์„ ๊ฐ์ง€ํ•˜๊ณ  ์„ ํƒ์ ์œผ๋กœ ๋ช…ํ™•ํ™”๋ฅผ ์š”์ฒญํ•˜๋Š” ํ†ตํ•ฉ ํ”„๋ ˆ์ž„์›Œํฌ ๊ฐœ๋ฐœ. ๊ธฐ์กด SotA ๋ชจ๋ธ ๋Œ€๋น„ ์• ๋งคํ•œ ์งˆ๋ฌธ ํฌํ•จ ๋ฐ์ดํ„ฐ์…‹์—์„œ ์œ ์˜๋ฏธํ•œ ์ •ํ™•๋„ ํ–ฅ์ƒ ๋‹ฌ์„ฑ.
  2. ๋ฉ”ํƒ€์ธ์ง€ ๊ฐœ๋… ๋„์ž…: ์–ธ์–ด๋ชจ๋ธ์ด "์ƒ๊ฐ์— ๋Œ€ํ•œ ์ƒ๊ฐ"์„ ๋ช…์‹œ์ ์œผ๋กœ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฉ”ํƒ€์ธ์ง€๋ฅผ ์ƒˆ๋กœ์šด ์„ค๊ณ„ ํŒจ๋Ÿฌ๋‹ค์ž„์œผ๋กœ ์ œ์‹œ. Chain-of-thought ํ”„๋กฌํŒ…๋ณด๋‹ค ์ฒด๊ณ„ํ™”๋œ ์ ‘๊ทผ๋ฒ• ์ œ๊ณต.
  3. ์ž๋™ ํ‰๊ฐ€ ํ”„๋กœํ† ์ฝœ: ๋น„์šฉ์ด ๋งŽ์ด ๋“œ๋Š” ์ธ๊ฐ„ ํ‰๊ฐ€๋ฅผ ๋Œ€์ฒดํ•˜๊ธฐ ์œ„ํ•ด, ํŠน๊ถŒ์ •๋ณด(privileged information)๋ฅผ ์ œ๊ณต๋ฐ›์€ ์–ธ์–ด๋ชจ๋ธ์ด ์‚ฌ์šฉ์ž ์—ญํ• ์„ ์ˆ˜ํ–‰ํ•˜๋Š” ์ž๋™ ํ‰๊ฐ€ ๋ฐฉ์‹ ๊ฐœ๋ฐœ. ๋‹ค์ค‘ํ„ด ๋Œ€ํ™” ํ‰๊ฐ€์˜ ํ™•์žฅ์„ฑ ๋ฌธ์ œ ํ•ด๊ฒฐ.
  4. Ambiguous TriviaQA ๋ฐ์ดํ„ฐ์…‹: 200๊ฐœ์˜ ์• ๋งคํ•œ/๋ช…ํ™•ํ•œ ์งˆ๋ฌธ ์Œ์œผ๋กœ ๊ตฌ์„ฑ๋œ ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•. ๊ธฐ์กด ClariQ, CLAQUA ๋“ฑ์˜ ํ•œ๊ณ„๋ฅผ ๋ณด์™„.

How

Figure 3

Figure 3. ์• ๋งคํ•œ ์‚ฌ์šฉ์ž ์ž…๋ ฅ์„ ๋ช…ํ™•ํ™”ํ•˜๊ธฐ ์œ„ํ•œ ํ”„๋กฌํŠธ ๊ตฌ์กฐ

CLAM ํ”„๋ ˆ์ž„์›Œํฌ ๊ตฌํ˜„:

์ž๋™ ํ‰๊ฐ€ ํ”„๋กœํ† ์ฝœ:

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ์• ๋งคํ•œ ์งˆ๋ฌธ์— ๋Œ€ํ•œ LLM์˜ ์„ ํƒ์  ๋ช…ํ™•ํ™” ์š”์ฒญ์ด๋ผ๋Š” ์‹ค์šฉ์  ๋ฌธ์ œ๋ฅผ ๋ฉ”ํƒ€์ธ์ง€ ํŒจ๋Ÿฌ๋‹ค์ž„์œผ๋กœ ์ฐฝ์˜์ ์œผ๋กœ ํ•ด๊ฒฐํ•˜๊ณ , ์ž๋™ ํ‰๊ฐ€ ํ”„๋กœํ† ์ฝœ๋กœ ๋‹ค์ค‘ํ„ด ๋Œ€ํ™” ํ‰๊ฐ€์˜ ํ™•์žฅ์„ฑ์„ ๋†’์ธ ์ข‹์€ ์—ฐ๊ตฌ์ด๋‹ค. ๋‹ค๋งŒ ๊ธฐ์ˆ ์  ๋…์ฐฝ์„ฑ๊ณผ ํ‰๊ฐ€ ๊ทœ๋ชจ์—์„œ ๊ฐœ์„  ์—ฌ์ง€๊ฐ€ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
AI ์ƒ์„ฑ ๋ฆฌ๋ทฐ, ๋ช…ํ™•ํ™” ์งˆ๋ฌธ ๋ฐ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ ๊ฐœ๋ฐœ์˜ ์ด๋ก ์  ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•˜๋Š” ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ž์—ฐ์–ด ์ดํ•ด ๋ฒค์น˜๋งˆํฌ์—์„œ LLM์˜ ์„ฑ๋Šฅ๊ณผ ์ธ๊ฐ„ ์ˆ˜์ค€ ๋น„๊ต๋ฅผ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ํ‰๊ฐ€ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
223์€ ์ƒํ˜ธ์ž‘์šฉ ๊ธฐ๋ฐ˜ ๋ชจํ˜ธ์„ฑ ํ•ด์†Œ ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•˜๋ฉฐ, 222์—์„œ selective clarification ํ”„๋ ˆ์ž„์›Œํฌ์— ๋Œ€ํ•ด ์‹คํ—˜์  ๋Œ€์•ˆ์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
CLAM์€ ์• ๋งคํ•œ ๋ฌธ์žฅ ์งˆ์˜์— ๋Œ€ํ•œ LLM ๋ช…ํ™•ํ™” ์ „๋žต์„ ์ œ์•ˆํ•˜๊ณ , CSED๋Š” ์‹ค์ œ ์˜๋ฏธ ์˜ค๋ฅ˜ ์œ ํ˜• ์ง„๋‹จ์— ์ „๋žต ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
CLAM์€ LLM ์งˆ์˜ ๋ถ€์ •ํ™•์„ฑ ํ•ด๊ฒฐ์ด๋ผ๋Š” ๋‹ค๋ฅธ ๋„์ „์  ๋ฌธ์ œ์— ์ ‘๊ทผํ•˜์ง€๋งŒ, LLM์˜ tool-use๋‚˜ ์ƒํ˜ธ ์ž‘์šฉ ๊ด€์ ์—์„œ ๋‚ด์šฉ์ด ์ƒํ˜ธ๋ณด์™„์ ์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
312๋Š” LLM์„ ์•กํ‹ฐ๋ธŒ ์ธ์ฟผ๋ฆฌ(active inquiry)๋ฅผ ํ†ตํ•ด ๊นŠ์ด ์žˆ๋Š” ์ดํ•ด๋กœ ์œ ๋„ํ•˜๋Š” ์ „๋žต์„ ๋‹ค๋ฃจ์–ด, 222์˜ ๋ช…ํ™•ํ™” ์งˆ๋ฌธ ์ƒ์„ฑ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๋ฐœ์ „์— ์ง์ ‘์ ์œผ๋กœ ์‘์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Csed๋Š” ๋ช…ํ™•ํ™”/์˜ค๋ฅ˜์ง„๋‹จ์ด ์ค‘์š”ํ•œ ์ค‘๊ตญ์–ด ์˜๋ฏธ ์˜ค๋ฅ˜ ์‹ค์ œ ์‚ฌ๋ก€ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ๊ณตํ•ด CLAM์˜ ์‹ค์งˆ์  testbed๊ฐ€ ๋œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •