CRITIC: Large Language Models Can Self-Correct with Tool-Interactive Critiquing

์ €์ž: Zhibin Gou, Zhihong Shao, Yeyun Gong, Yelong Shen, Yujiu Yang | ๋‚ ์งœ: 2023 | DOI: 10.48550/arXiv.2305.11738 📄 PDF


Essence

Figure 1

CRITIC ํ”„๋ ˆ์ž„์›Œํฌ: ์™ธ๋ถ€ ๋„๊ตฌ์™€ ์ƒํ˜ธ์ž‘์šฉํ•˜์—ฌ ๊ฒ€์ฆ(Verify)ํ•œ ํ›„ ๋น„ํŒ(Critique)์— ๊ธฐ๋ฐ˜ํ•ด ์ˆ˜์ •(Correct)ํ•˜๋Š” ๋ฐ˜๋ณต ๊ณผ์ •

๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์ด ์™ธ๋ถ€ ๋„๊ตฌ(๊ฒ€์ƒ‰์—”์ง„, ์ฝ”๋“œ ์ธํ„ฐํ”„๋ฆฌํ„ฐ ๋“ฑ)์™€ ์ƒํ˜ธ์ž‘์šฉํ•˜์—ฌ ์ž์‹ ์˜ ์ถœ๋ ฅ์„ ๊ฒ€์ฆํ•˜๊ณ  ๋ฐ˜๋ณต์ ์œผ๋กœ ์ž๊ฐ€์ˆ˜์ •(self-correct)ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ํ†ตํ•ฉ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ์ธ๊ฐ„์˜ ๋น„ํŒ์  ์‚ฌ๊ณ  ๋ฐฉ์‹์„ ๋ชจ๋ฐฉํ•˜์—ฌ ํ• ๋ฃจ์‹œ๋„ค์ด์…˜, ์ฝ”๋“œ ์˜ค๋ฅ˜, ๋…์„ฑ ์ฝ˜ํ…์ธ  ๋“ฑ์˜ ๋ฌธ์ œ๋ฅผ ์™„ํ™”ํ•œ๋‹ค.

Motivation

Achievement

Figure 2

๋‹ค์–‘ํ•œ ๊ณผ์ œ(QA, ์ˆ˜ํ•™ ํ”„๋กœ๊ทธ๋žจ ํ•ฉ์„ฑ, ๋…์„ฑ ๊ฐ์†Œ)์—์„œ CRITIC ํ”„๋กฌํ”„ํŠธ ์˜ˆ์‹œ: ๊ฒ€์ฆ ํ›„ ๋น„ํŒ ์ƒ์„ฑ, ์ˆ˜์ •๋œ ๋‹ต๋ณ€ ์ œ์‹œ

  1. ์ •๋Ÿ‰์  ์„ฑ๊ณผ: ChatGPT ์ ์šฉ ์‹œ 3๊ฐœ QA ๊ณผ์ œ์—์„œ 7.7 F1 ํ–ฅ์ƒ, 3๊ฐœ ์ˆ˜ํ•™์ถ”๋ก  ๊ณผ์ œ์—์„œ 7.0% ์ ˆ๋Œ€ ์„ฑ๋Šฅ ํ–ฅ์ƒ, ๋…์„ฑ ํ™•๋ฅ  79.2% ๊ฐ์†Œ ๋‹ฌ์„ฑ. LLaMA-2(7B, 13B, 70B) ๋“ฑ ๋‹ค์–‘ํ•œ ๋ชจ๋ธ์—์„œ ์ผ๊ด€๋œ ๊ฐœ์„  ํ™•์ธ.
  2. ๋ฐฉ๋ฒ•๋ก  ์œ ํšจ์„ฑ: ์™ธ๋ถ€ ๋„๊ตฌ ์ƒํ˜ธ์ž‘์šฉ์ด ์—†๋Š” ์ˆœ์ˆ˜ ์ž๊ฐ€์ˆ˜์ •์€ ํšจ๊ณผ ๋ฏธ๋ฏธํ•˜๊ฑฐ๋‚˜ ์„ฑ๋Šฅ ์ €ํ•˜๋ฅผ ์ดˆ๋ž˜ํ•˜์ง€๋งŒ, CRITIC์˜ ๊ฒ€์ฆ-์ˆ˜์ • ๋ฐ˜๋ณต ๊ณผ์ •์€ ์ง€์†์  ๊ฐœ์„ ์„ ๋ณด์žฅํ•œ๋‹ค. ์ž๊ฐ€์ˆ˜์ •์˜ ํ•„์ˆ˜ ์กฐ๊ฑด์œผ๋กœ ์™ธ๋ถ€ ํ”ผ๋“œ๋ฐฑ์˜ ์ค‘์š”์„ฑ์„ ์ž…์ฆ.

How

Figure 3-5

๋ฐ˜๋ณต ๊ณผ์ •์„ ํ†ตํ•œ ์„ฑ๋Šฅ ๋ณ€ํ™”: QA, GSM8k ์ˆ˜ํ•™ ์ถ”๋ก , ๋…์„ฑ ๊ฐ์†Œ ๊ณผ์ œ๋ณ„ ๋ฐ˜๋ณต ํšŸ์ˆ˜์— ๋”ฐ๋ฅธ ๊ฐœ์„  ์ถ”์ด

์•Œ๊ณ ๋ฆฌ์ฆ˜ (Algorithm 1):

ํ•ต์‹ฌ ํ”„๋กฌํ”„ํŠธ ์ „๋žต:

Originality

Limitation & Further Study

Evaluation

์ดํ‰: CRITIC์€ LLM์˜ ์ž๊ฐ€์ˆ˜์ • ๋ฌธ์ œ๋ฅผ ์™ธ๋ถ€ ๋„๊ตฌ ์ƒํ˜ธ์ž‘์šฉ์œผ๋กœ ์šฐ์•„ํ•˜๊ฒŒ ํ•ด๊ฒฐํ•˜๋ฉฐ, ์ถ”๊ฐ€ ํ•™์Šต ์—†์ด ๋ฒ”์šฉ์ ์œผ๋กœ ์ ์šฉ ๊ฐ€๋Šฅํ•œ ์‹ค์šฉ์  ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•œ๋‹ค๋Š” ์ ์—์„œ ๋†’์€ ๊ฐ€์น˜๊ฐ€ ์žˆ๋‹ค. ๋‹ค๋งŒ ๋„๊ตฌ ํ’ˆ์งˆ ์˜์กด์„ฑ, ํ”„๋กฌํ”„ํŠธ ์„ค๊ณ„์˜ ์ˆ˜์ž‘์—… ํ•„์š”์„ฑ, ๊ณ„์‚ฐ ๋น„์šฉ ์ฆ๊ฐ€ ๋“ฑ์˜ ์‹ค๋ฌด์  ์ œ์•ฝ์ด ์žˆ์œผ๋ฉฐ, ์ด๋“ค์„ ๋ณด์™„ํ•˜๋Š” ์ถ”๊ฐ€ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•˜๋‹ค. ICLR 2024 ์ฑ„ํƒ๋œ ๊ฒƒ์„ ๊ณ ๋ คํ•˜๋ฉด LLM ์‹ ๋ขฐ์„ฑ ๊ฐœ์„  ๋ถ„์•ผ์—์„œ ์˜๋ฏธ ์žˆ๋Š” ๊ธฐ์—ฌ๋ฅผ ํ•œ ๊ฒƒ์œผ๋กœ ํ‰๊ฐ€๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Reasoning๊ณผ Acting์˜ ๊ฒฐํ•ฉ(์ฆ‰, ๋„๊ตฌ์™€์˜ ์—ฐ๋™ ๊ฐ•ํ™”)์ด 242 ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ทผ๊ฐ„์œผ๋กœ ํ™œ์šฉ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
745๋Š” LLM ์ž๊ธฐ๊ฒ€์ฆ/์ž๊ธฐ์ •์ œ์˜ ๋‹ค์–‘ํ•œ ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์ œ์•ˆํ•ด, 242๊ฐ€ ์ถ”๊ตฌํ•˜๋Š” ์ž๊ธฐ์ˆ˜์ • ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์ด ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
746์€ ์ž๊ธฐ ํ”ผ๋“œ๋ฐฑ ๊ธฐ๋ฐ˜ ์ž๊ธฐ ์ •์ œ ๋ฐฉ์‹์„ ์ œ์•ˆํ•ด, 242์˜ ์™ธ๋ถ€ ๋„๊ตฌ ์ƒํ˜ธ์ž‘์šฉ ๊ธฐ๋ฐ˜ ์ž๊ธฐ์ˆ˜์ •๊ณผ ๋Œ€์กฐ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
CRITIC ๋…ผ๋ฌธ์€ LLM์ด ๋„๊ตฌ๋ฅผ ํ™œ์šฉํ•  ๋•Œ๋งŒ ์ž๊ธฐ ์ˆ˜์ •์ด ๊ฐ€๋Šฅํ•˜๋‹ค๋Š” ์ ์„ ์ œ์•ˆํ•˜๋ฉฐ, ์™ธ๋ถ€ ํ”ผ๋“œ๋ฐฑ/ํˆด ๋‚ด์žฅ ๋“ฑ ์ฐจ์ด์ ์„ ์‹ค์ฆ์ ์œผ๋กœ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
242 ๋…ผ๋ฌธ์€ ์™ธ๋ถ€ ํˆด์„ ํ™œ์šฉํ•œ ์ž๊ธฐ๊ฒ€์ฆ LLM ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜์—ฌ, 747์˜ ํ“จ์–ด LLM ์ž๊ธฐ ํ™•์ธ ๋ฐฉ์‹๊ณผ์˜ ์ฐจ์ด๋ฅผ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ ์ž๊ธฐ์ˆ˜์ • ๋Šฅ๋ ฅ ๊ณ ๋„ํ™”์—์„œ, 242๋Š” ๋„๊ตฌ ์ƒํ˜ธ์ž‘์šฉ ํ†ตํ•œ ๋ฐ˜๋ณต์  ๊ฒ€์ฆ, 598์€ ์ •์ฑ…๋ณ€ํ™˜ RL ๊ธฐ๋ฐ˜ ๋‹ค์ค‘ํ„ด Self-Correction์„ ์‹œ๋„ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‘˜ ๋‹ค LLM์˜ ๋‹ค๋‹จ๊ณ„, ์ฒด์ธ์˜ค๋ธŒ์˜ํŠธ(Chain-of-Thought) ์ถ”๋ก  ๊ณผ์ • ๋ถ„์„์— ์ดˆ์ ์„ ๋‘์ง€๋งŒ, 242๋Š” ๋„๊ตฌ์™€์˜ ์ƒํ˜ธ์ž‘์šฉ ๊ธฐ๋ฐ˜ ์ž๊ฐ€์ˆ˜์ •์— ์ง‘์ค‘ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
242๋ฒˆ ๋…ผ๋ฌธ์€ ๋„๊ตฌ์™€ ๊ฒฐํ•ฉํ•ด LLM์ด ์ž๊ธฐ-์ˆ˜์ • ๋ฐ ์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ์ถ”๋ก ์„ ํšจ์œจ์ ์œผ๋กœ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐฉ์‹์„ ์ œ์•ˆํ•˜์—ฌ, Toolformer์˜ ์ž๊ฐ€๊ฐ๋… ๋„๊ตฌ์‚ฌ์šฉ ํ•™์Šต๊ณผ ์ง๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM ์ž๊ธฐ์ˆ˜์ •(Self-Correction) ํ”„๋ ˆ์ž„์›Œํฌ์—์„œ 242๋Š” ๋„๊ตฌ์ƒํ˜ธ์ž‘์šฉ ๋ฐ”ํƒ•, 598์€ ์ •์ฑ…๊ณผ ๊ฒ€์ฆ์ž RL ํ™œ์šฉ์„ ํ†ตํ•œ ๋ช…์‹œ์  ์˜ค๋ฅ˜ ์ž๊ธฐ์ •์ •์„ ์‹œ๋„ํ•ฉ๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
Large Language Models Cannot Self-Correct Reasoning Yet ๋…ผ๋ฌธ์€ LLM์˜ ์ž๊ธฐ ์ˆ˜์ • ๋Šฅ๋ ฅ์˜ ์‹ค์ œ์  ํ•œ๊ณ„๋ฅผ ๋น„ํŒ์ ์œผ๋กœ ๋ถ„์„ํ•˜์—ฌ, ์ž๊ธฐ๊ต์ • ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์•ฝ์  ๋…ผ์˜์™€ ๋ณด์™„ ํ•„์š”์„ฑ์— ์ฐธ๊ณ ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •