Grammars of formal uncertainty: When to trust llms in automated reasoning tasks

์ €์ž: Debargha Ganguly, Vikash Singh, Sreehari Sankar, B. X. Zhang, Xuecen Zhang, Srinivasan Iyengar, Xiaotian Han, Amit Sharma, Shivkumar Kalyanaraman, Vipin Chaudhary | ๋‚ ์งœ: 2025 | DOI: ๋ฏธ์ œ๊ณต 📄 PDF


Essence

LLM์˜ ๋ณธ์งˆ์ ์ธ ํ™•๋ฅ ์„ฑ(probabilistic nature)๊ณผ ํ˜•์‹๊ฒ€์ฆ์˜ ๊ฒฐ์ •๋ก ์  ์š”๊ตฌ(deterministic guarantees) ์‚ฌ์ด์˜ ๊ทผ๋ณธ์  ๊ธด์žฅ์„ ํ•ด์†Œํ•˜๊ธฐ ์œ„ํ•ด, ํ™•๋ฅ ๋ฌธ๋งฅ์ž์œ ๋ฌธ๋ฒ•(PCFG, Probabilistic Context-Free Grammar) ๊ธฐ๋ฐ˜ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋„์ž…ํ•˜์—ฌ LLM ์ƒ์„ฑ SMT-LIB ํ”„๋กœ๊ทธ๋žจ์˜ ๋ถˆํ™•์‹ค์„ฑ์„ ์ฒด๊ณ„์ ์œผ๋กœ ์ •๋Ÿ‰ํ™”ํ•˜๊ณ , ์ด๋ฅผ ํ†ตํ•ด ์„ ํƒ์  ๊ฒ€์ฆ(selective verification)์œผ๋กœ 14-100% ์˜ค๋ฅ˜์œจ์„ ๊ฐ์†Œ์‹œํ‚จ๋‹ค.

Motivation

Achievement

Figure 1: LLM ์ƒ์„ฑ SMT-LIB ํ˜•์‹ํ™”์˜ ์‹ค์ฆ ๋ถ„์„ - ์‹ค์ œ ์ถœ๋ ฅ, PCFG ๊ทœ์น™ ๋นˆ๋„, ๊ณ„์‚ฐ๋œ ํ™•๋ฅ ๋ถ„ํฌ

๊ทธ๋ฆผ 1: '์ˆ˜ํ•™์ด๋‚˜ ๋ฌผ๋ฆฌ๋ฅผ ๊ณต๋ถ€ํ•˜๊ณ  ์—ด์‹ฌํžˆ ์ผํ•˜๋Š” ๋ชจ๋“  ์‚ฌ๋žŒ์€ ์„ฑ๊ณตํ•  ๊ฒƒ์ด๋‹ค'๋ผ๋Š” ๋ช…์ œ์— ๋Œ€ํ•œ LLM ์ƒ์„ฑ ๋…ผ๋ฆฌ์  ๋ณ€ํ˜•, ์ธก์ •๋œ PCFG ๊ทœ์น™ ๋นˆ๋„, ๊ณ„์‚ฐ๋œ ํ™•๋ฅ ๋ถ„ํฌ. ์‹ค์ œ ๋ฐ์ดํ„ฐ ์‚ฌ์šฉ, ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ ์—†์Œ.

  1. ์‹ค์ฆ์  ์‹คํŒจ๋ชจ๋“œ ๋ถ„์„: 5๊ฐœ ์ตœ์‹  LLM์„ 4๊ฐœ ํ˜•์‹์ถ”๋ก  ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ํ‰๊ฐ€ํ•˜์—ฌ SMT ๊ธฐ๋ฐ˜ ์ž๋™ํ˜•์‹ํ™”์˜ ๋„๋ฉ”์ธ ํŠน์ด์„ฑ์„ ์ •๋Ÿ‰ํ™”. ProofWriter์—์„œ +34.8% ์ •ํ™•๋„ ํ–ฅ์ƒ, FOLIO์—์„œ -44.5% ์ €ํ•˜. ๊ธฐ์กด UQ ๊ธฐ๋ฒ•(ํ† ํฐ ํ™•๋ฅ  ์—”ํŠธ๋กœํ”ผ)์ด ์ด๋Ÿฌํ•œ ์˜ค๋ฅ˜๋ฅผ ํฌ์ฐฉํ•˜์ง€ ๋ชปํ•จ์„ ์ฆ๋ช….
  2. PCFG ๊ธฐ๋ฐ˜ ํ™•๋ฅ  ํ”„๋ ˆ์ž„์›Œํฌ: ์ธก์ • ๊ฐ€๋Šฅํ•œ ํ™•๋ฅ ๊ณต๊ฐ„(ฮฃ*, F)์„ ์ •์˜ํ•˜๊ณ , LLM์ด ์œ ๋„ํ•˜๋Š” ํ™•๋ฅ ์ธก๋„(probability measure) ยต_{T,ฮธ,SMT}๋ฅผ SMT-LIB v2 ๋ฌธ๋ฒ• ๊ธฐ๋ฐ˜ PCFG๋กœ ๊ทผ์‚ฌ. ์ตœ๋Œ€์šฐ๋„์ถ”์ •(MLE)๊ณผ Lidstone ํ‰ํ™œํ™”(smoothing)๋ฅผ ํ†ตํ•ด ๊ทœ์น™ ํ™•๋ฅ ์„ ์ถ”์ •ํ•˜๋ฉฐ, ์ปค๋ฒ„๋ฆฌ์ง€ ๋ณด์ฆ ์ •๋ฆฌ(Coverage Guarantee Theorem 1)๋กœ ์ƒ˜ํ”Œ ํฌ๊ธฐ์˜ ํ•„์š”์„ฑ์„ ์ด๋ก ํ™”.
  3. ์„ธ๋ถ„ํ™”๋œ ๋ถˆํ™•์‹ค์„ฑ ๋ถ„๋ฅ˜๋ฒ•: ๊ธฐ์กด epistemic/aleatoric ์ด๋ถ„๋ฒ•์„ ๋„˜์–ด 4๊ฐœ ๋ฒ”์ฃผ(epistemic-knowledge, epistemic-procedural, recursive-complexity, capacity-limited)๋กœ ํ™•์žฅํ•œ ์ •์ œ๋œ ๋ถ„๋ฅ˜์ฒด๊ณ„ ์ œ์‹œ. 25๊ฐœ ๋ฉ”ํŠธ๋ฆญ ๊ฐœ๋ฐœ ๋ฐ ํ‰๊ฐ€ ์™„๋ฃŒ.
  4. ์ž‘์—… ์ข…์†์  ์‹ ํ˜ธ ์‹๋ณ„ ๋ฐ ์„ ํƒ์  ๊ฒ€์ฆ: ๋ถˆํ™•์‹ค์„ฑ ์‹ ํ˜ธ๊ฐ€ ์ž‘์—…์— ๋”ฐ๋ผ ๋‹ฌ๋ผ์ง์„ ์ž…์ฆ (์˜ˆ: ๋…ผ๋ฆฌ ์ž‘์—…์—์„œ ๋ฌธ๋ฒ• ์—”ํŠธ๋กœํ”ผ AUROC > 0.93). ๊ฒฝ๋Ÿ‰์˜ ๋ชจ๋ธ-๋ถˆ๊ฐ€์ง€๋ก ์ (model-agnostic) ์‹ ํ˜ธ ์œตํ•ฉ์œผ๋กœ ๊ฐœ๋ณ„ ๋ฉ”ํŠธ๋ฆญ ์„ฑ๋Šฅ ์ดˆ๊ณผ. ์ตœ์†Œ ๊ธฐ๊ฐ(minimal abstention)์œผ๋กœ ์˜ค๋ฅ˜์œจ 14-100% ๊ฐ์†Œ.

How

Figure 2-5: ์˜จ๋„ ๋ณ€์ˆ˜์— ๋”ฐ๋ฅธ ๋ฉ”ํŠธ๋ฆญ ๋ณ€ํ™” - ์ŠคํŽ™ํŠธ๋Ÿผ ๋ฐ˜๊ฒฝ, ๋ฌธ๋ฒ• ์—”ํŠธ๋กœํ”ผ, KLD, ์—”ํŠธ๋กœํ”ผ ๋น„์œจ

์ด๋ก ์  ๊ธฐ์ดˆ

PCFG ๊ทผ์‚ฌ ๋ฐฉ๋ฒ•

๋ฉ”ํŠธ๋ฆญ ๋„์ถœ (์ •์ /๋™์ )

์„ ํƒ์  ๊ฒ€์ฆ ํŒŒ์ดํ”„๋ผ์ธ

Originality

Limitation & Further Study

Evaluation

์ดํ‰: LLM๊ณผ ํ˜•์‹๊ฒ€์ฆ ๊ฐ„์˜ ๊ทผ๋ณธ์  ๊ธด์žฅ์„ PCFG ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ์šฐ์•„ํ•˜๊ฒŒ ํ•ด๊ฒฐํ•˜๊ณ , ์ž‘์—…๋ณ„

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ถˆํ™•์‹ค์„ฑ ์ •๋Ÿ‰ํ™” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•œ ์„œ๋ฒ ์ด๊ฐ€ 390๋ฒˆ์˜ ํ™•๋ฅ  ๋ฌธ๋ฒ•/์ถ”๋ก  ์‹ ๋ขฐ์„ฑ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์ด๋ก ์  ์ถœ๋ฐœ์ ์— ํ•ด๋‹น๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ถˆํ™•์‹ค์„ฑ ์ •๋Ÿ‰ํ™”์— ๊ด€ํ•œ ์ด๋ก ์  ๋…ผ์˜๊ฐ€ LLM์˜ ํ˜•์‹์ถ”๋ก  ๋ถˆํ™•์‹ค์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ์— ๊ทผ๋ณธ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Mechanistic interpretability for ai safety ๋…ผ๋ฌธ์€ LLM ์ž๋™ํ™” ์ถ”๋ก  ๊ณผ์ •์˜ ๋ถˆํ™•์‹ค์„ฑ ๋ฐ ์‹ ๋ขฐ ์ •๋Ÿ‰ํ™”์— ํ•„์ˆ˜์ ์ธ ์ด๋ก ์  ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜๋ฉฐ PCFG/๋ถˆํ™•์‹ค์„ฑ ๋ถ„์„์˜ ์ด๋ก  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
390๋ฒˆ ๋…ผ๋ฌธ์€ LLM์˜ ๋ถˆํ™•์‹ค์„ฑ ๋ฐ ์ž๋™ ์ฆ๋ช… ๊ณผ์ •์˜ ์‹ ๋ขฐ์„ฑ ํ‰๊ฐ€์— ๊ด€ํ•œ ์ด๋ก ์„ ์ œ์‹œํ•˜์—ฌ, ๋ฐ˜๋ก€ ์ƒ์„ฑ ๊ธฐ๋ฐ˜ ํ‰๊ฐ€ ๋…ผ์˜์˜ ๊ทผ๊ฑฐ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ์‹ ๊ฒฝ ์ •๋ฆฌ ์ฆ๋ช… ์ ‘๊ทผ๋ฒ•์„ ํ™•์žฅํ•˜๊ณ , ํ˜•์‹์ /ํ™•๋ฅ ์  ํ”„๋กœ๋น™์˜ ์ƒํ˜ธ ๋ณด์™„์„ฑ์„ ๋ณด์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ˜•์‹์  ๊ฒ€์ฆ ๋ฐ ์‚ฌ์‹ค ๊ฒ€์ฆ์—์„œ ์–ธ์–ด๋ชจ๋ธ์˜ ๋ถˆํ™•์‹ค์„ฑ์„ ์ ๊ฒ€ํ•˜๋Š” ๋“ฑ ๋ณธ ๋…ผ๋ฌธ๊ณผ ์‹œ๋„ˆ์ง€๊ฐ€ ๋†’์€ ์ ‘๊ทผ๋ฒ•์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ์‹ ๋ขฐ๋„์™€ ๋ถˆํ™•์‹ค์„ฑ, ํ•ด์„๊ฐ€๋Šฅ์„ฑ์˜ ํƒ๊ตฌ์—์„œ ์„œ๋กœ ๋‹ค๋ฅธ ์„ค๋ช…๋ฐฉ๋ฒ•๊ณผ ํ‰๊ฐ€ ํ‹€์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
HiPerRAG ๋…ผ๋ฌธ์€ ๊ณ ์„ฑ๋Šฅ ๊ฒ€์ƒ‰์ฆ๊ฐ•์ƒ์„ฑ ๊ตฌ์กฐ๋กœ LLM์˜ ๋ถˆํ™•์‹ค์„ฑ ๊ด€๋ฆฌ์— ์‹ค์šฉ์ ์ธ ์ ‘๊ทผ์„ ํ•ด์ฃผ๋ฉฐ, 390์˜ ๋ฌธ๋ฒ•์  ํ™•๋ฅ ์„ฑ ์ •๋Ÿ‰ํ™”์™€ ๋ณด์™„์ ์œผ๋กœ ์ฝ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ธฐ๊ณ„ํ•™์Šต ๋ชจ๋ธ ๋ถˆํ™•์‹ค์„ฑ ์‹ ๋ขฐ ๊ตฌ๊ฐ„ ์„ค์ •์— ๋Œ€ํ•œ ์ด๋ก ์  ์›๋ฆฌ ๋ฐ ์‘์šฉ ๋ถ„๋ฅ˜๋กœ, UQ ๋ฐฉ๋ฒ• ์„ ํƒ ๊ธฐ์ค€์„ ๋ณด์™„ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
MLE-bench ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ์ถ”๋ก  ๋ฐ ๋ถˆํ™•์‹ค์„ฑ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ์ƒˆ๋กœ์šด ๋ฒค์น˜๋งˆํฌ ์„ค๊ณ„๋กœ์„œ ํ™•๋ฅ  ๊ธฐ๋ฐ˜ ๋ถˆํ™•์‹ค์„ฑ ์ •๋Ÿ‰ํ™”์˜ ์‹ค์ œ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•์„ ์ถ”๊ฐ€๋กœ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
TrustLLM ๋…ผ๋ฌธ์€ ๋Œ€ํ˜•์–ธ์–ด๋ชจ๋ธ ๊ธฐ๋ฐ˜ ํ˜•์‹ ์ถ”๋ก ์˜ ์‹ ๋ขฐ๋„, ๋ถˆํ™•์‹ค์„ฑ, ํ‰๊ฐ€๋ฐฉ๋ฒ•์„ ๋ณด๋‹ค ํญ๋„“๊ฒŒ ๋‹ค๋ฃจ์–ด 390์˜ ์‘์šฉ๊ฐ€๋Šฅ์„ฑ์„ ํ™•์žฅํ•ด ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM์˜ ๋ถˆํ™•์‹ค์„ฑ ๋ฐ ์‹ ๋ขฐ์„ฑ ํ‰๊ฐ€ ์‹œ ํ•ด์„๊ฐ€๋Šฅ์„ฑ์ด ์–ธ์ œยท์–ด๋–ป๊ฒŒ ํšจ๊ณผ๋ฅผ ๋ฐœํœ˜ํ•˜๋Š”์ง€ ๋ถ„์„ํ•ด ์‹ค๋ฌด ๊ฐ€์ด๋“œ ๋ฒ”์œ„๋ฅผ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ˆ˜ํ•™์  ๋ชจ๋ธ ๋ฐ ๊ณต์‹ ๋ฐœ๊ฒฌ ๊ณผ์ •์— ๋ณธ ๋…ผ๋ฌธ์˜ ๋ถˆํ™•์‹ค์„ฑ ์ •๋Ÿ‰ํ™” ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ํ˜„์žฅ ์ ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Foundation-Model Surrogates ๋…ผ๋ฌธ์€ ๋ฌผ๋ฆฌ/๊ณผํ•™ ์ž‘์—…์—์„œ ํ™•๋ฅ ์„ฑ๊ณผ ๊ฒฐ์ •๋ก ์  ์š”๊ตฌ์˜ ์กฐ์œจ์ด ํ•„์š”ํ•œ ๋ฌธ๋งฅ ๋‚ด ๋Šฅ๋™ ํ•™์Šต ๋ถ„์•ผ์— PCFG ๊ธฐ๋ฐ˜ ํ”„๋ ˆ์ž„์›Œํฌ ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •