Improving demonstration diversity by human-free fusing for text-to-sql

์ €์ž: Dingzirui Wang, Longxu Dou, Xuanliang Zhang, Qingfu Zhu, Wanxiang Che | ๋‚ ์งœ: 2024 | DOI: N/A 📄 PDF


Essence

Figure 1

๊ธฐ์ค€์„ (์ขŒ)๊ณผ FUSED(์šฐ)์˜ ์‹œ์—ฐ(demonstration) ํ’€ ๊ตฌ์„ฑ ๋น„๊ต. FUSED๋Š” ๊ธฐ์กด ๋ผ๋ฒจ๋ง ์—†์ด๋„ ๋˜๋Š” ์ธ๊ฐ„ ๊ฐœ์ž… ์—†์ด ์‹œ์—ฐ ํ’€์„ ํ•ฉ์„ฑํ•˜๊ณ  ๋‹ค์–‘์„ฑ์„ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Œ

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์˜ ๋ฌธ๋งฅ ๋‚ด ํ•™์Šต(in-context learning)์„ ํ™œ์šฉํ•œ Text-to-SQL ์ž‘์—…์—์„œ ์‹œ์—ฐ(demonstration) ํ’€์˜ ๋‹ค์–‘์„ฑ์„ ์ธก์ •ํ•˜๊ณ  ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•œ๋‹ค. ๊ธฐ์กด์˜ ์ธ๊ฐ„ ๋ผ๋ฒจ๋ง ๊ธฐ๋ฐ˜ ์‹œ์—ฐ ์„ ํƒ ๋ฐฉ์‹์˜ ๋‚ฎ์€ ๋‹ค์–‘์„ฑ๊ณผ ๋†’์€ ๋น„์šฉ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด FUSED(FUSing itEratively for Demonstrations) ๋ฐฉ๋ฒ•์„ ๋„์ž…ํ•œ๋‹ค.

Motivation

Achievement

Figure 4, 5

๊ธฐ์กด ๋ผ๋ฒจ๋ง ๋ฐ์ดํ„ฐ์˜ DM ๊ฐ’๊ณผ ์„ฑ๋Šฅ ๋ถ„์„. ๋” ๋†’์€ DM์„ ๊ฐ€์ง„ ์‹œ์—ฐ ํ’€์˜ ์กด์žฌ๋ฅผ ์‹œ๊ฐ์ ์œผ๋กœ ํ™•์ธ

  1. ๋‹ค์–‘์„ฑ ์ง€ํ‘œ ์ •์˜: ์‚ฌ์šฉ์ž ์งˆ๋ฌธ ์ค‘ ์‹œ์—ฐ ํ’€์˜ ๊ฐ€์žฅ ์œ ์‚ฌํ•œ ์‹œ์—ฐ๊ณผ์˜ ์œ ์‚ฌ๋„๊ฐ€ ์ตœ์†Œ์ธ ์งˆ๋ฌธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋Š” DM ์ง€ํ‘œ ๋„์ž…. ๊ธฐ์กด ๋ผ๋ฒจ๋ง์˜ ๋‹ค์–‘์„ฑ์ด ์ถ”๊ฐ€๋กœ ํ–ฅ์ƒ๋  ์ˆ˜ ์žˆ์Œ์„ ์ฆ๋ช…
  2. ์„ฑ๋Šฅ ๊ฐœ์„ :
    • ๊ธฐ์กด ๋ผ๋ฒจ๋ง ๊ธฐ๋ฐ˜: ํ‰๊ท  3.2% ์„ฑ๋Šฅ ํ–ฅ์ƒ
    • ์ฒ˜์Œ๋ถ€ํ„ฐ ํ•ฉ์„ฑ: ํ‰๊ท  5.0% ์„ฑ๋Šฅ ํ–ฅ์ƒ
    • Spider, KaggleDBQA ๋“ฑ ์ฃผ์š” ๋ฒค์น˜๋งˆํฌ์—์„œ ๊ฒ€์ฆ
  3. ๋น„์šฉ ์ ˆ๊ฐ: ์ธ๊ฐ„ ๋ผ๋ฒจ๋ง ์—†์ด LLM ๊ธฐ๋ฐ˜ ์ž๋™ ํ•ฉ์„ฑ์œผ๋กœ ๋ผ๋ฒจ๋ง ๋น„์šฉ ์ œ๊ฑฐ

How

Figure 3

FUSED์˜ ํŒŒ์ดํ”„๋ผ์ธ: (1) ์‹œ์—ฐ ์ƒ˜ํ”Œ๋ง, (2) ์‹œ์—ฐ ์œตํ•ฉ ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ

FUSED์˜ ๋ฐ˜๋ณต์  ์œตํ•ฉ ํ”„๋กœ์„ธ์Šค:

Originality

Limitation & Further Study

ํ•œ๊ณ„์ :

ํ–ฅํ›„ ์—ฐ๊ตฌ:

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ Text-to-SQL ์ž‘์—…์˜ ์‹œ์—ฐ ํ’€ ๋‹ค์–‘์„ฑ์„ ์ฒด๊ณ„์ ์œผ๋กœ ์ธก์ •ํ•˜๊ณ  ๊ฐœ์„ ํ•˜๋Š” ์‹ค์šฉ์ ์ธ ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•œ๋‹ค. DM ์ง€ํ‘œ๋Š” ๋ช…ํ™•ํ•œ ๋™๊ธฐ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์œผ๋ฉฐ, FUSED ๋ฐฉ๋ฒ•์€ ๋ผ๋ฒจ๋ง ๋น„์šฉ์„ ์ ˆ๊ฐํ•˜๋ฉด์„œ๋„ ์ผ๊ด€๋œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค. ๋‹ค๋งŒ ์ผ๋ถ€ ์„ค๊ณ„ ์„ ํƒ์˜ ์ด๋ก ์  ๊ทผ๊ฑฐ๊ฐ€ ๋ณด๊ฐ•๋˜๊ณ  ์ƒ์„ฑ๋œ ์‹œ์—ฐ์˜ ํ’ˆ์งˆ์— ๋Œ€ํ•œ ์ƒ์„ธ ๋ถ„์„์ด ์žˆ์œผ๋ฉด ๋”์šฑ ์šฐ์ˆ˜ํ•œ ๋…ผ๋ฌธ์ด ๋  ๊ฒƒ์œผ๋กœ ํŒ๋‹จ๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Retrieval-augmented LLM์—์„œ ๋‹ค์–‘ํ•œ ์‹œ์—ฐ ์„ ํƒ ๋ฐฉ์‹์— ๋Œ€ํ•œ ์—ฐ๊ตฌ๊ฐ€ Text-to-SQL ์‹œ์—ฐ ๋‹ค์–‘์„ฑ ํ–ฅ์ƒ ๋ฐฉ์•ˆ์˜ ์ด๋ก ์  ๊ทผ๊ฑฐ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฐ์ดํ„ฐ ์ฆ๊ฐ• ๋ฐ ์ •๊ทœํ™” ๊ธฐ๋ฐ˜ ๋ผ๋ฒจ๋ง ์„ฑ๋Šฅ ๊ฐœ์„  ์ „๋žต์ด LLM ์‹œ์—ฐ ๋‹ค์–‘์„ฑ ํ–ฅ์ƒ ์—ฐ๊ตฌ์˜ ๊ทผ๊ฐ„์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Improving demonstration diversity by human-free fusing for theorem proving ๋…ผ๋ฌธ์€ ๋‹ค์–‘ํ•œ ์‹ ํ˜ธ๋ฅผ ํ˜ผํ•ฉํ•œ ์ง€์‹œ ์‹ ํ˜ธ ์ œ์ž‘๋ฒ•์ด T-SciQ์˜ ๊ต์œก ๋ฐ์ดํ„ฐ ํ˜ผํ•ฉ ์ „๋žต ์ด๋ก ์  ํ† ๋Œ€๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์•„์ด๋””์–ด/ํ…์ŠคํŠธ ์ƒ์„ฑ์˜ ๋‹ค์–‘์„ฑ ๋ฐ ์ œ์–ด ๋Šฅ๋ ฅ ๋…ผ์˜๊ฐ€ demonstration ๋‹ค์–‘์„ฑ ์ฆ์ง„ ๋ฐฉ์‹์— ์ง์ ‘์  ํ† ๋Œ€๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM alignment์˜ ๋‹ค์–‘ํ•œ ์ฐจ์›์„ ๋…ผ์˜ํ•˜์—ฌ, 421๊ณผ ๊ฐ™์€ ๋ฌธ๋งฅ ์˜ˆ์‹œ ์„ ์ •ยท์กฐํ•ฉ์—์„œ ๋‚˜ํƒ€๋‚˜๋Š” ์ธ๊ณต์ง€๋Šฅ ํ•™์Šต/์ ์‘์˜ ๋ณต์žก์„ฑ์„ ์ด๋ก ์ ์œผ๋กœ ๋’ท๋ฐ›์นจํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹ค๊ตญ์–ด/๋‹ค๋„๋ฉ”์ธ Wikipedia ํŽธ์ง‘ ์ด๋ ฅ ๊ธฐ๋ฐ˜ ๋ฌธ์žฅ ๋ถ„ํ• ยท์žฌ๊ตฌ์„ฑ ๋ฒค์น˜๋งˆํฌ๋กœ ์‹ค์ œ ๋ฐ์ดํ„ฐ ๋‹ค์–‘์„ฑ ํ™•๋Œ€์— ๋Œ€ํ•œ ์ฐธ๊ณ  ์‚ฌ๋ก€๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM๊ธฐ๋ฐ˜ ์ž๋™ ํ”ผ์–ด๋ฆฌ๋ทฐ ์ƒ์„ฑ์—์„œ ์‹œ์—ฐ(๋ฐ๋ชจ) ์„ ํƒ ๋‹ค์–‘์„ฑ๊ณผ AI reasoning์„ ๊ฒฐํ•ฉํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•ด, 421์˜ human-free ์‹œ์—ฐ ๋‹ค์–‘์„ฑ ํ–ฅ์ƒ ์ „๋žต๊ณผ ๋Œ€์กฐ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Self-Refine ๋“ฑ ๋ฐ˜๋ณต์  ์ž๊ธฐ ํ”ผ๋“œ๋ฐฑ ํ™œ์šฉ ์—ฐ๊ตฌ๊ฐ€ ๋ฌธ๋งฅ ๋‚ด ํ•™์Šต ์‹œ์—ฐ ๋‹ค์–‘์„ฑ ํ™•๋ณด ๋ฐ ์„ฑ๋Šฅ ํ–ฅ์ƒ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์‹ค์ œ์ ์œผ๋กœ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
MLE-bench(545)๋Š” ๋จธ์‹ ๋Ÿฌ๋‹ ์—์ด์ „ํŠธ์˜ ๋‹ค์–‘ํ•œ ๋ฌธ์ œ ๋ฒค์น˜๋งˆํฌ๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, 421์˜ Text-to-SQL ์ž‘์—… ์™ธ์—๋„ ์—์ด์ „ํŠธ ์ผ๋ฐ˜ํ™” ํ‰๊ฐ€์— ์ ํ•ฉํ•˜๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ์–ด ์ž๋™ํ™” ๋ฒค์น˜๋งˆํฌ ๋…ผ๋ฌธ์œผ๋กœ, ๋‹ค์–‘ํ•œ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ์™€ ํ‰๊ฐ€ ๊ธฐ์ค€ ๊ตฌ์ถ•๊ณผ์˜ ์—ฐ๊ณ„ ์—ฐ๊ตฌ์— ์ฐธ๊ณ ๋œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
580์˜ ๋ฒค์น˜๋งˆํฌ์™€ ์‹ค์ œ ์ ์šฉ ์ธก๋ฉด์—์„œ, 421์˜ demonstration diversity์™€ ์ธ์šฉ ์ถ”์ฒœ ๋ถ„์•ผ LLM ํ‰๊ฐ€๊ฐ€ ์ƒํ˜ธ ์‹œ๋„ˆ์ง€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •