Tablemaster: A recipe to advance table understanding with language models

์ €์ž: Lang Cao, Hanbing Liu | ๋‚ ์งœ: 2025 | DOI: N/A 📄 PDF


Essence

Figure 1

ํ‘œ์˜ ํŠน์„ฑ์œผ๋กœ ์ธํ•œ 4๊ฐ€์ง€ ์ฃผ์š” ๋„์ „๊ณผ์ œ์™€ ์ด์— ๋Œ€์‘ํ•˜๋Š” ์†”๋ฃจ์…˜ ๊ฐœ์š”

์–ธ์–ด ๋ชจ๋ธ(LM)์˜ ํ…Œ์ด๋ธ” ์ดํ•ด ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด ๊ตฌ์กฐํ™”๋œ ๋ฐ์ดํ„ฐ์˜ ํŠน์„ฑ์œผ๋กœ๋ถ€ํ„ฐ ๋ฐœ์ƒํ•˜๋Š” 4๊ฐ€์ง€ ๋„์ „๊ณผ์ œ๋ฅผ ์‹๋ณ„ํ•˜๊ณ , ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ํ†ตํ•ฉ ํ”„๋ ˆ์ž„์›Œํฌ TableMaster๋ฅผ ์ œ์•ˆํ•œ๋‹ค.

Motivation

Achievement

Figure 2

ํ…Œ์ด๋ธ” ํฌ๊ธฐ, ์˜๋ฏธ๋ก ์  ๊ฐ•ํ™”, ์ถ”๋ก  ๋ฐฉ์‹, ์ •๊ทœํ™”์˜ ์˜ํ–ฅ์„ ๋ณด์—ฌ์ฃผ๋Š” ์‹คํ—˜์  ๋ถ„์„

  1. ๋„์ „๊ณผ์ œ์˜ ์ฒด๊ณ„์  ๋ถ„์„: 4๊ฐ€์ง€ ํ•ต์‹ฌ ๋„์ „๊ณผ์ œ ์‹๋ณ„
    • C1: ๋ชฉํ‘œ ๋ฐ์ดํ„ฐ ์œ„์น˜ ํŒŒ์•…์˜ ์–ด๋ ค์›€ (ํ‘œ์˜ ๋ฐ€์ง‘์„ฑ์œผ๋กœ ์ธํ•œ ์žฅ๋ฌธ๋งฅ ํ• ๋ฃจ์‹œ๋„ค์ด์…˜)
    • C2: ํ…Œ์ด๋ธ” ์˜๋ฏธ๋ก ์˜ ๋ถ€์กฑ (ํฌ์†Œํ•œ ์˜๋ฏธ์  ๋งฅ๋ฝ)
    • C3: ํ…์ŠคํŠธ ์ถ”๋ก ์˜ ์ˆ˜์น˜ ์ •ํ™•๋„ ๋ฌธ์ œ (๊ณ„์‚ฐ ์˜ค๋ฅ˜)
    • C4: ๊ธฐํ˜ธ ์ถ”๋ก ์˜ ์˜๋ฏธ๋ก ์  ๊ฒฝ์ง์„ฑ (๋…ผ๋ฆฌ ์˜ค๋ฅ˜, ๋ฐ์ดํ„ฐ ์˜ค๋ฅ˜)
  2. ์„ฑ๋Šฅ ํ–ฅ์ƒ: WikiTQ ๋ฐ์ดํ„ฐ์…‹์—์„œ GPT-4o-mini ๊ธฐ๋ฐ˜ 78.13% ์ •ํ™•๋„ ๋‹ฌ์„ฑ, ๊ธฐ์กด ๋ฒ ์ด์Šค๋ผ์ธ ์ดˆ๊ณผ

How

Figure 1

TableMaster ํ”„๋ ˆ์ž„์›Œํฌ์˜ 4๊ฐ€์ง€ ํ‘œ์ ํ™” ์†”๋ฃจ์…˜๊ณผ ์ ์‘์  ์ถ”๋ก 

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ํ…Œ์ด๋ธ” ์ดํ•ด์˜ ๋„์ „๊ณผ์ œ๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ๋ถ„์„ํ•˜๊ณ  ํ‘œ์ ํ™”๋œ ์†”๋ฃจ์…˜๋“ค์„ ์‹ค์šฉ์ ์œผ๋กœ ํ†ตํ•ฉํ•œ ์ข…ํ•ฉ์  ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, ์„ธ ๊ฐœ์˜ ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ์…‹์—์„œ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•จ์œผ๋กœ์จ ํ…Œ์ด๋ธ” ๊ธฐ๋ฐ˜ NLP ์ž‘์—…์˜ ๋ฐœ์ „์— ์‹ค์งˆ์ ์ธ ๊ธฐ์—ฌ๋ฅผ ํ•œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Tablemaster์ฒ˜๋Ÿผ LLM ๊ธฐ๋ฐ˜ ํ‘œ ์ดํ•ด ๋ฐ reasoning ํ™•์žฅ ์—ฐ๊ตฌ๋Š” ์ž…๋ ฅ ํ…Œ์ด๋ธ” ํ•ด์„ ๋ฐ ์ฆ๊ฑฐ ํ•˜์ด๋ผ์ดํŒ…์˜ ์ด๋ก ์  ๊ทผ๊ฑฐ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
787์€ ํ…Œ์ด๋ธ” ์ดํ•ด๋ ฅ ํ–ฅ์ƒ์„ ์œ„ํ•œ LLM ํ™œ์šฉ ๋ฐฉ์•ˆ์„ ์ œ์•ˆํ•ด, 1092์˜ ํ…Œ์ด๋ธ” ํŠนํ™” ์ „๋ฌธ๊ฐ€ ๋ชจ๋ธ๊ณผ ๊ธด๋ฐ€ํ•˜๊ฒŒ ์—ฐ๊ฒฐ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
355 'From Human Memory to AI Memory' ๋…ผ๋ฌธ์€ ๋ฉ”๋ชจ๋ฆฌ ๊ตฌ์กฐ ๋ฐ ๋‹ค์ค‘์ •๋ณด ์—ฐ๊ฒฐ์ด LLM ํ…Œ์ด๋ธ” ์ดํ•ด์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ์„ค๋ช…ํ•˜์—ฌ, 787 Tablemaster์˜ ์„ค๊ณ„ ์›๋ฆฌ๋ฅผ ์ด๋ก ์ ์œผ๋กœ ๋ณดํƒœ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
787์€ ํ‘œ์™€ ํ…์ŠคํŠธ์˜ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ QA์—์„œ LLM์„ ํ™œ์šฉํ•œ ํ…Œ์ด๋ธ” ์ดํ•ด ๋ฐ ์ถ”๋ก  ๊ธฐ๋ฒ•์„ ์ค‘์ ์ ์œผ๋กœ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Table-llm-specialist ๋…ผ๋ฌธ์€ ๋‹ค์–‘ํ•œ ํ…Œ์ด๋ธ” ์œ ํ˜•์— ํŠนํ™”๋œ LLM ์‚ฌ์šฉ๋ฒ•์„ ์ œ์‹œํ•˜์—ฌ TableMaster์™€ ๋น„๊ต ๊ฐ€์น˜๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
787๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ํ…Œ์ด๋ธ” ์ดํ•ด๋ฅผ ์œ„ํ•œ ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•(tablemaster)์„ ์ œ์‹œํ•˜๋ฏ€๋กœ, 841์˜ Tree-of-table ๋ฐฉ์‹๊ณผ ๋น„๊ตํ•ด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ…Œ์ด๋ธ” ๊ธฐ๋ฐ˜ ์ฒด์ธ์˜ค๋ธŒ์˜ํŠธ ๋ฐ ์ดํ•ด๋ ฅ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ๋‹ค์–‘ํ•œ ์‹ค์ œ ๋ฒค์น˜๋งˆํฌ์™€ Tablemaster ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์„ฑ๋Šฅ์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์‹œ๊ฐ์  ํ”ผ๋“œ๋ฐฑ์„ ํ™œ์šฉํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์˜ ์ถ”๋ก  ๊ฐœ์„ ์„ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
841 'Tree-of-table' ๋…ผ๋ฌธ์€ ํ…Œ์ด๋ธ” ๊ธฐ๋ฐ˜ ์ •๋ณด ์ถ”์ƒํ™” ๋ฐ step-by-step reasoning์„ ๊ฐ•์กฐํ•˜๋ฏ€๋กœ Tablemaster ์ดํ›„์˜ ํ…Œ์ด๋ธ” ์ดํ•ด ๊ฐ•ํ™” ๋ฐฉ์•ˆ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Chart to code ๋“ฑ ๊ตฌ์กฐํ™” ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM ํ”„๋ ˆ์ž„์›Œํฌ ์‘์šฉ์‚ฌ๋ก€๋กœ Tablemaster์˜ ์˜ํ–ฅ ๋ฒ”์œ„๋ฅผ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
ํ…Œ์ด๋ธ” ๊ธฐ๋ฐ˜ ๋ฌธ์ œ ํ•ด๊ฒฐ ๋Šฅ๋ ฅ ํ–ฅ์ƒ์ด ์‹ค์ œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๊ณผํ•™ ๋ฒค์น˜๋งˆํฌ(SCIVERSE) ํ‰๊ฐ€ ํ•ญ๋ชฉ๊ณผ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •