Essence
ํ
์ด๋ธ๊ณผ ํ
์คํธ ํผํฉ ์ง์์๋ต(Table-and-Text Hybrid Question Answering, HybridQA)์ ์ด์ง์ ๋ฐ์ดํฐ๋ฅผ ๊ฒฐํฉํ์ฌ ๋ต๋ณ์ ์์ฑํ๋ ๋์ ์ ์ธ NLP ๊ณผ์ ์ด๋ฉฐ, ๋ณธ ๋
ผ๋ฌธ์ ํ์ฌ๊น์ง์ ๋ฒค์น๋งํฌ, ๋ฐฉ๋ฒ๋ก , ํต์ฌ ๊ณผ์ , ํฅํ ๋ฐฉํฅ์ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ ์ต์ด์ ํฌ๊ด์ ์ค๋ฌธ์ด๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4.5/5 Overall: 4.25/5
์ดํ: HybridQA ๋ถ์ผ์ ์ฒซ ํฌ๊ด์ ์ค๋ฌธ์ผ๋ก์ ๋ฒค์น๋งํฌยท๋ฐฉ๋ฒ๋ก ยท๊ณผ์ ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ ์๋ฏธ ์๋ ๊ธฐ์ฌ์ด๋, ์ด๊ธฐ LLM ์๋์ ๊ธ์ํ ๋ฐฉ๋ฒ๋ก ๋ฐ์ ์ ์ถฉ๋ถํ ๋ฐ์ํ์ง ๋ชปํ ์ ๊ณผ ์ฐ์
์ ์ฉ ๊ด์ ์ ๋ถ์์ด ๋ฏธํกํ ๊ฒ์ด ์์ฌ์ด ์ ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
ํ
์ด๋ธ๊ณผ ํ
์คํธ ํผํฉ ์ง์์๋ต์ ๊ธฐ์ด๊ฐ ๋๋ ๋ฐ์ดํฐ์
์ด๋ ๋ฐฉ๋ฒ๋ก ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ด ๋
ผ๋ฌธ์์ ์ฌ์ฉ๋ ํ์ดํ๋ผ์ธ์ ๋ฒค์น๋งํฌ์ ํจ์จ ํ๊ฐ๊ฐ LLM ๊ธฐ๋ฐ ์ ์์ฌ ๋ฐ๊ฒฌ์ ์ฑ๋ฅ ํ๊ฐ์ ์ง์ ์ ์ผ๋ก ๊ธฐ์ด๊ฐ ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ด์ง์ ๋ฐ์ดํฐ ๊ฒฐํฉ ์ง์์๋ต์ ๋ค๋ฅธ ์ ๊ทผ ๋ฐฉ์์ ์ ์ฉํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
RAG๋ฅผ ํ์ฉํ ํ์ด๋ธ๋ฆฌ๋ QA ๋ฐ ํ+ํ
์คํธ ๊ธฐ๋ฐ ์ง์์๋ต ํด๊ฒฐ์ ์ด์ ์ ๋ง์ถ ์ต์ ๋ฒค์น๋งํฌ ๋ถ์ ๋
ผ๋ฌธ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ChartInstruct ๋
ผ๋ฌธ์ ์ฐจํธ ๊ธฐ๋ฐ ๋ค์ค๋ชจ๋ฌ Q&A์ reasoning์ ํ๊ตฌํ์ฌ, ํ์ด๋ธ๋ฆฌ๋ QA์ ๋ค๋ฅธ ์ ๊ทผ๋ฒ์ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
787์ ํ์ ํ
์คํธ์ ํ์ด๋ธ๋ฆฌ๋ QA์์ LLM์ ํ์ฉํ ํ
์ด๋ธ ์ดํด ๋ฐ ์ถ๋ก ๊ธฐ๋ฒ์ ์ค์ ์ ์ผ๋ก ๋ค๋ฃน๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ์ ๋น๊ตฌ์กฐํ ํ
์คํธ๋ฅผ ๊ฒฐํฉํ๋ ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ค.
ํ์ ์ฐ๊ตฌ
ํ
์ด๋ธ-ํ
์คํธ ํ์ด๋ธ๋ฆฌ๋ QA์ ํน์ ์ธก๋ฉด์ ํ์ฅํ ์ฐ๊ตฌ์ด๋ค.
์์ฉ ์ฌ๋ก
ํผํฉ ์ง์์๋ต ๋ฐฉ๋ฒ๋ก ์ ํน์ ๋๋ฉ์ธ์ ์ ์ฉํ ์ฐ๊ตฌ์ด๋ค.
์์ฉ ์ฌ๋ก
149๋ ํ ํ์ QA์ ๊ด๋ จ๋ ํ์ด๋ธ๋ฆฌ๋ ๋ฐ์ดํฐ์์ ํ์
์ ํ์ ๊ธฐ๋ฐ ๊ฐ์ค ํ๊ฐ๋ฅผ ์๋, HybridQA์ ์ค์ ์ ์ฉ ์ฌ๋ก๋ฅผ ๋ณด์ฌ์ค๋๋ค.