์ ์: Yang Zhang, Yufei Wang, Kai Wang, Quan Z. Sheng, Lina Yao, A. Mahmood, Wei Emma Zhang, Rongying Zhao | ๋ ์ง: 2023 | DOI: 10.48550/arXiv.2309.09727 📄 PDF
Essence
LLM๊ณผ ์ธ์ฉ ๊ฐ์ ์ํธ ์ด์ต์ ๊ด๊ณ
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)๊ณผ ํ์ ์ธ์ฉ ๋ถ์ ๊ฐ์ ์ํธ ๋ณด์ ๊ด๊ณ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ ์ต์ด์ ์ข
ํฉ ์กฐ์ฌ ์ฐ๊ตฌ์ด๋ค. LLM์ด ์ธ์ฉ ๋ถ์ ์์
์ ์ฑ๋ฅ์ ํฅ์์ํค๊ณ , ์ญ์ผ๋ก ์ธ์ฉ ๋ฐ์ดํฐ๊ฐ LLM์ ํ
์คํธ ํํ์ ๊ฐ์ ํ๋ ์๋ฐฉํฅ ์ด์ต ๊ตฌ์กฐ๋ฅผ ์ ์ํ๋ค.
How
LLM์ด ์ธ์ฉ ์์
์ ๊ฐ์ ํ๋ ๊ฒฝ๋ก
์ธ์ฉ ๋ถ๋ฅ(Citation Classification)
- ์ธ์ฝ๋ ๊ธฐ๋ฐ LLM(BERT, SciBERT)์ ํตํ ๊ณ ํ์ง ํํ ์ถ์ถ
- CNN, GBDT ๋ฑ ๋ค๋ฅธ ML ๋ชจ๋๊ณผ์ ํ์ด๋ธ๋ฆฌ๋ ๊ฒฐํฉ
- ์์ฑํ LLM(T5, GPT-2)์ ํ์ฉํ ์ง์ ๋ ์ด๋ธ ์์ฑ ๋ฐ ํฉ์ฑ ๋ฐ์ดํฐ ์์ฑ
์ธ์ฉ ๊ธฐ๋ฐ ์์ฝ(Citation-based Summarization)
- ๋ฌธ์ ์์ค์ ํน์ง ์ถ์ถ์ ์ํด BERT, GPT-2, XLNET ๋ฑ ํ์ฉ
- ์ธ์ฉ ๋ฌธ์ฅ๊ณผ ์ฐธ๊ณ ๋
ผ๋ฌธ ๋ฌธ์ฅ ๊ฐ์ ์๋ฏธ์ ์ ์ฌ์ฑ ๋งค์นญ
- BART-large, PEGASUS-large ๋ฑ ์์ฑํ ๋ชจ๋ธ์ ํตํ ์ถ์ ์์ฝ
์ธ์ฉ ์ถ์ฒ(Citation Recommendation)
- ์ธ์ฉ ๋งฅ๋ฝ์ ๊ณ ํ์ง ํํ์ ํตํ ํ๋ณด ๋
ผ๋ฌธ ๊ฒ์ ๊ฐ์
- ์ธ์ฉ ๋คํธ์ํฌ ๊ทธ๋ํ์ ๊ตฌ์กฐ ์ ๋ณด ํตํฉ
- ๋ค์ค ๋ทฐ ํด๋ฌ์คํฐ๋ง ๋ฐ ์๋ฏธ ์ ์ฌ์ฑ ๊ธฐ๋ฐ ์ถ์ฒ
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ LLM๊ณผ ์ธ์ฉ ๋ถ์ ๊ฐ์ ์ํธ ์ด์ต ๊ด๊ณ๋ฅผ ์ต์ด๋ก ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ ์ค์ํ ์กฐ์ฌ ์ฐ๊ตฌ์ด๋ฉฐ, ํฅํ ํ์ ์ ๋ณด ์ฒ๋ฆฌ ๋ฐ LLM ๊ฐ์ ๋ถ์ผ์ ๋ช
ํํ ์ฐ๊ตฌ ๋ฐฉํฅ์ ์ ์ํ๋ค. ๋ค๋ง ์ค์ฆ์ ์ฑ๊ณผ์ ์ ๋์ ๋น๊ต๊ฐ ๊ฐํ๋๋ฉด ๋์ฑ ๊ฐ๋ ฅํ ๊ธฐ์ฌ๊ฐ ๋ ์ ์์ ๊ฒ์ผ๋ก ์์๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
220์ ์ธ์ฉ ํ
์คํธ ์๋ ์์ฑ ๋ฐฉ๋ฒ์ ์ ์ํ์ฌ, 882 ๋
ผ๋ฌธ์์ ๋ค๋ฃจ๋ ์ธ์ฉ-LLM ์ํธ์์ฉ์ ์ค์ง์ ์์๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ฒ ๋
ผ๋ฌธ์ LLM์ ํ์ฉํ ๊ณผํ์ ๊ฐ์ค ์์ฑ ์ผ๋ฐ๋ก ์ ๋ค๋ค, 882๋ฒ์ LLM๊ณผ ์ธ์ฉ ๋ถ์ ์ ์ ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ผ๋ก ์ ํฉํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
When large language models meet citation ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์ธ์ฉ ๋ฌธ์ ์ ๋ํ ์๋ฒ ์ด๋ก์, ์ธ์ฉ ์ถ์ฒ ์์คํ
์ ํ๊ฐ ๊ธฐ์ค์ ์ด๋ก ์ ์ผ๋ก ๋ท๋ฐ์นจํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
580์ ์ธ์ฉ์ปจํ
์คํธ ์ถ์ฒ ๋ฌธ์ ์ ์ด๋ก ์ /์ค์ ์ ์์ ์ 882 ๋
ผ๋ฌธ์์ ์ธ์ฉ ์์ฑ ๋ฐ LLM ํ๊ฐ์ ์ต์ ๋ํฅ๊ณผ ํ๊ณ๋ก ๋ณด๊ฐ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
When large language models meet citation: A survey ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์ค์ ๋
ผ๋ฌธ ์ธ์ฉ ํจํด์ ๋ํ ์กฐ์ฌ๋ก, ์๋ชป๋ ์ธ์ฉ ๊ฒ์ฆ ๋ฐ ํ์์ ๋ณด ์ถ์ ์ฐ๊ตฌ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
When large language models meet citation: A survey ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์ธ์ฉ/๊ด๋ จ๋ฌธ์ฅ ์์ฑ์ ํํฉ๊ณผ ๋ฌธ์ ์ ์ ํญ๋๊ฒ ๋
ผ์ํด 329์์ ํ์ฉํ๋ ๋ค์ํ ๊ธฐ๋ฒ ๋ฐ ํ๊ณ๋ฅผ ์ดํดํ๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM๊ณผ ์ธ์ฉ ๋ฐ์ดํฐ์ ์ํธ ๋ณด์์ ๊ด๊ณ์ ๋ํ ์๋ฒ ์ด๋ก, ์ธ์ฉ ๊ทธ๋ํ ํ์ฉ ์ฐ๊ตฌ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
882๋ LLM๊ณผ ์ธ์ฉ ๋ถ์์ ์ํธ ์์ฉ์ ๋ฆฌ๋ทฐํ๋ ๋
ผ๋ฌธ์ผ๋ก, 881์ ๋
ผ๋ฌธ ๊ฒ์ฆ ์๋ํ๊ฐ ์ธ์ฉ ์ ๋ขฐ์ฑ ํ๊ฐ์๋ ๋ฐ์ ํ๊ฒ ๊ด๋ จ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
882๋ ์ธ์ฉ ๋ฐ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ๊ณผํ ๋
ผ๋ฌธ ๊ฒ์ฆ ์๋ํ์ ๊ดํ ์ต์ ์๋ฒ ์ด๋ก, 3266 ํฉ์ฑ ๋ฐ์ดํฐ ์ฌ์ธต ํ๊ฐ์ ๋ฉํ์ฐ๊ตฌ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
When large language models meet citation: A survey ๋
ผ๋ฌธ์ LLM๊ณผ ์ธ์ฉ ์ถ์ฒ/์์ฑ์ ๊ด๊ณ, ํ๊ณ ๋ฐ ์ค๋ฅ๋ฅผ ์ข
ํฉ์ ์ผ๋ก ๋ค๋ฃจ์ด CiteCheck์ ๋ฌธ์ ์์ ์ด๋ก ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
When large language models meet citation: A survey ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์ธ์ฉ ๊ด๋ จ ๋ค์ํ ๋ฐฉํฅ์ฑ์ ๋ค๋ฃจ๊ณ ์์ด 238๋ฒ์ ๊ตฌ์ฒด์ ์์ฑ ๋ฐฉ์๊ณผ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
CiteBART(219)๋ ๋ก์ปฌ ์ธ์ฉ๋ฌธ ์์ฑ ๋ฌธ์ ์ LLM์ ์ ์ฉํ๋ ๋ ๋ค๋ฅธ ๋ฐฉํฅ์ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ธ์ฉ ์ ํ๋๋ฅผ ํ๊ฐํ๋ LLM ๋ฒค์น๋งํฌ๋ก, ์ฅ๋ฌธ๋งฅ ํ์ฉ ํ๊ฐ์ ์ธ์ฉ ์ค๋ฅ ๊ฒ์ถ ๊ฐ ์๋์ง๋ฅผ ํ์ธํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
882๋ ์ธ์ฉ ์์ฑ์ ์ํ LLM ๊ธฐ๋ฐ ๋ชจ๋ธ ๋ฆฌ๋ทฐ๋ก, 273์ ๋งํฌ ์์ธก ๊ธฐ๋ฐ ์ธ์ฉ ์ถ์ฒ๊ณผ ๋น๊ตํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
CiteCheck ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์ธ์ฉ ์ค๋ฅ ํ์ง์ ์ ๋ขฐ๋ ํฅ์ ์ธก๋ฉด์์ ์ํธ๋ณด์์ ๋ฒค์น๋งํฌ์ ์ค์ ์ ๋์ ๊ณผ์ ๋ฅผ ๋น๊ตํ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
473๋ฒ ๋
ผ๋ฌธ์ LLM์ ํ์ฉํ ๊ณผํ์ ๊ฐ์ค ์๋์์ฑ ์คํ๊ณผ ํ๊ฐ ๋ฐฉ๋ฒ์ ์ด์ ์ ๋ง์ถ๋ฉฐ, 882๋ฒ ์ธ์ฉยทLLM ์ํธ์์ฉ ์ฌ์ธต ์กฐ์ฌ์ ์์ฉํ์ด๋ค.
ํ์ ์ฐ๊ตฌ
ScholarChemQA ๋
ผ๋ฌธ์ ์ธ์ฉ๊ณผ ํํ ๋๋ฉ์ธ์์ LLM์ ์ง๋ฌธ์๋ต ๋ฅ๋ ฅ์ ํ๊ฐํ์ฌ LLM์ด ํ์ ์ธ์ฉ ๋คํธ์ํฌ์ ์ด๋ป๊ฒ ์ํธ์์ฉํ ์ ์๋์ง ์ดํด์ ๋์์ด ๋๋ค.
ํ์ ์ฐ๊ตฌ
882๋ฒ ๋
ผ๋ฌธ์ ๋ํ ์ธ์ด๋ชจ๋ธ๊ณผ ์ธ์ฉ ์ถ์ฒ ์์คํ
์ ๊ดํ ์๋ฒ ์ด๋ก, Openscholar์ ์ธ์ฉ ๊ธฐ๋ฐ ์๋ต ํฉ์ฑ ์์คํ
์ ํธ๋ ๋์ ํ๊ณ์ ์ดํด์ ๋์์ด ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
219์ ๋ก์ปฌ ์ธ์ฉ ์์ฑ/์ถ์ฒ ๋ฌธ์ ๋ 882์์ LLM ๊ธฐ๋ฐ ์ธ์ฉ ์์ฑ ๋ํฅ ๋ฐ ํ๊ฐ ํ๋ ์์ํฌ ์ ์ฒด ๋
ผ์๋ก ํ์ฅ๋๋ค.
ํ์ ์ฐ๊ตฌ
์ธ์ฉ ๊ธฐ๋ฐ LLM ๊ฒ์ฆ ๋ฐ ์ข
ํฉ ๋ฅ๋ ฅ ํ๊ฐ๋ฅผ ํตํด GPT-4์ ๋ฌธํ์ข
ํฉ ํ๊ณ๋ฅผ ๋ณด๋ค ์ฒด๊ณ์ ์ผ๋ก ๋ถ์ํ ์ฐ๊ตฌ๋ค.
ํ์ ์ฐ๊ตฌ
889์ XtraGPT ํ๋ ์์ํฌ๋ ๋
ผ๋ฌธ ๋ด ๋งฅ๋ฝ ์ ์ด ์์ ๋ชจ๋ธ๋ก, ์ธ์ฉ ๋ฐ์ดํฐ์ LLM ํ์ฉ์ ์ค์ ์ ์์ฉ์ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
์ธ์ฉ ์ถ์ฒ ๋ฐ ์์ฑ์์ LLM์ ์ธ์ฉ ํจํด, ๋งํ ํจ๊ณผ ํ๋ ๋ฑ ํ์์ ๋ํ ํต์ฐฐ์ ์ฒด๊ณ์ ์ผ๋ก ์กฐ์ฌํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์ธ์ฉ ๋คํธ์ํฌยท๋ค์ธ์ด์ฑ ๋ฌธ์ ์์ LLM ์์ฉ์ ์ต๊ทผ ๋ํฅ์ ๋ค๋ฃจ๋ฉฐ, ์์ด ์ง๋ฐฐ ํํฉ์ ๋ํ ํด์ ๋ฐ ํ์ฉ ๋
ผ์์ ๋์์ ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
์๋ช
๊ณผํ ๋ถ์ผ์์ LLM์ ์ธ์ฉ ๊ธฐ๋ฐ ์ฌ์คํ์ธยท๊ฒ์ฆ ๋ฉ์ปค๋์ฆ์ ์ข
ํฉ์ ์ผ๋ก ๋ถ์ํ๋ค.
์์ฉ ์ฌ๋ก
S2ORC์ ๊ฐ์ ๋๊ท๋ชจ ํ์ ์ฝํผ์ค๋ฅผ ํ์ฉํ์ฌ ์ค์ ์ฐ๊ตฌ ๋ฌธ์ ์ ์ ์ฉํ ์ฌ๋ก์ด๋ค.
์์ฉ ์ฌ๋ก
882 ๋
ผ๋ฌธ์ LLM์ ์ธ์ฉ ๋ฅ๋ ฅ๊ณผ ๊ด๋ จ๋ ํ๊ฐ ์งํ๋ฅผ ๋ค๋ฃจ์ด, 810 ๋
ผ๋ฌธ์ ์ ๋ขฐ์ฑยท์ง์ ์ญ๋ ์ธก์ ์ ์ค์ ๋ก ์ด๋ป๊ฒ ์ ์ฉํ ์ ์์์ง ๋ณด์ฌ์ค๋๋ค.
์์ฉ ์ฌ๋ก
789๋ฒ ๋
ผ๋ฌธ์ ์ธ์ฉ ๊ทธ๋ํ ๊ธฐ๋ฐ ๋ถ๋ฅ์ฒด๊ณ์ LLM ๊ฒฐํฉ์ ์ค์ ํ์ฉ ์ฌ๋ก๋ก, 882๋ฒ ๋
ผ๋ฌธ์ ์ํธ๋ณด์๊ด๊ณ๋ฅผ ์ค์ฆํฉ๋๋ค.