Essence
๋ณธ ๋
ผ๋ฌธ์ ํ์ ๋
ผ๋ฌธ ์ธ์ฉ ์ถ์ฒ ์์
์ ํด์๊ฐ๋ฅ์ฑ(interpretability)์ ๋์
ํ๊ธฐ ์ํด, ์ฟผ๋ฆฌ(claim ๋๋ entity mention)์ ๋ํด ์ธ์ฉํ ๋
ผ๋ฌธ์ ์ถ์ฒํ ๋ ๊ธฐ์กด ๋ฌธํ์์ ์ถ์ถํ ์ ์ฌํ ์ฆ๊ฑฐ ์คํฌ(evidence span)์ ๊ทผ๊ฑฐ๋ก ์ ์ํ๋ ์๋ก์ด ์ ๊ทผ๋ฐฉ์ ILCiteR์ ์ ์ํ๋ค.
How
์กฐ๊ฑด๋ถ ์ ๊ฒฝ ์์ ์์๋ธ: ์ฌ๋ฌ ์ ์ฌ๋ ์ ์๋ฅผ ๊ฒฐํฉํ์ฌ ์ฆ๊ฑฐ ์คํฌ ์ฌ์์ํ
์ฆ๊ฑฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ตฌ์ถ (Section 5):
- S2ORC ๋ฐ์ดํฐ์
์์ ์ ๊ทํ๋ ์ ๋ฌธ ํ
์คํธ๋ฅผ ๊ฐ์ง 20,000๊ฐ ์ด์์ Computer Science ๋
ผ๋ฌธ ์์ง
- ๊ฐ ๋
ผ๋ฌธ์์ ์ต์ ํ๋์ ์ธ์ฉ([REF] ํ๊ทธ)์ ํฌํจํ๋ ๋ฌธ์ฅ ์ถ์ถ
- ๊ฐ ๋ฌธ์ฅ์์ ๊ด๋ จ ํ
์คํธ ์คํฌ์ ์ฆ๊ฑฐ๋ก ์ถ์ถํ๊ณ , ๋์ผ ์ฆ๊ฑฐ์ ๋ํ ์ธ์ฉ ํ์๋ฅผ support๋ก ๊ธฐ๋ก
2๋จ๊ณ ์ฌ์์ํ ํ๋ก์ธ์ค (Section 6):
- ์ฆ๊ฑฐ ์คํฌ ์ฌ์์ํ:
- ์ดํ ์ ์ฌ๋(BM25)๋ก m๊ฐ์ ํ๋ณด ์ฆ๊ฑฐ ์คํฌ ์ฌ์ ๋ก๋ฉ
- ์กฐ๊ฑด๋ถ ์ ๊ฒฝ ์์ ์์๋ธ์ ์ด์ฉํด ์๋งจํฑ ์ ์ฌ๋(SBERT ์๋ฒ ๋ฉ)์ ์ดํ ์ ์ฌ๋ ๊ฒฐํฉ
- ๋
ผ๋ฌธ ์์ํ:
- ์ ํ๋ ์ฆ๊ฑฐ ์คํฌ๋ค๊ณผ ์ฐ๊ด๋ ๋ชจ๋ ๋
ผ๋ฌธ ํ๋ณด ์ถ์ถ
- ๊ฐ ๋
ผ๋ฌธ์ ๋ํด: (1) ์ต์ ๊ด๋ จ ์ฆ๊ฑฐ ์คํฌ์ ์์, (2) ๋์ support ์, (3) ์ถํ ์ฐ๋(์ต์ ์ฑ)๋ฅผ ์ข
ํฉ ๊ณ ๋ คํ์ฌ ์ต์ข
์์ ๊ฒฐ์
Evaluation
์ดํ: ํ์ ๋
ผ๋ฌธ ์ธ์ฉ ์ถ์ฒ์ ํด์๊ฐ๋ฅ์ฑ์ด๋ผ๋ ์ค์ํ ์ฐจ์์ ๋์
ํ ์๋ฏธ ์๋ ์ฐ๊ตฌ๋ก, ์๊ฑฐ๋ฆฌ ๊ฐ์ ๊ธฐ๋ฐ์ ์ค์ฉ์ ์ค๊ณ์ ๋๊ท๋ชจ ์ฆ๊ฑฐ ๋ฐ์ดํฐ์
๊ตฌ์ถ์ด ์ฅ์ ์ด๋ค. ๋ค๋ง ํ๊ฐ ๋ฐฉ๋ฒ๋ก ์ ์์ธ ์ ์์ ์ค์ ์ฌ์ฉ์ ์ฐ๊ตฌ๋ฅผ ํตํ ํด์๊ฐ๋ฅ์ฑ ๊ฒ์ฆ์ด ์ด๋ฃจ์ด์ง๋ค๋ฉด ๋์ฑ ๊ฐ๋ ฅํ ๋
ผ๋ฌธ์ด ๋ ์ ์๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Citation ํ
์คํธ ์์ฑ๊ณผ span ์ถ์ฒ ๋ฉ์ปค๋์ฆ ๊ด๋ จ ์ฐ๊ตฌ๋ก, ILCiteR์ ์ฆ๊ฑฐ ๊ธฐ๋ฐ ์ธ์ฉ ์ถ์ฒ ๋ฐฉ์์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
CiteBART ๋ฑ LLM ๊ธฐ๋ฐ ์ธ์ฉ ์์ฑ ํ์ต ๋ชจ๋ธ ์ฐ๊ตฌ๋ ํด์๊ฐ๋ฅํ ์ธ์ฉ ์ถ์ฒ์ ๊ธฐ๋ฐ ๊ธฐ์ ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Benchmark for evaluation and analysis of citation recommendation(150)์ ์ธ์ฉ ์ถ์ฒ ์ฑ๋ฅ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ๋ฉฐ, 420์ ํ๊ฐ ์ฒด๊ณ ์ค๊ณ์ ๊ธฐ์ด๋ก ํ์ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
420์ ๊ทธ๋ํ ๊ธฐ๋ฐ ํํ ํ์ต์ด๋ ํ๋ ฅ ๋คํธ์ํฌ ๋ชจ๋ธ๋ง์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ์ฌ hypergraph VAE ์ค๊ณ์ ํ์ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋
ผ๋ฌธ ๊ธฐ๋ฐ ์ง์์๋ต ๋ฐ ํ์์ ๋ฆฌ๋ทฐ ์์ฑ agent ์ฐ๊ตฌ์ ์ฐ๊ฒฐ, citation recommendation๊ณผ ์๋ํ๋ ๋ฆฌ๋ทฐ ์์คํ
๋น๊ต๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ILCiteR ๋
ผ๋ฌธ์ ๋
ผ๋ฌธ ์ธ์ฉ ์ถ์ฒ์ ํด์๊ฐ๋ฅ์ฑ๊ณผ ๊ทผ๊ฑฐ ์์ฃผ๋ก ์ํํ๋ฉฐ, HLM-Cite์์ ์ ๊ธฐ๋ ์ธ์ฉ ๊ตฌ๋ถ ๋ฌธ์ ์ ๋ค์ํ ํด๊ฒฐ์ฑ
์ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
420๋ฒ ๋
ผ๋ฌธ์ ๊ทผ๊ฑฐ ๊ธฐ๋ฐ ์ธ์ฉ ์ถ์ฒ ๋ฐ ํด์ ๊ฐ๋ฅ ํ์ง ์ธ์ฉ ์์ฑ ๋ชจ๋ธ(ILCiteR)์ ๋ค๋ฃจ์ด, 219๋ฒ CiteBART์ ๋์ผ ๋ฌธ์ ์ ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ก ์ ์ฌ์ฉํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ฐ์ธํ๋ ๊ทธ๋ํ ๊ธฐ๋ฐ ์ธ์ฉ ์ถ์ฒ ๋ฐ evidence span ๋งคํ์ LLM ํ์ฉ ์ฌ๋ก๋ฅผ ํตํด, ILCiteR๊ณผ ์์ดํ ์ ๊ทผ๋ฒ์ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ธ์ฉ ์ถ์ฒ ๋ฌธ์ ๋ฅผ ๋ค๋ฅธ ๋ฐฉ์์ผ๋ก ์ ๊ทผํ๋ ๋์์ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ธ์ฉ ์ถ์ฒ ์์คํ
์ ๋ค๋ฅธ ๋ชจ๋ธ ์ํคํ
์ฒ๋ก ๊ตฌํํ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
CiteCheck๊ฐ ์ธ์ฉ ์ค๋ฅ ํ์ง์ ์ง์คํ๋ ๋ฐ๋ฉด, ILCiteR์ ์ฆ๊ฑฐ ๊ธฐ๋ฐ ํด์๊ฐ๋ฅ ์ถ์ฒ์ ๋ชฉํ๋ก ํ์ฌ ์ธ์ฉ ์๋ํ์ ์ํธ๋ณด์์ ์ ๊ทผ์ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
๋ค์ค ๊ทธ๋ ์ด๋์ง๋ก ์ธ์ฉ ์ถ์ฒ๊ณผ ์ธ์ฉ ์ด์ ์์ฑ์ ํตํฉ์ ๊ด์ ์์, 420์์ ์ ์๋ ํด์๊ฐ๋ฅํ ์ง์ญ ์ธ์ฉ ์ถ์ฒ ๊ธฐ๋ฒ์ ์ฒด๊ณ์ ์ผ๋ก ํ์ฅํ ์ต์ ์ฌ๋ก์
๋๋ค.
ํ์ ์ฐ๊ตฌ
Interesting Scientific Idea Generation using Knowledge Graph(434)์ ์ฆ๊ฑฐ ๊ธฐ๋ฐ ์์ด๋์ด ์ถ์ฒ ์ ๊ทผ์ ํ์ฅํ์ฌ, 420์์ ์ ์ํ ์ฆ๊ฑฐ ์ค์ฌ ์ธ์ฉ ์ถ์ฒ์ ํ์ ์ ํ์ฉ๋๋ฅผ ๋ณด์ฌ์ค๋ค.
์์ฉ ์ฌ๋ก
๊ทผ๊ฑฐ ๊ธฐ๋ฐ์ ์ง์ญ์ ์ธ์ฉ ์ถ์ฒ ์์คํ
๊ฐ๋ฐ์ ์ค์ ์ ์ฉ๋ ๋ชจ๋ธ์
๋๋ค.