Explaining relationships among research papers

์ €์ž: Xiangci Li, Jessica Ouyang | ๋‚ ์งœ: 2024 | DOI: N/A 📄 PDF


Essence

Figure 1

๊ทธ๋ฆผ 1: GPT-4 ๊ธฐ๋ฐ˜ Bing Chat๊ณผ ๋ณธ ๋…ผ๋ฌธ์˜ ์ ‘๊ทผ ๋ฐฉ์‹ ๋น„๊ต. Bing Chat์˜ ์ถœ๋ ฅ์€ ์ผ๋ฐ˜์ ์ด๊ณ  ๋ถ€์ •ํ™•ํ•œ ๋ฐ˜๋ฉด, ์ œ์•ˆ ๋ฐฉ์‹์€ ๊ตฌ์กฐํ™”๋œ ํŠน์„ฑ(features)์„ ํ™œ์šฉํ•˜์—ฌ ๋ณด๋‹ค ์ •ํ™•ํ•œ ์ธ์šฉ๋ฌธ์„ ์ƒ์„ฑํ•œ๋‹ค.

๋ณธ ๋…ผ๋ฌธ์€ ์—ฐ๊ตฌ ๋…ผ๋ฌธ๋“ค ๊ฐ„์˜ ๋ณต์žกํ•œ ๊ด€๊ณ„๋ฅผ ํฌ์ฐฉํ•˜๊ธฐ ์œ„ํ•ด ํŠน์„ฑ ๊ธฐ๋ฐ˜(feature-based) LLM ํ”„๋กฌํ”„ํŒ… ์ ‘๊ทผ๋ฒ•์„ ์ œ์•ˆํ•˜๋ฉฐ, ๋‹จ์ˆœ ์ธ์šฉ๋ฌธ ์ƒ์„ฑ์„ ๋„˜์–ด ์—ฌ๋Ÿฌ ๋…ผ๋ฌธ์„ ํ•œ ๋ฒˆ์— ์ฒ˜๋ฆฌํ•˜๊ณ  ์ด๋“ค์„ ์—ฐ๊ฒฐํ•˜๋Š” ์ „ํ™˜ ๋ฌธ์žฅ(transition sentence)์„ ์ƒ์„ฑํ•œ๋‹ค.

Motivation

Achievement

Figure 3

๊ทธ๋ฆผ 3: ์ธ๊ฐ„ ํ‰๊ฐ€ ์ ์ˆ˜ ๋ถ„ํฌ. ์ ๋ถ„์  ๊ธ€์“ฐ๊ธฐ ์Šคํƒ€์ผ์„ ๋ณด์ธ ์ƒ์„ฑ๋ฌธ์ด ๋” ๋†’์€ ์„ ํ˜ธ๋„๋ฅผ ๋ณด์ธ๋‹ค.

  1. ํŠน์„ฑ ๊ธฐ๋ฐ˜ ์ƒ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ: ์ธ์šฉ ๋…ผ๋ฌธ์˜ ๊ธฐ์—ฌ๋„, ๋…ผ๋ฌธ ๊ฐ„ ๊ด€๊ณ„, ์ธ์šฉ์˜ ๋‹ดํ™” ์—ญํ• (discourse role)์„ ํ‘œํ˜„ํ•˜๋Š” ํ•ด์„ ๊ฐ€๋Šฅํ•œ(human-interpretable) ์ž์—ฐ์–ธ์–ด ํŠน์„ฑ๋“ค์„ ์ •์˜ํ•˜๊ณ  ์ž๋™ ์ถ”์ถœ
  2. ๋‹ค์ค‘ ์ธ์šฉ ๋™์‹œ ์ƒ์„ฑ: ๋‹จ์ผ ์ธ์šฉ๋ฌธ์ด ์•„๋‹Œ ์—ฌ๋Ÿฌ ๋…ผ๋ฌธ์˜ ์ธ์šฉ๊ณผ ์ด๋ฅผ ์—ฐ๊ฒฐํ•˜๋Š” ์ „ํ™˜ ๋ฌธ์žฅ์„ ํ•œ ๋ฒˆ์— ์ƒ์„ฑํ•˜์—ฌ ์‘์ง‘๋ ฅ ์žˆ๋Š” ๋ฌธํ•™ ๊ฒ€ํ†  ๊ตฌ์„ฑ
  3. ๊ณ„ํš ๊ธฐ๋ฐ˜ ์ƒ์„ฑ์˜ ํšจ๊ณผ์„ฑ: ๊ณ ์ˆ˜์ค€ ๊ด€๊ณ„ ์„ค๋ช…(plan)์„ ํ†ตํ•œ ์œ ๋„๊ฐ€ ์ƒ์„ฑ ํ’ˆ์งˆ ํ–ฅ์ƒ์— ๊ธฐ์—ฌํ•จ์„ ์‹ค์ฆ์ ์œผ๋กœ ์ž…์ฆ
  4. ์ ๋ถ„์  ๊ธ€์“ฐ๊ธฐ ์„ ํ˜ธ๋„ ๋ฐœ๊ฒฌ: ์ธ๊ฐ„ ํ‰๊ฐ€ ๊ฒฐ๊ณผ ๊ณ ์ˆ˜์ค€์˜ ์ถ”์ƒ์  ์ธ์šฉ๊ณผ ์ „ํ™˜ ๋ฌธ์žฅ์ด ํฌํ•จ๋œ ์‘์ง‘๋ ฅ ์žˆ๋Š” ๋ฌธ์„œ๋ฅผ ๊ฐ•ํ•˜๊ฒŒ ์„ ํ˜ธ

How

Figure 4

๊ทธ๋ฆผ 4: ์‚ฌ์‹ค์  ์˜ค๋ฅ˜(factual errors) ๊ฐœ์ˆ˜ ๋น„๊ต. ์ œ์•ˆ ๋ฐฉ์‹์ด Bing Chat ๋Œ€๋น„ ์˜ค๋ฅ˜๋ฅผ ํฌ๊ฒŒ ๊ฐ์†Œ์‹œํ‚จ๋‹ค.

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ์—ฐ๊ตฌ ๋…ผ๋ฌธ ๊ฐ„์˜ ๋ณต์žกํ•œ ๊ด€๊ณ„๋ฅผ ํฌ์ฐฉํ•˜์—ฌ ์‘์ง‘๋ ฅ ์žˆ๋Š” ๋ฌธํ•™ ๊ฒ€ํ† ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ์‹ค์งˆ์ ์ธ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, ํŠน์„ฑ ๊ธฐ๋ฐ˜ LLM ํ”„๋กฌํ”„ํŒ…์˜ ์œ ํšจ์„ฑ์„ ์ž…์ฆํ–ˆ์œผ๋‚˜, ๊ณ„ํš์˜ ์ž๋™ ์ƒ์„ฑ ๋ฐ ๋Œ€๊ทœ๋ชจ ํ‰๊ฐ€๋ฅผ ํ†ตํ•œ ์™„์„ฑ์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
When large language models meet citation: A survey ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์ธ์šฉ/๊ด€๋ จ๋ฌธ์žฅ ์ƒ์„ฑ์˜ ํ˜„ํ™ฉ๊ณผ ๋ฌธ์ œ์ ์„ ํญ๋„“๊ฒŒ ๋…ผ์˜ํ•ด 329์—์„œ ํ™œ์šฉํ•˜๋Š” ๋‹ค์–‘ํ•œ ๊ธฐ๋ฒ• ๋ฐ ํ•œ๊ณ„๋ฅผ ์ดํ•ดํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Citebart ๋…ผ๋ฌธ์€ ๋…ผ๋ฌธ ๊ฐ„ ๋กœ์ปฌ ์ธ์šฉ ๋ฌธ์žฅ ์ƒ์„ฑ์— ์ง‘์ค‘ํ•ด 329๋ฒˆ์˜ LLM ํ”„๋กฌํ”„ํŒ… ๊ธฐ๋ฐ˜ ์ „ํ™˜ ๋ฌธ์žฅ ์ƒ์„ฑ์˜ ๊ธฐ์ˆ ์  ํ† ๋Œ€๋ฅผ ๋งŒ๋“ ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ธ์šฉ ์˜๋„ ์ธ์‹์„ ์œ„ํ•œ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ ๋…ผ๋ฌธ ๊ฐ„ ๊ด€๊ณ„ ํƒ์ƒ‰์— ๋Œ€ํ•œ survey๋กœ ์ด ๋…ผ๋ฌธ์˜ ๋ฌธ์ œ์˜์‹์— ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Controllable Citation Sentence Generation ๋…ผ๋ฌธ์€ ์ธ์šฉ๋ฌธ์žฅ ์ƒ์„ฑ์„ ์ธ์šฉ ์˜๋„์™€ ํ‚ค์›Œ๋“œ ๋“ฑ ๋‹ค์–‘ํ•œ ์กฐ๊ฑด์— ๋”ฐ๋ผ ์ œ์–ดํ•˜๋Š” ์ ‘๊ทผ๋ฒ•์œผ๋กœ, 329์˜ ๋…ผ๋ฌธ ๊ฐ„ ๊ด€๊ณ„ ์„ค๋ช… ์ƒ์„ฑ๊ณผ ๋Œ€์กฐ์ ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋…ผ๋ฌธ ๊ฐ„ ๊ด€๊ณ„ ํฌ์ฐฉ์„ ์ง€์‹๊ทธ๋ž˜ํ”„์™€ LLM ๊ฒฐํ•ฉ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ์ ‘๊ทผํ•˜์—ฌ, feature-based prompt ๋ฐฉ์‹๊ณผ ์ƒ์ดํ•œ ๋Œ€์•ˆ์ž„์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
What factors affect multimodal in-context learning ๋…ผ๋ฌธ์€ ์ธ์šฉ๋ฌธ๋งฅ ์ƒ์„ฑ์—์„œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ ๋กฑ์ปจํ…์ŠคํŠธ ์ฒ˜๋ฆฌ ๋ฐฉ๋ฒ•์˜ ๋Œ€์•ˆ์  ์‹คํ—˜ ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Knowledge Navigator ๋…ผ๋ฌธ์€ ๋…ผ๋ฌธ ๊ฐ„ ๊ด€๊ณ„ ํ•ด์„๊ณผ ํ†ตํ•ฉ์  browsing ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•˜์—ฌ, Citation context recommendation์˜ ๋‹ค์–‘ํ•œ ๊ตฌํ˜„ ํŒจํ„ด์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
329๋Š” ๋…ผ๋ฌธ ๊ฐ„ ๊ด€๊ณ„์„ฑ ์„ค๋ช…์„ ๋ชฉ์ ์œผ๋กœ ํ•˜์ง€๋งŒ, 757๊ณผ ๊ฐ™์ด LLM์„ ํ†ตํ•œ ๊ฐ„์ ‘์  ์ •๋ณด ์ถ”๋ก ์ด ํ•ต์‹ฌ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Knowledge graph๋ฅผ ํ™œ์šฉํ•œ ๊ณผํ•™ ์•„์ด๋””์–ด ์—ฐ๊ฒฐ/์ƒ์„ฑ ์—ฐ๊ตฌ๋กœ ๋…ผ๋ฌธ ๊ฐ„ ๊ด€๊ณ„ ์„ค๋ช… ๊ธฐ๋Šฅ์˜ ํƒ€ ์ ‘๊ทผ๋ฒ•์„ ๋ณด์—ฌ์ค€๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
329 ๋…ผ๋ฌธ์€ ๋‹ค์ˆ˜ ๋…ผ๋ฌธ ๊ฐ„์˜ ์ „ํ™˜ ๋ฌธ์žฅ ๋ฐ ๋งฅ๋ฝ ์„ค๋ช…์„ ์ƒ์„ฑํ•˜์—ฌ ๋‹จ์ˆœ ์ธ์šฉ ์ƒ์„ฑ์—์„œ ๋งฅ๋ฝ์  ์„ค๋ช…๊นŒ์ง€ ํ™•์žฅ๋œ ๋ฐฉ์‹์„ ์ œ์•ˆํ•˜๋ฏ€๋กœ ๋Œ€๋น„ํ•ด์„œ ์ฝ๊ธฐ ์ข‹์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
SurveyX๋Š” LLM ๊ธฐ๋ฐ˜ ํ•™์ˆ  ๋…ผ๋ฌธ ์š”์•ฝ ์ž๋™ํ™”์™€ ๋‹ค์–‘ํ•œ ๋…ผ๋ฌธ ๊ฐ„ ๊ด€๊ณ„ ๋ถ„์„ ์ž๋™ํ™”๋ฅผ ์ˆ˜ํ–‰ํ•˜์—ฌ ๋ณธ ๋…ผ๋ฌธ์˜ ๋ฐฉํ–ฅ์„ฑ์„ ํ™•์žฅํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
CiteCheck ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์ธ์šฉ ์˜ค๋ฅ˜ ํƒ์ง€ ๋“ฑ ์ถ”์ฒœ๋œ ์ธ์šฉ๋ฌธ ๋ฐ ๋…ผ๋ฌธ ๊ฐ„ ๊ด€๊ณ„์˜ ์‹ ๋ขฐ์„ฑ ๊ฐœ์„ ์„ ์‹ค์ œ์ ์œผ๋กœ ํ™•์žฅํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Explaining relationships among research papers ๋…ผ๋ฌธ์€ ๋…ผ๋ฌธ ๊ฒฐ๊ณผ์˜ ํ•ด์„๊ณผ ๊ด€๊ณ„ ์„ค๋ช…์„ ์‹œ๋„ํ•˜๋ฏ€๋กœ, MACE ๊ธฐ๋ฐ˜ ํฌํ…์…œ์˜ ์˜ˆ์ธก ํ•œ๊ณ„๋‚˜ ๋น„๊ต๋ถ„์„์— ์‹ค์ œ์ ์œผ๋กœ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •