Controllable Citation Sentence Generation with Language Models

์ €์ž: Nianlong Gu, Richard H. R. Hahnloser | ๋‚ ์งœ: 2022 | DOI: arXiv:2211.07066 📄 PDF


Essence

Figure 1

์–ธ์–ด ๋ชจ๋ธ์„ ์ด์šฉํ•œ ์ธ์šฉ ๋ฌธ์žฅ ์ƒ์„ฑ ์›Œํฌํ”Œ๋กœ์šฐ: ์ง€๋„ ํ•™์Šต ๋ฏธ์„ธ์กฐ์ • ํ›„ PPO๋ฅผ ํ†ตํ•œ ์ œ์–ด ๊ฐ€๋Šฅ์„ฑ ์ตœ์ ํ™”

๋ณธ ๋…ผ๋ฌธ์€ ์ €์ž๊ฐ€ ์ธ์šฉ ์˜๋„(citation intent)์™€ ํ•ต์‹ฌ ํ‚ค์›Œ๋“œ๋ฅผ ๋ช…์‹œ์ ์œผ๋กœ ์ง€์ •ํ•˜์—ฌ ์ธ์šฉ ๋ฌธ์žฅ ์ƒ์„ฑ์„ ์ œ์–ดํ•  ์ˆ˜ ์žˆ๋Š” ์–ธ์–ด ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์„ ์ œ์•ˆํ•œ๋‹ค. ์ง€๋„ ํ•™์Šต ๋ฏธ์„ธ์กฐ์ •๊ณผ ๊ฐ•ํ™”ํ•™์Šต(PPO)์„ ๊ฒฐํ•ฉํ•˜์—ฌ ์ƒ์„ฑ ํ’ˆ์งˆ๊ณผ ์ œ์–ด ๊ฐ€๋Šฅ์„ฑ์„ ๋™์‹œ์— ํ–ฅ์ƒ์‹œํ‚จ๋‹ค.

Motivation

Achievement

Figure 1

์ œ์•ˆ ๋ฐฉ๋ฒ•์˜ ์ „์ฒด ์›Œํฌํ”Œ๋กœ์šฐ: ์ง€๋„ ํ•™์Šต๊ณผ ๊ฐ•ํ™”ํ•™์Šต ๋‹จ๊ณ„

  1. ํ†ตํ•ฉ ์ œ์–ด ํ”„๋ ˆ์ž„์›Œํฌ ๊ฐœ๋ฐœ: ๋‹จ์ผ ์–ธ์–ด ๋ชจ๋ธ ๋‚ด์—์„œ ์ธ์šฉ ์†์„ฑ ์ถ”๋ก (uncontrolled mode)๊ณผ ์‚ฌ์šฉ์ž ์ง€์ • ์†์„ฑ ๊ธฐ๋ฐ˜ ์ƒ์„ฑ(controlled mode)์„ ๋ชจ๋‘ ์ˆ˜ํ–‰ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•จ. ์ด๋ฅผ ํ†ตํ•ด ์‚ฌ์šฉ์ž๊ฐ€ ํ•„์š”์— ๋”ฐ๋ผ ์ž๋™ ์ถ”๋ก  ๋ชจ๋“œ์™€ ๋ช…์‹œ์  ์ œ์–ด ๋ชจ๋“œ๋ฅผ ์œ ์—ฐํ•˜๊ฒŒ ์ „ํ™˜ ๊ฐ€๋Šฅ.
  2. ๋‹ค์ค‘ ๋ฉ”ํŠธ๋ฆญ ๊ธฐ๋ฐ˜ ์ œ์–ด ๊ฐ€๋Šฅ์„ฑ ํ‰๊ฐ€ ์ฒด๊ณ„: ์˜๋„ ์ •๋ ฌ์„ฑ, ํ‚ค์›Œ๋“œ ํฌํ•จ๋ฅ , ์œ ์ฐฝ์„ฑ, ๋‚ด์šฉ ๊ด€๋ จ์„ฑ์„ ์ข…ํ•ฉ์ ์œผ๋กœ ์ธก์ •ํ•˜๋Š” ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ ๊ตฌ์„ฑ. ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ PPO๋ฅผ ํ†ตํ•œ ๊ฐ•ํ™”ํ•™์Šต์œผ๋กœ ๋ชจ๋ธ์˜ ์ œ์–ด ๊ฐ€๋Šฅ์„ฑ์„ ๊ธฐ์กด ์ง€๋„ ํ•™์Šต๋งŒ์œผ๋กœ๋Š” ๋‹ฌ์„ฑํ•˜๊ธฐ ์–ด๋ ค์šด ์ˆ˜์ค€๊นŒ์ง€ ํ–ฅ์ƒ.
  3. ํฌ๊ด„์  ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์„ฑ: ๋ฌธ๋งฅ ์ •๋ณด์™€ ์ธ์šฉ ์†์„ฑ์„ ํŒŒ์‹ฑํ•œ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ•˜์—ฌ ํ–ฅํ›„ ์ œ์–ด ๊ฐ€๋Šฅ ์ธ์šฉ ์ƒ์„ฑ ์—ฐ๊ตฌ์˜ ํ† ๋Œ€ ์ œ๊ณต.

How

Figure 2

Galactica-6.7B ๋ชจ๋ธ์˜ ๋น„์ œ์–ด ๋ชจ๋“œ์—์„œ ์ƒ์„ฑํ•œ ์ธ์šฉ ๋ฌธ์žฅ ์˜ˆ์‹œ

์ง€๋„ ํ•™์Šต ๋ฏธ์„ธ์กฐ์ • (Supervised Fine-tuning)

์ œ์–ด ๊ฐ€๋Šฅ์„ฑ ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ

๊ฐ•ํ™”ํ•™์Šต์„ ํ†ตํ•œ ์ œ์–ด ๊ฐ€๋Šฅ์„ฑ ํ–ฅ์ƒ

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ์ธ์šฉ ๋ฌธ์žฅ ์ƒ์„ฑ์— ์‚ฌ์šฉ์ž ์ œ์–ด ๊ธฐ๋Šฅ์„ ๋„์ž…ํ•˜๋Š” ์‹ค์šฉ์ ์ด๊ณ  ์ฐฝ์˜์ ์ธ ์ ‘๊ทผ์„ ์ œ์‹œํ•˜๋ฉฐ, ๊ตฌ์กฐํ™”๋œ ํ”„๋กฌํ”„ํŠธ ํ…œํ”Œ๋ฆฟ๊ณผ ๋‹ค์ค‘ ๋ฉ”ํŠธ๋ฆญ ๊ธฐ๋ฐ˜ ๊ฐ•ํ™”ํ•™์Šต์„ ํ†ตํ•ด ๊ธฐ์กด ์ž๋™ํ™” ๋ฐฉ์‹์˜ ํ•œ๊ณ„๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ๋ณด์™„ํ•œ๋‹ค. ๋‹ค๋งŒ ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ์˜ ์ผ๋ถ€ ์‹ ๋ขฐ๋„์™€ ๋ฐ์ดํ„ฐ์…‹์˜ ๋„๋ฉ”์ธ ํ•œ๊ณ„ ์ธก๋ฉด์—์„œ๋Š” ์ถ”๊ฐ€ ๊ฒ€์ฆ์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Cited text spans for citation text generation ๋…ผ๋ฌธ์€ ์ธ์šฉ๋ฌธ์žฅ ์ƒ์„ฑ์˜ ํ…์ŠคํŠธ ๋ฒ”์œ„ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ๋ฉฐ 238๋ฒˆ์˜ ์ธ์šฉ๋ฌธ์žฅ ์ œ์–ด ์ ‘๊ทผ๋ฒ•์˜ ์‚ฌ์ „ ์—ฐ๊ตฌ๋กœ ์ฐธ๊ณ ํ•  ๋งŒํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
238๋ฒˆ ๋…ผ๋ฌธ์€ ๊ณผํ•™์  figure captioning์„ ์œ„ํ•œ ํ•™์Šต ๋ฐฉ๋ฒ•๋ก ์—์„œ ์˜์‚ฌ ๋ ˆ์ด๋ธ”(๋…ธ์ด์ฆˆ ์ œ์–ด) ๋“ฑ ๊ธฐ์ดˆ์ ์ธ ํ‰๊ฐ€ ๋ฐฉ์‹์„ ๊ณต์œ ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ฐ•ํ™”ํ•™์Šต์„ ํ™œ์šฉํ•œ ํ…์ŠคํŠธ ์ƒ์„ฑ ์ œ์–ด์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
When large language models meet citation: A survey ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์ธ์šฉ ๊ด€๋ จ ๋‹ค์–‘ํ•œ ๋ฐฉํ–ฅ์„ฑ์„ ๋‹ค๋ฃจ๊ณ  ์žˆ์–ด 238๋ฒˆ์˜ ๊ตฌ์ฒด์  ์ƒ์„ฑ ๋ฐฉ์‹๊ณผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Controllable Citation Sentence Generation ๋…ผ๋ฌธ์€ ์ธ์šฉ๋ฌธ์žฅ ์ƒ์„ฑ์„ ์ธ์šฉ ์˜๋„์™€ ํ‚ค์›Œ๋“œ ๋“ฑ ๋‹ค์–‘ํ•œ ์กฐ๊ฑด์— ๋”ฐ๋ผ ์ œ์–ดํ•˜๋Š” ์ ‘๊ทผ๋ฒ•์œผ๋กœ, 329์˜ ๋…ผ๋ฌธ ๊ฐ„ ๊ด€๊ณ„ ์„ค๋ช… ์ƒ์„ฑ๊ณผ ๋Œ€์กฐ์ ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ œ์–ด ๊ฐ€๋Šฅํ•œ ํ…์ŠคํŠธ ์ƒ์„ฑ์„ ์œ„ํ•œ ์–ธ์–ด ๋ชจ๋ธ ๋ฏธ์„ธ์กฐ์ •์—์„œ ์œ ์‚ฌํ•œ ์ ‘๊ทผ๋ฒ•์„ ์ทจํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
238์€ ์–ธ์–ด๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์ธ์šฉ ๋ฌธ์žฅ ์ƒ์„ฑ์˜ ์ œ์–ด ๊ฐ€๋Šฅ์„ฑ์„ ๋‹ค๋ฃจ์–ด, 1091์˜ ์‹œ์Šคํ…œ๊ณผ ๋น„๊ต ์—ฐ๊ตฌ๋กœ ์ฝ๊ธฐ์— ์ ํ•ฉํ•˜๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
238์€ LLM ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ๋‚ด ์ธ์šฉ๋ฌธ ์ƒ์„ฑ์˜ ์ œ์–ด๊ฐ€๋Šฅํ•œ ํ”„๋ ˆ์ด๋ฐ ์ „๋žต์„ ์ œ์•ˆํ•˜์—ฌ, 220์˜ ์‹ค์ œ ์ธ์šฉ๊ตฌ๊ฐ„ ๋ฐ์ดํ„ฐ์…‹ ์‘์šฉ์„ ๊ตฌ์ฒด์  ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ํ™•์žฅํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
329 ๋…ผ๋ฌธ์€ ๋‹ค์ˆ˜ ๋…ผ๋ฌธ ๊ฐ„์˜ ์ „ํ™˜ ๋ฌธ์žฅ ๋ฐ ๋งฅ๋ฝ ์„ค๋ช…์„ ์ƒ์„ฑํ•˜์—ฌ ๋‹จ์ˆœ ์ธ์šฉ ์ƒ์„ฑ์—์„œ ๋งฅ๋ฝ์  ์„ค๋ช…๊นŒ์ง€ ํ™•์žฅ๋œ ๋ฐฉ์‹์„ ์ œ์•ˆํ•˜๋ฏ€๋กœ ๋Œ€๋น„ํ•ด์„œ ์ฝ๊ธฐ ์ข‹์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
238๋ฒˆ์€ ์กฐ๊ฑด ์ œ์–ดํ˜• ์ธ์šฉ๋ฌธ ์ƒ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋‹ค๋ค„, 219๋ฒˆ์˜ ๋งˆ์Šคํ‚น ๊ธฐ๋ฐ˜ ์ธ์šฉ ์ถ”์ฒœ๊ณผ ์„ธ๋ฐ€ํ•œ ์„ค์ •์—์„œ์˜ ์‘์šฉ ๋ฐฉ๋ฒ•์— ์ฐธ๊ณ ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Controllable Citation Sentence Generation ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์ธ์šฉ๋ฌธ ์ƒ์„ฑ task๋ฅผ ๊ณ„์ธต์  ํŠธ๋ฆฌ ๋ถ„๋ฅ˜์™€ ์—ฐ๊ฒฐํ•˜์—ฌ ์‹ค์ œ์  ์—ฐ๊ฒฐ์„ฑ์„ ๋†’์ธ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๋กœ์ปฌ ์ธ์šฉ ์ƒ์„ฑ๊ณผ ์ถ”์ฒœ์„ ๊ฒฐํ•ฉํ•˜์—ฌ ๋…ผ๋ฌธ ์ƒ์„ฑ ํ™˜๊ฒฝ์—์„œ ๋ฐ”๋กœ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
238์˜ citation generation tool์€ 131์˜ ๋Œ€๊ทœ๋ชจ ๋ฐœ๊ฒฌ ํŒŒ์ดํ”„๋ผ์ธ์—์„œ ์ž๋™ ๋ฌธํ—Œ๊ท€์† ๋ฐ ์ธ์šฉ ์ƒ์„ฑ๊ณผ ์ง์ ‘์ ์œผ๋กœ ์—ฐ๊ณ„ ์ ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Mir: Methodology inspiration retrieval for scientific research ๋…ผ๋ฌธ์€ citation intent, ๋งฅ๋ฝ ๊ธฐ๋ฐ˜ ์ •๋ณด ์ถ”์ฒœ/์ƒ์„ฑ ๋ฐฉ์‹์„ ์‹ค์ œ ์—ฐ๊ตฌ ๋ฐฉ๋ฒ•๋ก  ์ถ”์ฒœ์— ์ ์šฉํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •