Sci2Pol: Evaluating and Fine-tuning LLMs on Scientific-to-Policy Brief Generation

์ €์ž: Weimin Wu, Alexander C. Furnas, Eddie Yang, Gefei Liu, Akhil Pandey Akella, Xuefeng Song, Dashun Wang, Han Liu | ๋‚ ์งœ: 2025-09-25 | DOI: 10.48550/arXiv.2509.21493 📄 PDF


Essence

Figure 1

Figure 1: Overview of Sci2Pol-Taxonomy and Dataset Source. (a) Sci2Pol-Taxonomy defines a

๊ณผํ•™ ๋…ผ๋ฌธ์„ ์ •์ฑ… ๋ฌธ์„œ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” LLM์˜ ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๊ณ  ๊ฐœ์„ ํ•˜๊ธฐ ์œ„ํ•ด ๋ฒค์น˜๋งˆํฌ(Sci2Pol-Bench)์™€ ํ•™์Šต ๋ฐ์ดํ„ฐ์…‹(Sci2Pol-Corpus)์„ ์ œ์‹œํ•œ๋‹ค.

Motivation

Achievement

Figure 2

Figure 2: Overview of the Sci2Pol-Corpus Curation Process. It consists of 639 high-quality pa-

How

Figure 2

Figure 2: Overview of the Sci2Pol-Corpus Curation Process. It consists of 639 high-quality pa-

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ๊ณผํ•™๊ณผ ์ •์ฑ… ๊ฐ„์˜ ์ค‘์š”ํ•œ ๊ฒฉ์ฐจ๋ฅผ ํ•ด์†Œํ•˜๊ธฐ ์œ„ํ•œ ์ตœ์ดˆ์˜ ์ „๋ฌธํ™”๋œ ๋ฒค์น˜๋งˆํฌ์™€ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ์‹œํ•˜๋ฉฐ, ์ฒด๊ณ„์  ๋ถ„๋ฅ˜์ฒด๊ณ„์™€ ์ƒˆ๋กœ์šด ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ์„ ํ†ตํ•ด LLM์˜ ํ•œ๊ณ„๋ฅผ ๋ช…ํ™•ํžˆ ๊ทœ๋ช…ํ•˜๊ณ  ๋ฏธ์„ธ์กฐ์ •์œผ๋กœ ์„ฑ๋Šฅ ๊ฐœ์„ ์„ ์ž…์ฆํ•œ ์˜๋ฏธ ์žˆ๋Š” ์—ฐ๊ตฌ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ฐ•ํ™”ํ•™์Šต์„ ํ™œ์šฉํ•œ ํ…์ŠคํŠธ ์ƒ์„ฑ ์ œ์–ด์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณผํ•™ ํ…์ŠคํŠธ๋ฅผ ์ •์ฑ… ๋ฌธ์„œ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” LLM ํ‰๊ฐ€์˜ ์ด๋ก ์ ยท๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ •์ฑ… ๋ฌธ์„œ ์ƒ์„ฑ ๋ฐ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ํ…์ŠคํŠธ ๊ธฐ๋ฐ˜ ๊ทธ๋ž˜๋””์–ธํŠธ๋ฅผ ํ™œ์šฉํ•œ ํ”„๋กฌํ”„ํŠธ ์ตœ์ ํ™”์˜ ์ด๋ก ์ ยท๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณผํ•™ ์ง€์‹์˜ ์ •์ฑ… ๋ฒˆ์—ญ๊ณผ ์ปค๋ฎค๋‹ˆ์ผ€์ด์…˜์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์›น ๊ฒ€์ƒ‰ ๊ธฐ๋ฐ˜ RAG๋ฅผ ํ™œ์šฉํ•œ ๋‹ค๋ฅธ ์œ ํ˜•์˜ ํ…์ŠคํŠธ ์ž๋™ ์ƒ์„ฑ์„ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ ๊ณผํ•™-์ •์ฑ… ๋ณ€ํ™˜ ๋Šฅ๋ ฅ์„ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ํ‰๊ฐ€ํ•˜๋Š” ๋Œ€์•ˆ์  ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ์˜ ๋‹ค๋ฅธ ์•„ํ‚คํ…์ฒ˜๋‚˜ ํ›ˆ๋ จ ์ „๋žต์„ ์ œ์•ˆํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์–ธ์–ด ๋ชจ๋ธ์˜ ๊ณผํ•™์  ํ™œ์šฉ์„ ์œ„ํ•œ ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ ๊ณผํ•™ ํ…์ŠคํŠธ ์ฒ˜๋ฆฌ์™€ ์š”์•ฝ์˜ ๋Œ€์•ˆ์  ์ ‘๊ทผ์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ ์‚ฌํšŒ์  ํŽธํ–ฅ ๊ฐ์ง€ ๋ฐ ์™„ํ™”๋ฅผ ์œ„ํ•œ ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ ์ „๋ฌธ์  ํ‰๊ฐ€ ๋ฐ ํŒ๋‹จ ๋Šฅ๋ ฅ์„ ๋ฐ์ดํ„ฐ์…‹ ๊ธฐ๋ฐ˜์œผ๋กœ ์ฒด๊ณ„์ ์œผ๋กœ ๊ฒ€์ฆํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ ๊ณผํ•™ ํ…์ŠคํŠธ ์ƒ์„ฑ ๋ฐ ๋ณ€ํ™˜ ๋Šฅ๋ ฅ์„ ๋‹ค๋ฅธ ๋งฅ๋ฝ์—์„œ ํ‰๊ฐ€ํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™-์ •์ฑ… ์—ฐ๊ณ„๋ฅผ ์œ„ํ•œ ํ…์ŠคํŠธ ๋ณ€ํ™˜์„ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ์ ‘๊ทผํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM์ด ๊ณผํ•™ ์ƒ์‚ฐ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ๋ถ„์„ํ•˜์—ฌ Sci2Pol ์—ฐ๊ตฌ์˜ ๋งฅ๋ฝ์„ ํ™•์žฅํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Sci2Pol ๋…ผ๋ฌธ์€ ์‹ค์ œ ์ •์ฑ…์—ฐ๊ณ„ ๊ณผํ•™์—ฐ๊ตฌ ์กฐ์ง์—์„œ LLM ๊ธฐ๋ฐ˜ ์ธ๊ฐ„-AI ํ˜‘์—…์˜ ์‹ค์งˆ ์ ์šฉ ๋ฐ ํšจ๊ณผ๋ฅผ ๊ฒ€์ฆํ•˜์—ฌ 358 ๊ฒฐ๊ณผ์˜ ์ ์šฉ ์‚ฌ๋ก€๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •