XtraGPT: Llms for human-ai collaboration on controllable academic paper revision

์ €์ž: Nuo Chen, Andre Huikai Lin, Jiaying Wu, Junyi Hou, Zining Zhang, Qian Wang, Xidong Wang, Bingsheng He | ๋‚ ์งœ: 2025 | DOI: arXiv:2505.11336 📄 PDF


Essence

Figure 1

ํ•™์ˆ  ๋…ผ๋ฌธ ์ˆ˜์ • ์›Œํฌํ”Œ๋กœ์šฐ ๋น„๊ต (์ขŒ) ๋ฐ proprietary LLM์˜ ๋ถ€์กฑํ•œ ์ˆ˜์ • ์˜ˆ์‹œ (์šฐ)

๋ณธ ๋…ผ๋ฌธ์€ ๋งฅ๋ฝ ์ธ์‹(context-aware)๊ณผ ์ œ์–ด ๊ฐ€๋Šฅํ•œ(controllable) ํ•™์ˆ  ๋…ผ๋ฌธ ์ˆ˜์ •์„ ์œ„ํ•œ ์ธ๊ฐ„-AI ํ˜‘์—… ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜๋ฉฐ, ์ด๋ฅผ ๊ตฌํ˜„ํ•œ XtraGPT ๋ชจ๋ธ๊ตฐ(1.5B~14B)์„ ์†Œ๊ฐœํ•œ๋‹ค. 140,000๊ฐœ์˜ ์ง€๋„ ํ•™์Šต ์Œ์œผ๋กœ ๊ตฌ์„ฑ๋œ ReviseQA ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ•˜์—ฌ ์„น์…˜ ๋‹จ์œ„์˜ ์ •๊ตํ•œ ํ•™์ˆ  ๋…ผ๋ฌธ ์ˆ˜์ •์„ ์ง€์›ํ•œ๋‹ค.

Motivation

Achievement

Figure 2

์‚ฌํ›„ ํ›ˆ๋ จ ํŒŒ์ดํ”„๋ผ์ธ ๊ฐœ์š” - ์ œ์–ด ๊ฐ€๋Šฅํ•œ ์„น์…˜ ๋‹จ์œ„ ์ •๊ตํ•œ ๋…ผ๋ฌธ ์ˆ˜์ • ๊ฐ€๋Šฅ

  1. ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•: ReviseQA - ์ƒ์œ„ ํ•™ํšŒ 7,000๊ฐœ ๋…ผ๋ฌธ์—์„œ ์ถ”์ถœํ•œ 140,000๊ฐœ ๊ณ ํ’ˆ์งˆ ์ง€๋„-์ˆ˜์ • ์Œ
    • 20๊ฐœ ์„น์…˜ ๋‹จ์œ„ ์ž‘๋ฌธ ๊ธฐ์ค€์— ๋”ฐ๋ผ ์ฒด๊ณ„์ ์œผ๋กœ ์ฃผ์„ ์ฒ˜๋ฆฌ
    • ๊ฒฝํ—˜ ๋งŽ์€ AI ์—ฐ๊ตฌ์ž๋“ค์˜ ์ „๋ฌธ ์ˆ˜์ •์„ ํ†ตํ•ด ํ˜„์‹ค์„ฑ ํ™•๋ณด
  2. ๋ชจ๋ธ ์„ฑ๋Šฅ: XtraGPT ๋ชจ๋ธ๊ตฐ(1.5B~14B)
    • ๋™์ผ ๊ทœ๋ชจ ๋ฒ ์ด์Šค๋ผ์ธ ๋Œ€๋น„ ํ˜„์ €ํžˆ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ
    • 7B ๋ชจ๋ธ: GPT-4o-mini ์ˆ˜์ค€ ๋‹ฌ์„ฑ
    • 14B ๋ชจ๋ธ: GPT-4o-mini ์ดˆ๊ณผ ์„ฑ๋Šฅ
    • LLM-as-a-Judge ์ž๋™ ํ‰๊ฐ€์—์„œ ์›๋ณธ ์ดˆ์•ˆ ๋Œ€๋น„ ์ง€์†์ ์œผ๋กœ ์„ ํ˜ธ๋จ
  3. ์ธ๊ฐ„ ํ‰๊ฐ€ ๊ฒ€์ฆ:
    • ์‚ฌ์šฉ์ž๊ฐ€ ์ฑ„ํƒํ•˜๋ ค๋Š” ์˜๋„๋ฅผ ๊ฐ€์ง„ ์˜๋„-์ •๋ ฌ(intent-aligned) ๊ฐœ์„  ์ƒ์„ฑ
    • ๋…ผ๋ฌธ ํ’ˆ์งˆ ์ ์ˆ˜ ์ฆ๊ฐ€: 6.08 โ†’ 6.73 (p<0.001, ฮ”=0.65ยฑ0.15)
    • ์ œ์–ด์„ฑ ๊ตฌํ˜„: ์‚ฌ์šฉ์ž ์ง€์‹œ์— ๋”ฐ๋ฅธ ๋™์  ์ˆ˜์ • ๊ฐ€๋Šฅ

How

Figure 2

์ œ์•ˆ๋œ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์ฃผ์š” ์„ค๊ณ„ ์›์น™๊ณผ ๊ธฐ์ˆ ์  ๊ตฌํ˜„

๋ฌธ์ œ ์ •์˜ (Problem Formulation):

ํ•ต์‹ฌ ์„ค๊ณ„ ์›์น™:

  1. ๊ธฐ์ค€ ์ง€ํ–ฅ ์˜๋„ ์ •๋ ฌ (Criteria-Guided Intent Alignment)
    • ์ €์ž ์ง€์‹œ๋ฅผ "๋ช…ํ™•ํ™” ๊ฐ•ํ™”", "๊ธฐ์—ฌ๋„ ๊ฐ•ํ™”" ๊ฐ™์€ ํ•™์ˆ  ์ž‘๋ฌธ ๊ธฐ์ค€์œผ๋กœ ๊ตฌ์กฐํ™”
    • 20๊ฐœ ์„น์…˜๋ณ„ ๊ธฐ์ค€์œผ๋กœ ๊ณ ์ˆ˜์ค€ ์ง€์‹œ๋ฅผ ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ๊ตฌ์ฒด์  ์ˆ˜์ •์œผ๋กœ ์ „ํ™˜
    • ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์˜ ์ง€์‹œ-์ˆ˜์ • ์Œ์„ ๊ธฐ์ค€์— ๋ช…์‹œ์ ์œผ๋กœ ๋งํฌ
  2. ๋งฅ๋ฝ ์ธ์‹ ๋ชจ๋ธ๋ง (Context-Aware Modeling)
    • ์ „์ฒด ๋…ผ๋ฌธ ๋งฅ๋ฝ T๋ฅผ ํ›ˆ๋ จ ๋ฐ ์ถ”๋ก  ์‹œ ๋ช…์‹œ์  ์ž…๋ ฅ์œผ๋กœ ํฌํ•จ
    • ๋ฌธ๋‹จ์˜ ๊ธฐ๋Šฅ(motivation vs. analysis)์„ ๋ฌธ์„œ ๊ตฌ์กฐ ๋‚ด์—์„œ ํŒŒ์•…
    • ์ „์—ญ ์„œ์ˆ , ์šฉ์–ด, ๋…ผ๋ฆฌ ๊ตฌ์กฐ์— ์กฐ๊ฑดํ™”๋œ ํ‘œํ˜„ ํ•™์Šต ๊ฐ•์ œ
  3. ์ธ๊ฐ„-AI ํ˜‘์—… ์ฒ ํ•™ (Human-AI Collaboration)
    • LLM์„ ์™„์ „ ์ž๋™ํ™” ๋„๊ตฌ๊ฐ€ ์•„๋‹Œ ์ €์ž ๋Šฅ๋ ฅ ์ฆ๊ฐ• ์กฐ์ˆ˜๋กœ ์œ„์น˜
    • ์ธ๊ฐ„: ์ง€์  ํ•ต์‹ฌ(์•„์ด๋””์–ด, ์ฃผ์žฅ, ์ดˆ์•ˆ ์ž‘์„ฑ)
    • AI: ์ง€์‹œ ๊ธฐ๋ฐ˜ ์ •๊ตํ•œ ๋งฅ๋ฝ ์ธ์‹ ๊ฐœ์„  ์ œ๊ณต
    • ์ €์ž ์ œ์–ด๊ถŒ ๋ณด์กด์œผ๋กœ ๋…์ฐฝ์„ฑ ํ›ผ์† ๋ฐฉ์ง€

ํ›ˆ๋ จ ์ „๋žต:

ํ‰๊ฐ€ ๋ฐฉ๋ฒ•:

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ํ•™์ˆ  ๋…ผ๋ฌธ ์ˆ˜์ •์„ ์ธ๊ฐ„-AI ํ˜‘์—…์˜ ๊ด€์ ์—์„œ ์ฒด๊ณ„์ ์œผ๋กœ ์ ‘๊ทผํ•œ ์‹ค์šฉ์„ฑ ๋†’์€ ์—ฐ๊ตฌ์ด๋ฉฐ, ๊ธฐ์ค€ ๊ธฐ๋ฐ˜ ์ง€์‹œ ์ •๋ ฌ๊ณผ ๋งฅ๋ฝ ์ธ์‹ ๋ชจ๋ธ๋ง์ด๋ผ๋Š” ๋ช…ํ™•ํ•œ ์„ค๊ณ„ ์›์น™ ์•„๋ž˜ 140,000๊ฐœ ์Œ์˜ ์ „๋ฌธ๊ฐ€ ์ฃผ์„ ๋ฐ์ดํ„ฐ์…‹๊ณผ XtraGPT ๋ชจ๋ธ๊ตฐ์„ ์ œ์‹œํ–ˆ๋‹ค. ์ž๋™/์ธ๊ฐ„ ํ‰๊ฐ€์—์„œ GPT-4o-mini ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๊ณ  ์‹ค์ œ ๋…ผ๋ฌธ ํ’ˆ์งˆ ๊ฐœ์„ ์„ ์ž…์ฆํ–ˆ์œผ๋‚˜, ๋ชจ๋ธ ๊ทœ๋ชจ์™€ ์–ธ์–ด ๋‹ค์–‘์„ฑ ๋ฉด์—์„œ์˜ ํ•œ๊ณ„๊ฐ€ ํ–ฅํ›„ ๊ณผ์ œ๋กœ ๋‚จ์•„์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Text editing by command ๋…ผ๋ฌธ์€ LLM์„ ํ™œ์šฉํ•œ ํ…์ŠคํŠธ ํŽธ์ง‘ ์ž๋™ํ™” ๋ฐ ์ œ์–ด ๋ฐฉ๋ฒ•์˜ ๊ธฐ๋ฐ˜์ด ๋˜๋ฏ€๋กœ, XtraGPT ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๊ธฐ์ˆ ์  ๋ฐฐ๊ฒฝ์„ ์ดํ•ดํ•˜๋Š”๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Figgen: Text to scientific figure generation์€ ๊ณผํ•™ ๋…ผ๋ฌธ์—์„œ ๋„ํ•ด ๋ฐ ํ”ผ๋“œ๋ฐฑ ์—ฐ๋™์„ ๋‹ค๋ฃจ์–ด, XtraGPT(889)์˜ context-awareยทvisual feedback ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ์ˆ˜์ • ์‹œ์Šคํ…œ์˜ ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
484๋Š” LLM ๊ธฐ๋ฐ˜ ํ•™์ˆ  ํ…์ŠคํŠธ ์ƒ์„ฑ ์‹œ ๋™์  ์ œ์–ด์™€ ํ”ผ๋“œ๋ฐฑ ํ•™์Šต ๋ฐฉ์‹์„ ๋‹ค๋ฃจ์–ด, XtraGPT ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์ด๋ก ์  ๊ทผ๊ฑฐ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Position: The AI Conference Peer Review Crisis ๋…ผ๋ฌธ์€ AI ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ์˜ ์‹ ๋ขฐ์„ฑ๊ณผ ํ‰๊ฐ€ ๋ฌธ์ œ๋ฅผ ์ง‘์ค‘์ ์œผ๋กœ ๋‹ค๋ฃจ๋ฏ€๋กœ, XtraGPT์˜ AI-์ธ๊ฐ„ ํ˜‘๋ ฅ ๋ฆฌ๋ทฐ ์ˆ˜์ • ํ”„๋ ˆ์ž„์›Œํฌ ๋™๊ธฐ ์„ค๋ช…์— ๋„์›€๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‘ ๋ช…(AI+์ธ๊ฐ„) ํ˜‘์—… ์‹œ์Šคํ…œ์˜ ์žฅ์ ์„ ๋ถ„์„ํ•œ ๋…ผ๋ฌธ์œผ๋กœ, ๋…ผ๋ฌธ ์ž‘์„ฑ ๋ฐ AI ๊ธฐ๋ฐ˜ ๊ณต๋™์ˆ˜์ • ์‹œ์Šคํ…œ์˜ ์‹ค์ œ ํšจ๊ณผ๋ฅผ ๋‹ค๊ฐ์ ์œผ๋กœ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
DeepReview(262)๋Š” LLM์ด ์ธ๊ฐ„๊ณผ ์œ ์‚ฌํ•œ ๋ฆฌ๋ทฐ ํ”ผ๋“œ๋ฐฑ์„ ์ œ๊ณตํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ํƒ๊ตฌํ•˜์—ฌ, XtraGPT ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ์ˆ˜์ •๊ณผ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewAgents ๋…ผ๋ฌธ์€ ์ธ๊ฐ„ยทAI ๋ฆฌ๋ทฐ์–ด ํ˜‘๋ ฅ ๊ตฌ์กฐ๋ฅผ ์‹คํ—˜ ๋ฐ์ดํ„ฐ๋กœ ๋ถ„์„ํ•˜์—ฌ, ๋…ผ๋ฌธ ๋„๊ตฌ ๊ฐœ๋ฐœ ๋ฐ ์‹ค๋ฌด ์‘์šฉ ๋ฉด์—์„œ ์ƒํ˜ธ๋ณด์™„๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์‚ฌํšŒ์‹ฌ๋ฆฌํ•™ ์ด๋ก ์„ LLM ์ถ”๋ก ์— ์ ์šฉํ•˜์—ฌ ํ•™์ˆ  ํ‰๊ฐ€ ์‹œ์Šคํ…œ์„ ๊ฐœ์„ ํ•˜๋Š” ์œ ์‚ฌํ•œ ์ ‘๊ทผ๋ฒ•์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์ด ํ•™์ˆ  ๋…ผ๋ฌธ ์ž‘์„ฑ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ๋‹ค์–‘ํ•œ ์ธ๊ตฌํ†ต๊ณ„ํ•™์  ๋ณ€์ˆ˜์™€ ํ•จ๊ป˜ ๋ถ„์„ํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
889์˜ XtraGPT ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ๋…ผ๋ฌธ ๋‚ด ๋งฅ๋ฝ ์ œ์–ด ์ˆ˜์ • ๋ชจ๋ธ๋กœ, ์ธ์šฉ ๋ฐ์ดํ„ฐ์™€ LLM ํ™œ์šฉ์˜ ์‹ค์ œ์  ์‘์šฉ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
484๋Š” ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ƒ์„ฑ์‹œ LLM ๊ธฐ๋ฐ˜ ๋™์  ์ œ์–ด ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์—ฐ๊ตฌํ•˜์—ฌ, 889์˜ ๋…ผ๋ฌธ ์ •๊ตํ™”ยท์ˆ˜์ •๊ณผ์ • ์ž๋™ํ™”์— ์•„์ด๋””์–ด๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
PaperBanana๋Š” AI๋กœ ํ•™์ˆ  ์‚ฝํ™” ์ž‘์—…์„ ์ž๋™ํ™”ํ•˜์—ฌ, XtraGPT(889)์˜ ์ธ๊ฐ„-AI ๋…ผ๋ฌธ ์ˆ˜์ •(ํŠนํžˆ ์‹œ๊ฐ์  ์ˆ˜์ •)์— ๋Œ€ํ•œ ์‹ค์ œ์  ํ™•์žฅ ์˜ˆ์‹œ๋กœ ์ฐธ๊ณ ํ•  ์ˆ˜ ์žˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
XtraGPT(889)๋Š” LLM ํ•™์ˆ  ๋…ผ๋ฌธ ์ˆ˜์ •์„ ์œ„ํ•œ ๋™์  ์ œ์–ดยท์ •๊ต ํ”ผ๋“œ๋ฐฑ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์‹ค์ œ ๊ตฌํ˜„ํ•œ ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •