P2P: Automated Paper-to-Poster Generation and Fine-Grained Benchmark

์ €์ž: Tao Sun, Enhao Pan, Zhengkai Yang, Kaixin Sui, Jiajun Shi, Xianfu Cheng, Tongliang Li, Wenhao Huang, Ge Zhang, Jian Yang, Zhoujun Li | ๋‚ ์งœ: 2025 | DOI: arXiv:2505.17104v1 📄 PDF


Essence

Figure 1

Figure 1: P2P์˜ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ์•„ํ‚คํ…์ฒ˜: Figure Agent๋Š” ์‹œ๊ฐ ์š”์†Œ ์ฒ˜๋ฆฌ, Section Agent๋Š” ์ฝ˜ํ…์ธ  ์ƒ์„ฑ, Orchestrate Agent๋Š” ํฌ์Šคํ„ฐ ์กฐ๋ฆฝ ๋ฐ HTML ๋ Œ๋”๋ง์„ ๋‹ด๋‹น

ํ•™์ˆ  ๋…ผ๋ฌธ์„ ์ž๋™์œผ๋กœ ๊ณ ํ’ˆ์งˆ ํ•™์ˆ  ํฌ์Šคํ„ฐ(HTML ํ˜•์‹)๋กœ ๋ณ€ํ™˜ํ•˜๋Š” LLM ๊ธฐ๋ฐ˜ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜๋ฉฐ, 30,000๊ฐœ ์ด์ƒ์˜ ๋Œ€๊ทœ๋ชจ ์ง€์‹œ ๋ฐ์ดํ„ฐ์…‹๊ณผ ์„ธ๋ถ€ ํ‰๊ฐ€ ๋ฒค์น˜๋งˆํฌ๋ฅผ ํ•จ๊ป˜ ์ œ๊ณตํ•œ๋‹ค.

Motivation

Achievement

Figure 2

Figure 2: ๋…ผ๋ฌธ-ํฌ์Šคํ„ฐ ๋ณ€ํ™˜ ์˜ˆ์‹œ: ์ขŒ์ธก ๋…ผ๋ฌธ์˜ ์ฃผ์š” ์š”์†Œ(์ œ๋ชฉ, ๊ทธ๋ฆผ, ์„น์…˜)๊ฐ€ ์šฐ์ธก ์ƒ์„ฑ๋œ ํฌ์Šคํ„ฐ์— ๋งคํ•‘๋จ

  1. P2P ๋‹ค์ค‘ ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ: ์„ธ ๊ฐœ์˜ ํŠนํ™”๋œ ์—์ด์ „ํŠธ์™€ ๊ฐ๊ฐ์˜ ๊ฒ€์ฆ ๋ชจ๋“ˆ(checker module)์„ ํ†ตํ•ด ๋ฐ˜๋ณต์  ๊ฐœ์„ (iterative refinement)์„ ์ˆ˜ํ–‰ํ•˜๋ฉฐ, HTML/CSS ๊ธฐ๋ฐ˜ ๋ Œ๋”๋ง์œผ๋กœ ์ „๋ฌธ์ ์ธ ํฌ์Šคํ„ฐ ์ƒ์„ฑ ๋‹ฌ์„ฑ.
  2. P2P INSTRUCT ๋ฐ์ดํ„ฐ์…‹: 30,460๊ฐœ์˜ ๊ณ ํ’ˆ์งˆ ์ง€์‹œ-์‘๋‹ต ์Œ(instruction-response pairs)์œผ๋กœ ๊ตฌ์„ฑ๋œ ์ฒซ ๋Œ€๊ทœ๋ชจ ํ•™์ˆ  ํฌ์Šคํ„ฐ ์ƒ์„ฑ ํŠนํ™” ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•. Figure Describer๋ฅผ ํ†ตํ•ด 16,848๊ฐœ ๊ทธ๋ฆผ ์„ค๋ช…(ํ‰๊ท  192 ํ† ํฐ), Section/Content/HTML Generator๋ฅผ ํ†ตํ•ด 13,612๊ฐœ ํ…์ŠคํŠธ ์ฝ˜ํ…์ธ  ์˜ˆ์ œ(ํ‰๊ท  3,300 ํ† ํฐ ์ด์ƒ) ์ˆ˜์ง‘.
  3. P2P EVAL ๋ฒค์น˜๋งˆํฌ: 121๊ฐœ ๋…ผ๋ฌธ-ํฌ์Šคํ„ฐ ์Œ๊ณผ ์ด์ค‘ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก (Universal Evaluation + Fine-Grained Evaluation)์„ ํฌํ•จํ•œ ํฌ๊ด„์  ํ‰๊ฐ€ ์ฒด๊ณ„ ์ œ์‹œ. 33๊ฐœ ๋ชจ๋ธ ํ‰๊ฐ€๋ฅผ ํ†ตํ•œ ์„ฑ๋Šฅ ๊ฒ€์ฆ.

How

Figure 1

Figure Agent (์‹œ๊ฐ ์š”์†Œ ์ฒ˜๋ฆฌ)

Section Agent (ํ…์ŠคํŠธ ์ฝ˜ํ…์ธ  ์ƒ์„ฑ)

Orchestrate Agent (ํฌ์Šคํ„ฐ ์กฐ๋ฆฝ ๋ฐ ๋ Œ๋”๋ง)

P2P EVAL ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ

Originality

Limitation & Further Study

Evaluation

์ดํ‰: P2P๋Š” ํ•™์ˆ  ํฌ์Šคํ„ฐ ์ž๋™ ์ƒ์„ฑ์ด๋ผ๋Š” ๋ฏธ๊ฐœ์ฒ™ ๋ถ„์•ผ์— ๋‹ค์ค‘ ์—์ด์ „ํŠธ, ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹, ํ‘œ์ค€ํ™”๋œ ํ‰๊ฐ€ ๋ฒค์น˜๋งˆํฌ๋ฅผ ์ข…ํ•ฉ์ ์œผ๋กœ ์ œ์‹œํ•จ์œผ๋กœ์จ ๋†’์€ ์‹ค๋ฌด์  ๊ฐ€์น˜์™€ ํ•™์ˆ ์  ์˜์˜๋ฅผ ๊ฐ–์ถ”์—ˆ์œผ๋‚˜, ๊ธฐ์ˆ ์  ์‹ฌํ™”์™€ ์‚ฌ์šฉ์ž ๊ฒ€์ฆ์ด ์ถ”๊ฐ€๋˜๋ฉด ๋”์šฑ ์™„์„ฑ๋„ ์žˆ๋Š” ์—ฐ๊ตฌ๊ฐ€ ๋  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๋‹ค๋ฅธ ์ ‘๊ทผ
ํŠนํ—ˆ ๋„๋ฉ”์ธ ๊ทธ๋ฆผ ์บก์…˜ ์ž๋™ํ™” ์—ฐ๊ตฌ๋กœ, ๋…ผ๋ฌธ ์‹œ๊ฐ์ •๋ณด ์š”์•ฝ/๋ณ€ํ™˜์˜ ๋‹ค์–‘ํ•œ ํ•„๋“œ ๊ตฌํ˜„์„ ์ƒํ˜ธ ๋ณด์™„์ ์œผ๋กœ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Prototypical human-ai collaboration behaviors ๋…ผ๋ฌธ์€ ์‹ค์ œ LLM ๊ธฐ๋ฐ˜ ํ˜‘์—…์˜ ํ–‰๋™ ํŒจํ„ด์„ ๋ถ„์„ํ•ด, ๋…ผ๋ฌธ-ํฌ์Šคํ„ฐ ๋ณ€ํ™˜ ์‘์šฉ๊ณผ ๋Œ€์กฐ์ ์œผ๋กœ ์ธ๊ฐ„-LLM ์ƒํ˜ธ์ž‘์šฉ ๋งฅ๋ฝ์„ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Multi-llm collaborative caption generation ๋…ผ๋ฌธ๋„ ๊ณผํ•™ ๋ฌธ์„œ ๋‚ด ์‹œ๊ฐ ์ฝ˜ํ…์ธ ์— ๋Œ€ํ•ด LLM ๊ธฐ๋ฐ˜ ์บก์…˜ ์ƒ์„ฑ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ๋ฏ€๋กœ, ํฌ์Šคํ„ฐ ์ƒ์„ฑ ์ž๋™ํ™”์™€ ๋ฐ€์ ‘ํ•œ ์—ฐ๊ด€์ด ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋…ผ๋ฌธ์„ ํฌ์Šคํ„ฐ๋กœ ์ž๋™ ๋ณ€ํ™˜ํ•˜๋Š” ๋ฒค์น˜๋งˆํฌ๋ผ๋Š” ๋™์ผ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ์ง€๋งŒ, ๋ณ„๋„์˜ ๋ฐ์ดํ„ฐ์…‹๊ณผ ํ‰๊ฐ€๊ธฐ์ค€ ์ฒด๊ณ„๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ฝ˜ํ…์ธ  ์ดํ•ด ๋ฐ ์ฝ”๋“œ ์ƒ์„ฑ์˜ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Text editing by command ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ํ…์ŠคํŠธ ๋ณ€ํ™˜ ๋ฐ ํŽธ์ง‘ ๊ธฐ์ˆ ์„ ํ™•์žฅ ์ ์šฉํ•ด, Paper-to-Poster๊ณผ ๊ฐ™์€ ์ƒ์„ฑ ์‹œ์Šคํ…œ์˜ ๋ฐœ์ „์— ๊ธฐ์—ฌํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
SciReviewGen์€ ๋…ผ๋ฌธ์—์„œ ๋ฌธํ—Œ๋ฆฌ๋ทฐ ์ƒ์„ฑ์„ ์œ„ํ•ด LLM ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ๋ฅผ ๊ตฌ์ถ•ํ•˜๋Š” ๋“ฑ, P2P์™€ ํ•จ๊ป˜ ์ž๋™ํ™”๋œ ๊ณผํ•™ ์ปค๋ฎค๋‹ˆ์ผ€์ด์…˜ ๋ฐฉ์‹์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ณผํ•™์  ์‹œ๊ฐ ์ •๋ณด ํ•ด์„ ๋ฐ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์—์„œ ์ž๋™ํ™”๋œ ๋„์‹ยทํฌ์Šคํ„ฐ ์ƒ์„ฑ ๋“ฑ ํ™œ์šฉ ๋ฒ”์ฃผ๋ฅผ ํ™•์žฅํ•  ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Paper2poster ๋…ผ๋ฌธ์€ ๋…ผ๋ฌธ-ํฌ์Šคํ„ฐ ์ž๋™ํ™”์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํฌ๋งท ๋ณ€ํ™˜์„ ์‹คํ—˜์ ์œผ๋กœ ํ‰๊ฐ€ํ•˜์—ฌ, P2P ํ”„๋ ˆ์ž„์›Œํฌ์™€ ์œ ์‚ฌ ์‘์šฉ์„ ๋ณด๊ฐ•ํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •