์ ์: Tao Sun, Enhao Pan, Zhengkai Yang, Kaixin Sui, Jiajun Shi, Xianfu Cheng, Tongliang Li, Wenhao Huang, Ge Zhang, Jian Yang, Zhoujun Li | ๋ ์ง: 2025 | DOI: arXiv:2505.17104v1 📄 PDF
Essence
Figure 1: P2P์ ๋ค์ค ์์ด์ ํธ ์ํคํ
์ฒ: Figure Agent๋ ์๊ฐ ์์ ์ฒ๋ฆฌ, Section Agent๋ ์ฝํ
์ธ ์์ฑ, Orchestrate Agent๋ ํฌ์คํฐ ์กฐ๋ฆฝ ๋ฐ HTML ๋ ๋๋ง์ ๋ด๋น
ํ์ ๋
ผ๋ฌธ์ ์๋์ผ๋ก ๊ณ ํ์ง ํ์ ํฌ์คํฐ(HTML ํ์)๋ก ๋ณํํ๋ LLM ๊ธฐ๋ฐ ๋ค์ค ์์ด์ ํธ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, 30,000๊ฐ ์ด์์ ๋๊ท๋ชจ ์ง์ ๋ฐ์ดํฐ์
๊ณผ ์ธ๋ถ ํ๊ฐ ๋ฒค์น๋งํฌ๋ฅผ ํจ๊ป ์ ๊ณตํ๋ค.
Evaluation
์ดํ: P2P๋ ํ์ ํฌ์คํฐ ์๋ ์์ฑ์ด๋ผ๋ ๋ฏธ๊ฐ์ฒ ๋ถ์ผ์ ๋ค์ค ์์ด์ ํธ, ๋๊ท๋ชจ ๋ฐ์ดํฐ์
, ํ์คํ๋ ํ๊ฐ ๋ฒค์น๋งํฌ๋ฅผ ์ข
ํฉ์ ์ผ๋ก ์ ์ํจ์ผ๋ก์จ ๋์ ์ค๋ฌด์ ๊ฐ์น์ ํ์ ์ ์์๋ฅผ ๊ฐ์ถ์์ผ๋, ๊ธฐ์ ์ ์ฌํ์ ์ฌ์ฉ์ ๊ฒ์ฆ์ด ์ถ๊ฐ๋๋ฉด ๋์ฑ ์์ฑ๋ ์๋ ์ฐ๊ตฌ๊ฐ ๋ ๊ฒ์ผ๋ก ๊ธฐ๋๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๋ค๋ฅธ ์ ๊ทผ
ํนํ ๋๋ฉ์ธ ๊ทธ๋ฆผ ์บก์
์๋ํ ์ฐ๊ตฌ๋ก, ๋
ผ๋ฌธ ์๊ฐ์ ๋ณด ์์ฝ/๋ณํ์ ๋ค์ํ ํ๋ ๊ตฌํ์ ์ํธ ๋ณด์์ ์ผ๋ก ํ์
ํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
Prototypical human-ai collaboration behaviors ๋
ผ๋ฌธ์ ์ค์ LLM ๊ธฐ๋ฐ ํ์
์ ํ๋ ํจํด์ ๋ถ์ํด, ๋
ผ๋ฌธ-ํฌ์คํฐ ๋ณํ ์์ฉ๊ณผ ๋์กฐ์ ์ผ๋ก ์ธ๊ฐ-LLM ์ํธ์์ฉ ๋งฅ๋ฝ์ ๋ณด์ฌ์ค๋ค.
๋ค๋ฅธ ์ ๊ทผ
Multi-llm collaborative caption generation ๋
ผ๋ฌธ๋ ๊ณผํ ๋ฌธ์ ๋ด ์๊ฐ ์ฝํ
์ธ ์ ๋ํด LLM ๊ธฐ๋ฐ ์บก์
์์ฑ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๋ฏ๋ก, ํฌ์คํฐ ์์ฑ ์๋ํ์ ๋ฐ์ ํ ์ฐ๊ด์ด ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ ๋
ผ๋ฌธ์ ํฌ์คํฐ๋ก ์๋ ๋ณํํ๋ ๋ฒค์น๋งํฌ๋ผ๋ ๋์ผ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ์ง๋ง, ๋ณ๋์ ๋ฐ์ดํฐ์
๊ณผ ํ๊ฐ๊ธฐ์ค ์ฒด๊ณ๋ฅผ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฉํฐ๋ชจ๋ฌ ์ฝํ
์ธ ์ดํด ๋ฐ ์ฝ๋ ์์ฑ์ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
Text editing by command ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ํ
์คํธ ๋ณํ ๋ฐ ํธ์ง ๊ธฐ์ ์ ํ์ฅ ์ ์ฉํด, Paper-to-Poster๊ณผ ๊ฐ์ ์์ฑ ์์คํ
์ ๋ฐ์ ์ ๊ธฐ์ฌํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
SciReviewGen์ ๋
ผ๋ฌธ์์ ๋ฌธํ๋ฆฌ๋ทฐ ์์ฑ์ ์ํด LLM ๊ธฐ๋ฐ ๋ฐ์ดํฐ๋ฅผ ๊ตฌ์ถํ๋ ๋ฑ, P2P์ ํจ๊ป ์๋ํ๋ ๊ณผํ ์ปค๋ฎค๋์ผ์ด์
๋ฐฉ์์ ์ ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ์ ์๊ฐ ์ ๋ณด ํด์ ๋ฐ ๋ฉํฐ๋ชจ๋ฌ ์์ด์ ํธ ์์คํ
์์ ์๋ํ๋ ๋์ยทํฌ์คํฐ ์์ฑ ๋ฑ ํ์ฉ ๋ฒ์ฃผ๋ฅผ ํ์ฅํ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
Paper2poster ๋
ผ๋ฌธ์ ๋
ผ๋ฌธ-ํฌ์คํฐ ์๋ํ์ ๋ฉํฐ๋ชจ๋ฌ ํฌ๋งท ๋ณํ์ ์คํ์ ์ผ๋ก ํ๊ฐํ์ฌ, P2P ํ๋ ์์ํฌ์ ์ ์ฌ ์์ฉ์ ๋ณด๊ฐํ๋ค.