Beyond outlining: Heterogeneous recursive planning for adaptive long-form writing with language models

์ €์ž: Ruibin Xiong, Yimeng Chen ์™ธ | ๋‚ ์งœ: 2025 | DOI: 10.48550/arXiv.2503.08275 📄 PDF


Essence

Figure 1

WriteHERE ํ”„๋ ˆ์ž„์›Œํฌ: ์žฌ๊ท€์  ๊ณผ์ œ ๋ถ„ํ•ด์™€ ์ƒํƒœ ๊ธฐ๋ฐ˜ ๊ณ„์ธต์  ์Šค์ผ€์ค„๋ง์„ ํ†ตํ•œ ์ ์‘ํ˜• ์žฅ๋ฌธ ์ž‘์„ฑ

๊ธฐ์กด์˜ ์‚ฌ์ „ ๊ณ„ํš(pre-writing planning) ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์˜ ๊ฒฝ์ง์„ฑ์„ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด, ๋ณธ ๋…ผ๋ฌธ์€ ๊ฒ€์ƒ‰(Retrieval), ์ถ”๋ก (Reasoning), ์ž‘์„ฑ(Composition) ์„ธ ๊ฐ€์ง€ ์ธ์ง€ ๊ณผ์ œ๋ฅผ ๋™์ ์œผ๋กœ ํ†ตํ•ฉํ•˜๋Š” ์ด์งˆ์  ์žฌ๊ท€์  ๊ณ„ํš(Heterogeneous Recursive Planning) ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•œ๋‹ค.

Motivation

Achievement

Figure 2

์„ธ ๊ฐ€์ง€ ๊ณผ์ œ ์œ ํ˜•์˜ ์ •๋ณด ํ๋ฆ„: ๊ฒ€์ƒ‰(๋ฉ”๋ชจ๋ฆฌ๋งŒ ์ˆ˜์ •), ์ถ”๋ก (๋ฉ”๋ชจ๋ฆฌ ๊ฐ„ ๋ณ€ํ™˜), ์ž‘์„ฑ(์ž‘์—…๊ณต๊ฐ„ ์ˆ˜์ •)

  1. ํ†ตํ•ฉ ํ”„๋ ˆ์ž„์›Œํฌ: ๊ฐœ์š” ์ž‘์„ฑ๊ณผ ์ฝ˜ํ…์ธ  ์ƒ์„ฑ์„ ๋ถ„๋ฆฌ๋œ ๋‹จ๊ณ„๊ฐ€ ์•„๋‹Œ ๋‹จ์ผ ๋ชฉํ‘œ ์ง€ํ–ฅ์  ๊ณ„ํš ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ํ†ตํ•ฉํ•˜์—ฌ, ๋‹ค์–‘ํ•œ ์žฅ๋ฌธ ์ž‘์„ฑ ์ž‘์—…(์†Œ์„ค, ๊ธฐ์ˆ  ๋ณด๊ณ ์„œ)์— ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅํ•œ ์ ‘๊ทผ๋ฒ• ๋‹ฌ์„ฑ
  2. ์‹ค์ฆ์  ์„ฑ๋Šฅ ํ–ฅ์ƒ: ํ”ฝ์…˜ ์ž‘์„ฑ(TELL ME A STORY) ๋ฐ ๊ธฐ์ˆ  ๋ฌธ์„œ ์ƒ์„ฑ(Wildseed) ๋ฒค์น˜๋งˆํฌ์—์„œ ๊ธฐ์กด ์ตœ์‹  ๊ธฐ๋ฒ•๋“ค์„ ๋ชจ๋“  ์ž๋™ ํ‰๊ฐ€ ์ง€ํ‘œ์—์„œ ๋Šฅ๊ฐ€
  3. ์ ์‘์„ฑ ์ฆ๋Œ€: ์ž‘์„ฑ ๊ณผ์ œ์˜ ๋ณต์žก๋„์— ๋”ฐ๋ผ ๊ณ„ํš ๊นŠ์ด๋ฅผ ๋™์ ์œผ๋กœ ์กฐ์ •ํ•˜๊ณ , ๊ณผ์ œ ์‹คํ–‰ ์ค‘ ํ•„์š”ํ•œ ์ˆœ๊ฐ„์— ์ƒˆ๋กœ์šด ๊ฒ€์ƒ‰, ์ถ”๋ก ์„ ์ฆ‰์‹œ ์ˆ˜ํ–‰ ๊ฐ€๋Šฅ

How

Originality

Limitation & Further Study

Evaluation

์ดํ‰: WriteHERE๋Š” ๊ธฐ์กด์˜ ๊ฒฝ์ง๋œ ์‚ฌ์ „ ๊ณ„ํš ๋ฐฉ์‹์—์„œ ๋ฒ—์–ด๋‚˜ ๊ฒ€์ƒ‰, ์ถ”๋ก , ์ž‘์„ฑ์„ ๋™์ ์œผ๋กœ ํ†ตํ•ฉํ•˜๋Š” ์ด์งˆ์  ์žฌ๊ท€์  ๊ณ„ํš ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•จ์œผ๋กœ์จ, ์žฅ๋ฌธ ์ž‘์„ฑ์˜ ์ ์‘์„ฑ ๋ฌธ์ œ์— ๋Œ€ํ•œ ์ง„์ •ํ•œ ํ•ด๊ฒฐ์ฑ…์„ ์ œ๊ณตํ•œ๋‹ค. ํ˜•์‹์  ๊ณต์‹ํ™”์™€ ์‹ค์ฆ์  ์„ฑ๋Šฅ ํ–ฅ์ƒ์ด ๊ฐ•์ ์ด๋‚˜, ๊ณ„์‚ฐ ๋น„์šฉ ๋ถ„์„๊ณผ ๋” ๊ด‘๋ฒ”์œ„ํ•œ ๋„๋ฉ”์ธ ๊ฒ€์ฆ์ด ํ–ฅํ›„ ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๋‹ค๋ฅธ ์ ‘๊ทผ
515๋Š” ์ด๋ฏธ์ง€ ์บก์…˜ ์ƒ์„ฑ์—์„œ ์ธ๊ฐ„-์—์ด์ „ํŠธ ํ˜‘์—… ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์„ ์ ์šฉํ•˜์—ฌ, 157์˜ ์žฌ๊ท€์  ๊ณ„ํš ํ”„๋ ˆ์ž„์›Œํฌ์™€ ์ƒ์„ฑ์  ์ฝ˜ํ…์ธ  ์ž‘์„ฑ ์ธก๋ฉด์—์„œ ๋Œ€์ฒด ๋ฐฉ์•ˆ์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
FigCaps-HF ๋…ผ๋ฌธ์€ ๋„ํ‘œ ์บก์…˜ ์ƒ์„ฑ์˜ ๋Œ€์ฒด์  ์ฒด๊ณ„๋กœ, ๋™์ ยท๊ณ„ํš์  ์ ‘๊ทผ๋ฒ•๊ณผ ํ…œํ”Œ๋ฆฟ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
157 ๋…ผ๋ฌธ์€ AI์™€ ์ธ๊ฐ„ํ˜‘๋ ฅ ํ•˜์—์„œ ๊ณ„ํš์  ๋…ผ๋ฌธ ์ž‘์„ฑ ๋ฐฉ์‹์„ ๋‹ค๋ค„, 077์˜ ์‚ฌํšŒ๊ณผํ•™๊ณผ AI ํ™œ์šฉ ๋ฐฉ๋ฒ• ๋ถ„๋ฅ˜์™€ ์ƒํ˜ธ๋ณด์™„์ ์œผ๋กœ ์ฝ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
780์—์„œ๋Š” LLM ๊ธฐ๋ฐ˜ ํ•™์ˆ  ์„œ๋ฒ ์ด์˜ ์•„์›ƒ๋ผ์ธ ์ƒ์„ฑ ๋ฐ ์žฅ๊ธฐ ๋งฅ๋ฝ ๊ณ„ํš ์ „๋žต์„ ๊ฒ€ํ† ํ•˜์—ฌ, 157์˜ ์ด์งˆ์  ์žฌ๊ท€ ๊ณ„ํš ํ”„๋ ˆ์ž„์›Œํฌ์™€ ๋น„๊ต์  ์ ‘๊ทผ๋ฐฉ์‹์„ ๋ณด์ธ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณ„ํš ์‹œ์Šคํ…œ์˜ ์ด์งˆ์ ยท์žฌ๊ท€์  ํ”Œ๋ž˜๋‹ ์ „๋žต์„ ๊ตฌ์ฒด์ ์œผ๋กœ ๋ถ„์„ํ•˜์—ฌ, PlanGenLLMs์˜ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ ๋‹ค์–‘์„ฑ๊ณผ ์—ฐ๊ฒฐ๋จ.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฌธ์„œ ์ž‘์„ฑ์—์„œ ์žฌ๊ท€์  ๊ณ„ํš๊ณผ ๋™์  ๊ตฌ์กฐ ํ†ตํ•ฉ์„ ์œ„ํ•œ ์œ ์‚ฌํ•œ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
564๋Š” ๋‹ค์ค‘ LLM ํ˜‘์—… ๊ธฐ๋ฐ˜ ์บก์…˜ ์ƒ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋„์ž…ํ•จ์œผ๋กœ์จ, 157์˜ ์ด์งˆ์  ๊ณ„ํš ๋ชจ๋ธ์„ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ํ™˜๊ฒฝ ํ•˜์—์„œ ์‹คํ˜„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ™•์žฅํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
215๋Š” ๋…ผ๋ฌธ์„ ๊ณ„์ธต์ ์œผ๋กœ ์กฐ์งํ™”ํ•œ ์‚ฌ๋ก€๋กœ, 157์˜ ๋™์  ๊ณ„ํš ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ์‹ค์งˆ์  ๋ฌธํ—Œ ๊ตฌ์กฐํ™”์—์„œ ์–ด๋–ป๊ฒŒ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋Š”์ง€ ๋ณด์—ฌ์ค€๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •