Chain of Ideas: Revolutionizing research via novel idea development with llm agents

์ €์ž: Long Li, Weiwen Xu, Jiayan Guo, Ruochen Zhao, Xingxuan Li ์™ธ (DAMO Academy, Alibaba Group; Zhejiang University) | ๋‚ ์งœ: 2024 | DOI: arXiv:2410.13185 📄 PDF


Essence

Figure 1

๊ทธ๋ฆผ 1: Vanilla RAG ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์—์ด์ „ํŠธ์™€ Chain-of-Ideas ์—์ด์ „ํŠธ์˜ ๋น„๊ต. CoI๋Š” ๊ด€๋ จ ๋…ผ๋ฌธ๋“ค์„ ์ฒด๊ณ„์  ์ฒด์ธ์œผ๋กœ ์กฐ์งํ•˜์—ฌ ๋…ผ๋ฆฌ์  ์ผ๊ด€์„ฑ ์žˆ๋Š” ์•„์ด๋””์–ด ์ƒ์„ฑ

LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ๊ฐ€ ๊ณผํ•™ ๋ฌธํ—Œ์„ ์ฒด์ธ ๊ตฌ์กฐ๋กœ ์กฐ์งํ•˜์—ฌ ์—ฐ๊ตฌ ๋ถ„์•ผ์˜ ์ง„ํ™” ๊ณผ์ •์„ ๋ช…ํ™•ํžˆ ๋ฐ˜์˜ํ•จ์œผ๋กœ์จ, ์ธ๊ฐ„ ์—ฐ๊ตฌ์ž ์ˆ˜์ค€์˜ ์ฐธ์‹ ํ•œ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ƒ์„ฑ์„ ์ž๋™ํ™”ํ•œ๋‹ค.

Motivation

Achievement

Figure 2

๊ทธ๋ฆผ 2: CoI ์—์ด์ „ํŠธ์˜ 3๋‹จ๊ณ„ ํ”„๋ ˆ์ž„์›Œํฌ - CoI ๊ตฌ์„ฑ, ์•„์ด๋””์–ด ์ƒ์„ฑ, ์‹คํ—˜ ์„ค๊ณ„

  1. CoI ์—์ด์ „ํŠธ์˜ ์šฐ์ˆ˜์„ฑ: AI ๋ถ„์•ผ ์•„์ด๋””์–ด ์ƒ์„ฑ ํƒœ์Šคํฌ์—์„œ ๋ชจ๋“  ์ž๋™ํ™” ๋ฒ ์ด์Šค๋ผ์ธ์„ ๋Šฅ๊ฐ€ํ•˜๋ฉฐ, 2์œ„ ๋ฐฉ๋ฒ•๋ณด๋‹ค 56 ELO ์ ์ˆ˜ ์šฐ์ˆ˜. ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€ ์ˆ˜์ค€์˜ ์ฐธ์‹ ์„ฑ(novelty) ๋‹ฌ์„ฑ.
  2. ๋น„์šฉ ํšจ์œจ์„ฑ: 1๊ฐœ์˜ ํ›„๋ณด ์•„์ด๋””์–ด์™€ ์‹คํ—˜ ์„ค๊ณ„๋ฅผ ์ƒ์„ฑํ•˜๋Š” ์ตœ์†Œ ๋น„์šฉ์ด $0.50์œผ๋กœ ๋งค์šฐ ๊ฒฝ์ œ์ .
  3. Idea Arena ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ: ๋‹ค์–‘ํ•œ ๊ด€์ ์—์„œ ์•„์ด๋””์–ด ์ƒ์„ฑ ๋ฐฉ๋ฒ•์„ ํฌ๊ด„์ ์œผ๋กœ ํ‰๊ฐ€ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ์ธ๊ฐ„ ํ‰๊ฐ€์ž์˜ ์„ ํ˜ธ๋„์™€ ๋†’์€ ์ผ์น˜๋„๋ฅผ ๋ณด์ž„.
  4. ํ•ต์‹ฌ ๋ฐœ๊ฒฌ: ์•„์ด๋””์–ด์˜ ์ฐธ์‹ ์„ฑ์„ ์œ„ํ•ด์„œ๋Š” ๊ด€๋ จ ๋ฌธํ—Œ์˜ '์–‘'๋ณด๋‹ค ๋ช…ํ™•ํ•œ ๋ฐœ์ „ ์ถ”์„ธ ๋ถ„์„์ด ๋” ์ค‘์š”ํ•จ์„ ๊ทœ๋ช….

How

Figure 2

Stage 1: CoI ๊ตฌ์„ฑ (CoI Construction)

Stage 2: ์•„์ด๋””์–ด ์ƒ์„ฑ (Idea Generation)

Stage 3: ์‹คํ—˜ ์„ค๊ณ„ (Experiment Design)

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ์ด ๋…ผ๋ฌธ์€ LLM์˜ ์ฐฝ์˜์  ๋Šฅ๋ ฅ์„ ๊ณผํ•™ ๋ถ„์•ผ์— ์‹ค์งˆ์ ์œผ๋กœ ์ ์šฉํ•˜๋Š” ํ˜์‹ ์  ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•˜๋ฉฐ, ๋ฌธํ—Œ์˜ ์ฒด๊ณ„์  ์กฐ์งํ™”๋ฅผ ํ†ตํ•ด ์•„์ด๋””์–ด ์ƒ์„ฑ ํ’ˆ์งˆ์„ ํš๊ธฐ์ ์œผ๋กœ ํ–ฅ์ƒ์‹œํ‚จ๋‹ค. ๋‹ค๋งŒ AI ๋ถ„์•ผ ๊ฒ€์ฆ๊ณผ ์‹ค์ œ ์‹คํ—˜ ์ˆ˜ํ–‰ ๊ฒ€์ฆ์œผ๋กœ์˜ ํ™•์žฅ์ด ํ–ฅํ›„ ๊ณผ์ œ์ด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ƒ์„ฑ์„ ์œ„ํ•œ LLM ํ™œ์šฉ์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Chain of Ideas(194)๋Š” ์—ฐ๊ตฌ ์•„์ด๋””์–ด ๋ฐœ๋‹ฌ๊ณผ์ •์˜ ๊ตฌ์กฐ์  ๋ชจ๋ธ์„ ์†Œ๊ฐœํ•ด 857๋ฒˆ ๋…ผ๋ฌธ์˜ AI ์—ฐ๊ตฌ์ž ์›Œํฌํ”Œ๋กœ์šฐ ์„ค๊ณ„์˜ ๊ธฐ์ดˆ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
603 ๋…ผ๋ฌธ์€ AI๊ฐ€ ์ ์ง„์ ์œผ๋กœ ๋…ผ๋ฌธ ์ดˆ์•ˆ์„ ์ƒ์„ฑยท์ˆ˜์ •ํ•˜๋Š” ๊ณผ์ •์„ ๋‹ค๋ค„, 194์˜ ์ฒด์ธ ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ์ง„ํ™”์™€ ๋Œ€๋น„๋˜๋Š” bottom-up ์ƒ์„ฑ ๋ฐฉ์‹์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ•™์ˆ  ๋…ผ๋ฌธ์˜ ๊ด€๋ จ ์—ฐ๊ตฌ ์„น์…˜ ์ž๋™ ์ƒ์„ฑ์„ ์œ„ํ•œ ๋‹ค๋ฅธ ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ œ์•ˆํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Learning to generate research idea ๋…ผ๋ฌธ์€ ๋™์  ์ œ์–ด ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํ™œ์šฉํ•˜์—ฌ LLM ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ƒ์„ฑ์˜ ๋‹ค๋ฅธ ๋ฐฉ์‹์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ƒ์„ฑ์— LLM์˜ ์ฐฝ์˜์  ๊ฒฐํ•ฉ(Chain of Ideas)์— ์ดˆ์ ์„ ๋งž์ถ”์–ด ์กฐํ•ฉ์  ์ฐฝ์˜์„ฑ ๋ฌธ์ œ์‹ ๊ณต์œ .
๋‹ค๋ฅธ ์ ‘๊ทผ
Chain of Ideas(194)๋Š” ์ฐธ์‹ ํ•œ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ƒ์„ฑ ๊ณผ์ •์— ๋Œ€ํ•œ ์ƒˆ๋กœ์šด ์—ฐ๊ฒฐ์„ฑ ํƒ์ƒ‰ ์ ‘๊ทผ์œผ๋กœ 728๊ณผ ๋น„์Šทํ•œ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅธ ๊ด€์ ์—์„œ ํ’‰๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ์—ฐ๊ตฌ ๊ฐ€์†ํ™”๋ฅผ ์œ„ํ•œ ๋‹ค๋ฅธ AI ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ƒ์„ฑ์˜ ์‹ ๊ทœ์„ฑ์„ ํ‰๊ฐ€ํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ž๋™ ์ƒ์„ฑ ๋ฐ ๊ณผํ•™ ๋ฌธํ—Œ ํƒ์ƒ‰์„ ์œ„ํ•œ ์œ ์‚ฌํ•œ ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ทจํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™์  ๋ฐœ๊ฒฌ์„ ์œ„ํ•œ LLM ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์ž๋™ํ™” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
194 ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์ฐธ์‹ ํ•œ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ๊ฐœ๋ฐœ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ๋‹ค๋ฃจ์–ด, 777์˜ ๋ฌธ์ œ-๋ฐฉ๋ฒ• ๊ตฌ์กฐ ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ํ˜์‹  ํ”„๋ ˆ์ž„์›Œํฌ์™€ ๋Œ€์•ˆ์ ์œผ๋กœ ์ฝํž ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฌธํ—Œ ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ƒ์„ฑ ์ž๋™ํ™”๋ฅผ ์œ„ํ•œ ์œ ์‚ฌํ•œ ์ฒด์ธ ๊ตฌ์กฐ ์ ‘๊ทผ ๋ฐฉ์‹์„ ์‚ฌ์šฉํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Chain of Ideas ๋…ผ๋ฌธ์€ ์ƒˆ๋กœ์šด ๊ณผํ•™ ์•„์ด๋””์–ด ์ƒ์„ฑ ๋ฐ ์ง„ํ™” ๊ณผ์ •์˜ ๋ชจ๋ธ๋ง์— ์ดˆ์ ์„ ๋งž์ถ”์–ด, PaperRobot์˜ ์•„์ด๋””์–ด ์ƒ์„ฑ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์‹ฌํ™”์‹œํ‚ต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
668 ๋…ผ๋ฌธ์€ LLM ์—์ด์ „ํŠธ๊ฐ€ ์‹ค์ œ ๋…ผ๋ฌธ์—์„œ ๋ฐ˜๋ณต์ ์œผ๋กœ ์•„์ด๋””์–ด ๋ฐœ๊ตด๊ณผ ํ‰๊ฐ€๋ฅผ ํ•˜๋Š” ์‹คํ—˜ํ™˜๊ฒฝ์„ ์ œ๊ณตํ•ด, 194์˜ ์•„์ด๋””์–ด chain ๋ฐœ์ „ ์‹คํ˜„์„ฑ์„ ๋†’์ธ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Scideator๋Š” ์ธ๊ฐ„-LLM ํ˜‘์—… ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ์ƒ์„ฑ์— ์ดˆ์ ์„ ๋งž์ถ”์–ด, Chain of Ideas์˜ ์ž๋™ํ™” ์•„์ด๋””์–ด ๋ฐœ๊ตด ๋ฐฉ๋ฒ•๋ก ์— ์‹ค์งˆ์  ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Many Heads Are Better Than One ๋…ผ๋ฌธ์€ ๋‹ค์ค‘ ์—์ด์ „ํŠธ LLM์˜ ์•„์ด๋””์–ด ์ฐฝ์ถœ ํšจ๊ณผ๋ฅผ ๋ถ„์„ํ•ด, ํ˜์‹ ์  ์•„์ด๋””์–ด ์ž๋™ํ™” ๊ณผ์ •์˜ ์‹ค์ œ ์„ฑ๊ณผ๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
194๋ฒˆ ๋…ผ๋ฌธ์€ AI๊ฐ€ ์ƒˆ๋กœ์šด ์—ฐ๊ตฌ ์•„์ด๋””์–ด๋ฅผ ์–ด๋–ป๊ฒŒ ์ƒ์„ฑํ•˜๋Š”์ง€์— ์ดˆ์ ์„ ๋งž์ถ”๋ฏ€๋กœ, 1126์—์„œ ์‹คํ—˜์  ํ˜์‹ ์„ ์ด๋Œ์–ด๋‚ธ AI์˜ ์ฐฝ์˜์„ฑ ๋ฉ”์ปค๋‹ˆ์ฆ˜๊ณผ ํ•จ๊ป˜ ์‚ดํŽด๋ณด๋ฉด ๋งฅ๋ฝ์ด ๋ณด์™„๋ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •