์ ์: Long Li, Weiwen Xu, Jiayan Guo, Ruochen Zhao, Xingxuan Li ์ธ (DAMO Academy, Alibaba Group; Zhejiang University) | ๋ ์ง: 2024 | DOI: arXiv:2410.13185 📄 PDF
Essence
๊ทธ๋ฆผ 1: Vanilla RAG ๊ธฐ๋ฐ ์ฐ๊ตฌ ์์ด์ ํธ์ Chain-of-Ideas ์์ด์ ํธ์ ๋น๊ต. CoI๋ ๊ด๋ จ ๋
ผ๋ฌธ๋ค์ ์ฒด๊ณ์ ์ฒด์ธ์ผ๋ก ์กฐ์งํ์ฌ ๋
ผ๋ฆฌ์ ์ผ๊ด์ฑ ์๋ ์์ด๋์ด ์์ฑ
LLM ๊ธฐ๋ฐ ์์ด์ ํธ๊ฐ ๊ณผํ ๋ฌธํ์ ์ฒด์ธ ๊ตฌ์กฐ๋ก ์กฐ์งํ์ฌ ์ฐ๊ตฌ ๋ถ์ผ์ ์งํ ๊ณผ์ ์ ๋ช
ํํ ๋ฐ์ํจ์ผ๋ก์จ, ์ธ๊ฐ ์ฐ๊ตฌ์ ์์ค์ ์ฐธ์ ํ ์ฐ๊ตฌ ์์ด๋์ด ์์ฑ์ ์๋ํํ๋ค.
How
Stage 1: CoI ๊ตฌ์ฑ (CoI Construction)
- ์ฃผ์ด์ง ์ฐ๊ตฌ ์ฃผ์ ์ ๋ํด LLM์ด K๊ฐ์ ์๋ก ๋ค๋ฅธ ๊ด์ ์ ์ฟผ๋ฆฌ ์์ฑ
- ๊ฐ ์ฟผ๋ฆฌ๋ง๋ค ์ต์ปค(anchor) ๋
ผ๋ฌธ ๊ฒ์ (Semantic Scholar API ํ์ฉ)
- ์ต์ปค ๋
ผ๋ฌธ์ผ๋ก๋ถํฐ ์๋ฐฉํฅ ํ์ฅ:
- ์ ์ง(Forward): ์ต์ปค ๋
ผ๋ฌธ์ ์ธ์ฉํ๋ ํ์ ๋
ผ๋ฌธ๋ค ์ถ์
- ํ์ง(Backward): ์ต์ปค ๋
ผ๋ฌธ์ ์ฐธ๊ณ ๋
ผ๋ฌธ๋ค ์ถ์
- ํ
์คํธ ์๋ฒ ๋ฉ(OpenAI text-embedding-3-large)์ผ๋ก ์ฝ์ฌ์ธ ์ ์ฌ๋ ๊ธฐ๋ฐ ์์ ๋งค๊น
- M+N+1๊ฐ ๋
ผ๋ฌธ์ ์์ด๋์ด๋ฅผ ์๊ฐ์์ผ๋ก ์ฒด์ธํ: {Iโโ โ ยทยทยท โ Iโ โ ยทยทยท โ Iโ}
Stage 2: ์์ด๋์ด ์์ฑ (Idea Generation)
- ๊ฐ CoI์ ๋ํด LLM์ด ํ์ฌ ์ถ์ธ ๋ถ์ ๋ฐ ๋ฏธ๋ ์ฐ๊ตฌ ๋ฐฉํฅ ์์ธก
- ๋จ๊ณ์ ์์ด๋์ด ๊ตฌ์ฒดํ:
- ๋๊ธฐ(Motivation) ๋์ถ
- ์ ์ฌ์ ์ํฉํธ ํ๊ฐ
- ์ต์ข
์์ด๋์ด ๊ตฌํ
- ์ฐธ์ ์ฑ ๊ฒ์ฆ ์์ด์ ํธ๊ฐ ์์ฑ๋ ์์ด๋์ด๋ฅผ ๊ธฐ์กด ๋ฌธํ๊ณผ ๋ฐ๋ณต ๋น๊ต
- ์ ์ฌ์ฑ ๋์ผ๋ฉด โ ์์ด๋์ด ์์ /์ ์
- ๋ค์ค CoI ๋ธ๋์น๋ก๋ถํฐ ์ต์ ์์ด๋์ด ์ ํ
Stage 3: ์คํ ์ค๊ณ (Experiment Design)
- ์์ฑ๋ ์์ด๋์ด๋ฅผ ๊ฒ์ฆํ๊ธฐ ์ํ ์คํ ์ค๊ณ ์๋ ์์ฑ
- ๋ฒ ์ด์ค๋ผ์ธ ์ ์, ๋ฐ์ดํฐ์
์ค๋น, ๊ตฌํ ๋ฐฉ์ ์ ์
- ๋ช
ํ์ฑ๊ณผ ์ง์ ๊ฐ๋ฅ์ฑ ๊ฒ์ฆ
Evaluation
์ดํ: ์ด ๋
ผ๋ฌธ์ LLM์ ์ฐฝ์์ ๋ฅ๋ ฅ์ ๊ณผํ ๋ถ์ผ์ ์ค์ง์ ์ผ๋ก ์ ์ฉํ๋ ํ์ ์ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, ๋ฌธํ์ ์ฒด๊ณ์ ์กฐ์งํ๋ฅผ ํตํด ์์ด๋์ด ์์ฑ ํ์ง์ ํ๊ธฐ์ ์ผ๋ก ํฅ์์ํจ๋ค. ๋ค๋ง AI ๋ถ์ผ ๊ฒ์ฆ๊ณผ ์ค์ ์คํ ์ํ ๊ฒ์ฆ์ผ๋ก์ ํ์ฅ์ด ํฅํ ๊ณผ์ ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ฐ๊ตฌ ์์ด๋์ด ์์ฑ์ ์ํ LLM ํ์ฉ์ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Chain of Ideas(194)๋ ์ฐ๊ตฌ ์์ด๋์ด ๋ฐ๋ฌ๊ณผ์ ์ ๊ตฌ์กฐ์ ๋ชจ๋ธ์ ์๊ฐํด 857๋ฒ ๋
ผ๋ฌธ์ AI ์ฐ๊ตฌ์ ์ํฌํ๋ก์ฐ ์ค๊ณ์ ๊ธฐ์ด๊ฐ ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
603 ๋
ผ๋ฌธ์ AI๊ฐ ์ ์ง์ ์ผ๋ก ๋
ผ๋ฌธ ์ด์์ ์์ฑยท์์ ํ๋ ๊ณผ์ ์ ๋ค๋ค, 194์ ์ฒด์ธ ๊ธฐ๋ฐ ์์ด๋์ด ์งํ์ ๋๋น๋๋ bottom-up ์์ฑ ๋ฐฉ์์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ์ ๋
ผ๋ฌธ์ ๊ด๋ จ ์ฐ๊ตฌ ์น์
์๋ ์์ฑ์ ์ํ ๋ค๋ฅธ ์ ๊ทผ ๋ฐฉ์์ ์ ์ํ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
Learning to generate research idea ๋
ผ๋ฌธ์ ๋์ ์ ์ด ๋ฉ์ปค๋์ฆ์ ํ์ฉํ์ฌ LLM ๊ธฐ๋ฐ ์ฐ๊ตฌ ์์ด๋์ด ์์ฑ์ ๋ค๋ฅธ ๋ฐฉ์์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ฐ๊ตฌ ์์ด๋์ด ์์ฑ์ LLM์ ์ฐฝ์์ ๊ฒฐํฉ(Chain of Ideas)์ ์ด์ ์ ๋ง์ถ์ด ์กฐํฉ์ ์ฐฝ์์ฑ ๋ฌธ์ ์ ๊ณต์ .
๋ค๋ฅธ ์ ๊ทผ
Chain of Ideas(194)๋ ์ฐธ์ ํ ์ฐ๊ตฌ ์์ด๋์ด ์์ฑ ๊ณผ์ ์ ๋ํ ์๋ก์ด ์ฐ๊ฒฐ์ฑ ํ์ ์ ๊ทผ์ผ๋ก 728๊ณผ ๋น์ทํ ๋ฌธ์ ๋ฅผ ๋ค๋ฅธ ๊ด์ ์์ ํ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ ์ฐ๊ตฌ ๊ฐ์ํ๋ฅผ ์ํ ๋ค๋ฅธ AI ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ํ์ฉํ ์ฐ๊ตฌ ์์ด๋์ด ์์ฑ์ ์ ๊ท์ฑ์ ํ๊ฐํ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ๊ธฐ๋ฐ ์ฐ๊ตฌ ์์ด๋์ด ์๋ ์์ฑ ๋ฐ ๊ณผํ ๋ฌธํ ํ์์ ์ํ ์ ์ฌํ ์ ๊ทผ ๋ฐฉ์์ ์ทจํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ์ ๋ฐ๊ฒฌ์ ์ํ LLM ๊ธฐ๋ฐ ์ฐ๊ตฌ ์๋ํ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
194 ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์ฐธ์ ํ ์ฐ๊ตฌ ์์ด๋์ด ๊ฐ๋ฐ ๋ฉ์ปค๋์ฆ์ ๋ค๋ฃจ์ด, 777์ ๋ฌธ์ -๋ฐฉ๋ฒ ๊ตฌ์กฐ ๊ธฐ๋ฐ ๊ณผํ์ ํ์ ํ๋ ์์ํฌ์ ๋์์ ์ผ๋ก ์ฝํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฌธํ ๊ธฐ๋ฐ ์ฐ๊ตฌ ์์ด๋์ด ์์ฑ ์๋ํ๋ฅผ ์ํ ์ ์ฌํ ์ฒด์ธ ๊ตฌ์กฐ ์ ๊ทผ ๋ฐฉ์์ ์ฌ์ฉํ๋ค.
ํ์ ์ฐ๊ตฌ
Chain of Ideas ๋
ผ๋ฌธ์ ์๋ก์ด ๊ณผํ ์์ด๋์ด ์์ฑ ๋ฐ ์งํ ๊ณผ์ ์ ๋ชจ๋ธ๋ง์ ์ด์ ์ ๋ง์ถ์ด, PaperRobot์ ์์ด๋์ด ์์ฑ ๋ฉ์ปค๋์ฆ์ ์ฌํ์ํต๋๋ค.
ํ์ ์ฐ๊ตฌ
668 ๋
ผ๋ฌธ์ LLM ์์ด์ ํธ๊ฐ ์ค์ ๋
ผ๋ฌธ์์ ๋ฐ๋ณต์ ์ผ๋ก ์์ด๋์ด ๋ฐ๊ตด๊ณผ ํ๊ฐ๋ฅผ ํ๋ ์คํํ๊ฒฝ์ ์ ๊ณตํด, 194์ ์์ด๋์ด chain ๋ฐ์ ์คํ์ฑ์ ๋์ธ๋ค.
์์ฉ ์ฌ๋ก
Scideator๋ ์ธ๊ฐ-LLM ํ์
๊ธฐ๋ฐ ์์ด๋์ด ์์ฑ์ ์ด์ ์ ๋ง์ถ์ด, Chain of Ideas์ ์๋ํ ์์ด๋์ด ๋ฐ๊ตด ๋ฐฉ๋ฒ๋ก ์ ์ค์ง์ ์ ์ฉ ์ฌ๋ก๋ฅผ ๋ณด์ฌ์ค๋๋ค.
์์ฉ ์ฌ๋ก
Many Heads Are Better Than One ๋
ผ๋ฌธ์ ๋ค์ค ์์ด์ ํธ LLM์ ์์ด๋์ด ์ฐฝ์ถ ํจ๊ณผ๋ฅผ ๋ถ์ํด, ํ์ ์ ์์ด๋์ด ์๋ํ ๊ณผ์ ์ ์ค์ ์ฑ๊ณผ๋ฅผ ๋ณด์ฌ์ค๋๋ค.
์์ฉ ์ฌ๋ก
194๋ฒ ๋
ผ๋ฌธ์ AI๊ฐ ์๋ก์ด ์ฐ๊ตฌ ์์ด๋์ด๋ฅผ ์ด๋ป๊ฒ ์์ฑํ๋์ง์ ์ด์ ์ ๋ง์ถ๋ฏ๋ก, 1126์์ ์คํ์ ํ์ ์ ์ด๋์ด๋ธ AI์ ์ฐฝ์์ฑ ๋ฉ์ปค๋์ฆ๊ณผ ํจ๊ป ์ดํด๋ณด๋ฉด ๋งฅ๋ฝ์ด ๋ณด์๋ฉ๋๋ค.