Essence
Figure 2: Impact prediction model architecture. The title and abstract are encoded by a frozen text
MIRAI๋ ๋
ผ๋ฌธ์ ์ ๋ชฉ, ์ด๋ก, ์ถํ ๋ ์ง๋ง์ ์ฌ์ฉํ์ฌ deep learning framework๋ก 5๋
ํ ๋
ผ๋ฌธ ์ํฅ๋ ฅ์ ์์ธกํ๋ ํ๋ ์์ํฌ์ด๋ค. arXiv ํ์ ๊ทธ๋ํ์์ PageRank์ citation counts๋ฅผ ์์ธกํ๋ฉฐ, 2021๋
์ถํ ๋
ผ๋ฌธ์ ๋ํด PageRank ์์ธก์์ Spearman's ฯ 0.4686, citation ์์ธก์์ 0.6192๋ฅผ ๋ฌ์ฑํ๋ค.
Achievement
Figure 3: Performance as measuerd by Spearmanโs ฯ for both impact targets across different test
Dataset: ์ฝ 300๋ง ๊ฐ arXiv ๋
ผ๋ฌธ์ ์ ์, citation, network-based impact label(citation count, PageRank) ํฌํจ ๋ฐ์ดํฐ์
๊ตฌ์ถ. Impact prediction: Publication time ์ ๋ณด๋ง์ผ๋ก 5๋
citation ์์ธก Spearman's ฯ 0.62, PageRank ์์ธก 0.47 ๋ฌ์ฑ. Research generation: Impact prediction framework๋ฅผ ํ์ฉํ research ideation pipeline ์ ์์ผ๋ก LLM judge๊ฐ 4:3 ๋น์จ๋ก baseline ๋๋น ๋ ๋์ ์ํฅ๋ ฅ ํ์ . Public release: 5๋
citation prediction model์ https://predict-paper-impact.vercel.app์ ๊ณต๊ฐ.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ๊ณผํ ๋ฌธํ์ ๊ธ์ํ ์ฆ๊ฐ๋ผ๋ ์๊ธํ ๋ฌธ์ ์ ๋์ํ์ฌ publication time์์๋ง content ๊ธฐ๋ฐ์ผ๋ก ๋
ผ๋ฌธ ์ํฅ๋ ฅ์ ์์ธกํ๋ MIRAI framework๋ฅผ ์ ์ํ๋ค. Deep text embedding์ ํ์ฉํ scalableํ๊ณ ๊ณต์ ํ ์ ๊ทผ๋ฒ๊ณผ large-scale dataset, ๊ทธ๋ฆฌ๊ณ research generation์ผ๋ก์ ํ์ฅ์ ์๋ฏธ ์๋ ๊ธฐ์ฌ์ด๋ค. ๋ค๋ง domain ์ผ๋ฐํ ์ ํ, ํ๊ฐ ๋ฐฉ๋ฒ๋ก (LLM judge๋ง ์ฌ์ฉ), PageRank ์์ธก ์ฑ๋ฅ, research idea ์์ฑ์ ์ค์ ์ํฅ๋ ฅ ๊ฒ์ฆ ๋ฑ์์ ๊ฐ์ ์ ์ฌ์ง๊ฐ ์๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๋ค๋ฅธ ์ ๊ทผ
Liveideabench๋ ๋
ผ๋ฌธ ์์ด๋์ด์ ์ํฅ๋ ฅ ์์ธก์ ๋์์ ๋ฒค์น๋งํฌ์ด์ ํ๊ฐ ํ๋ ์์ํฌ๋ก, MIRAI์ ์ ๊ทผ๊ณผ ํ๊ฐ์์ ์ฐจ๋ณ์ฑ์ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ํ๋ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ์๋ํ ๋ฐ ์ํฅ๋ ฅ ํ๊ฐ์ SurveyX๊ฐ ๋ค์ํ ์๋ํ ์์ฝ ๋ฐ ํ๊ฐ ์ฌ๋ก๋ฅผ ์ ๊ณตํ์ฌ ๋ณด์์ ์ธ ์๊ฐ์ ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
3388 ๋
ผ๋ฌธ์ ์ํฉํธ๊ฐ ๋์ ์ฐ๊ตฌ ์์ด๋์ด ์์ธก ๋ฐ ์์ฑ, ํ๊ฐ์ LLM๊ณผ RAG ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ ์จ์ ์ ์ฌํ LLM-RAG ๊ณผํ ์์ฉ์ ๋์์ ๋ณด์ฌ์ค.
๋ค๋ฅธ ์ ๊ทผ
3388์ LLM ๊ธฐ๋ฐ ๋ฏธ๋ ์ฐ๊ตฌ ์ฃผ์ ์์ธก ๋ฐ ๋
ผ๋ฌธ์ ์ํฉํธ ํ๊ฐ ๋ฐฉ๋ฒ์ ์๊ฐํ์ฌ, 3212๊ฐ ์ ์ํ๋ ์๋ก์ด ์ฐ๊ตฌ ๋ฐฉํฅ ์์ธก ์์คํ
๊ณผ ๋ฐฉ๋ฒ๋ก ๋ฉด์์ ๋น๊ต๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
MIRAI๋ ๋
ผ๋ฌธ ํ
์คํธ ๊ธฐ๋ฐ์ผ๋ก ๋ฏธ๋ ์ํฅ๋ ฅ์ ์์ธกํ๋ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ์ฌ LLM Metrics์ parametric memory ๊ธฐ๋ฐ ์ํฅ๋ ฅ ์ธก์ ์ ๋ํ ๋์์ ๊ด์ ์ ์ ์ํ๋ค.
ํ์ ์ฐ๊ตฌ
Predicting the future of ai with ai ๋
ผ๋ฌธ์ AI๋ก ๋
ผ๋ฌธ ์ํฉํธ/๋งํฌ ์์ธก์ ์๋ํ๋ค๋ ์ ์์ MIRAI์ ์ ๊ทผ๋ฐฉ๋ฒ๊ณผ ์ฐ๊ตฌ ๋ฐฉํฅ์ ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
PaperQA ๋
ผ๋ฌธ์ RAG ๊ธฐ๋ฐ ๋
ผ๋ฌธ ์ง์์๋ต ์์คํ
์ ํตํด ๋
ผ๋ฌธ ๋ด์ฉ์ ์๋ฏธ์ ์ดํด ๋ฐ ์ํฅ๋ ฅ ํ๋จ์ผ๋ก MIRAI์ ์๋ ์ํฅ๋ ฅ ์์ธก ๊ธฐ๋ฅ์ ์ค์ ์์ฉ์ผ๋ก ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
3388์ AI์ ์ํ ์ํฅ๋ ฅ ๋์ ์ฐ๊ตฌ ์ฑ๊ณผ ์์ธก/์ถ์ฒ ๋ชจ๋ธ๋ก ํ์ ์ ๋ฐ๊ฒฌ์ ์ ๋์ disruptive index์ ์ฐ๊ณ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
MIRAI ๋
ผ๋ฌธ์ ๊ณ ์ํฉํธ ๋
ผ๋ฌธ/์ฐ๊ตฌ ์ฑ๊ณผ ์์ธก์ ์์ฑ ๋ฐ ํ๋น์ฑ ๋ถ์ ๊ธฐ์ ์ ๋ฐ์ ์์ผ, ์์ด๋์ด ์คํ ์ฑ๊ณต ์์ธก ๋ฌธ์ ์ ๋ค์ํ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ๋ค.
ํ์ ์ฐ๊ตฌ
MIRAI์ ๋
ผ๋ฌธ ์ํฅ๋ ฅ ์์ธก ํ๋ ์์ํฌ๋ LLM-Metrics์ LLM ๊ธฐ๋ฐ ์ํฉํธ ์ธก์ ์งํ์ ์ ๋์ ์์ธก ๋ถ๋ถ์ ์ค์ ๋ก ๊ตฌํํด์ค๋๋ค.