์ ์: Xiangchao Yan, Shiyang Feng, Jiakang Yuan, Renqiu Xia, Bin Wang, Lei Bai, Bo Zhang | ๋ ์ง: 2025 | DOI: N/A 📄 PDF
Essence
๊ทธ๋ฆผ 1: AI ์์ฑ ์ค๋ฌธ๊ณผ ์ธ๊ฐ ์์ฑ ์ค๋ฌธ์ ๋น๊ต. ์ค๊ณฝ(Outline)์ ๋
ผ๋ฆฌ์ ์ผ๊ด์ฑ ๋ถ์กฑ๊ณผ ์ฐธ๊ณ ๋ฌธํ(References)์ ๊ด๋ จ์ฑ ๋ฌธ์ ๊ฐ ์ฃผ์ ๊ณผ์ ์
๋ณธ ๋
ผ๋ฌธ์ ์๋ํ๋ ํ์ ์ค๋ฌธ์ง(Survey) ์์ฑ์ ์ํ SURVEYFORGE ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, ํด๋ฆฌ์คํฑ ๊ธฐ๋ฐ ์ค๊ณฝ ์์ฑ, ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ๋ฌธํ ๊ฒ์, ๊ทธ๋ฆฌ๊ณ ๋ค์ฐจ์ ํ๊ฐ ๋ฒค์น๋งํฌ(SurveyBench)๋ฅผ ํตํด AI ์์ฑ ์ค๋ฌธ๊ณผ ์ธ๊ฐ ์์ฑ ์ค๋ฌธ ๊ฐ์ ํ์ง ๊ฒฉ์ฐจ๋ฅผ ์ค์ธ๋ค.
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์ค๋ฌธ์ง ์๋ ์์ฑ์ ์ค์ง์ ์ธ ๋ฌธ์ ์ (๊ตฌ์กฐ์ ๊ฒฐํจ, ์ฐธ๊ณ ๋ฌธํ ๋ถ์ ํ์ฑ)์ ๋ช
ํํ ํ์
ํ๊ณ , ํด๋ฆฌ์คํฑ ์ค๊ณฝ ์์ฑ๊ณผ ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ๋ฌธํ ๊ฒ์์ ํตํด ์คํจ์ฑ ์๋ ํด๊ฒฐ์ฑ
์ ์ ์ํ๋ ์๋ฏธ ์๋ ์ฐ๊ตฌ์ด๋ค. ํนํ ๋ค์ฐจ์ ํ๊ฐ ๋ฒค์น๋งํฌ(SurveyBench)์ ๊ตฌ์ถ์ ํด๋น ๋ถ์ผ์ ํ๊ฐ ํ์คํ์ ๊ธฐ์ฌํ ์ ์๋ ๊ฐ์ ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Through the lens of core competency ๋
ผ๋ฌธ์ ๋ค์ํ LLM ๊ธฐ๋ฐ ํ๊ฐ ํ๋ ์์ํฌ ๋น๊ต๋ก, SurveyBench์ ๋ฉํฐ๋๋ฉ์
ํ๊ฐ ์ฒด๊ณ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
780์์ ๋ค๋ฃจ๋ ๋ฉํ๋ฐ์ดํฐ์ ์๋ ์ค๋ฌธ์์ฑ์ 021์ LLM ๊ธฐ๋ฐ ๊ณผํ ์ง์์ถ์ถ์ ๋ํ ์ด๋ก ์ ๊ธฐ์ด๋ฅผ ํ ๋๋ก ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Surveyforge ๋
ผ๋ฌธ์ ๊ธด ๋งฅ๋ฝ ๊ตฌ์กฐ์ ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ์์ฝ์ ํตํด SciTLDR ๋ฐ TLDR ์์
๊ณผ ์ํธ๋ณด์์ ์ธ ๋์์ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ด๋ จ ์ฐ๊ตฌ ์น์
์์ฑ์ ์ํ ํ
์คํธ ์์ฝ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ์ ํ๊ฐ ๋ฐ ๋ฆฌ๋ทฐ ์๋ํ์ ์์ด ๊ณ์ธตํ๋ ๊ตฌ์กฐ ์์ฑ ๋์ ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ์์ฑ, ๋ฆฌ๋ทฐ ๊ตฌ์กฐํ ๋ฑ ๋ค์ํ ์๋ํ ์ ๋ต์ ํ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
780๋ฒ ๋
ผ๋ฌธ์ LLM์ ํ์ฉํ ๊ตฌ์กฐ ์ค์ฌ ์์๋ผ์ธ ์ค๊ณ์ ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ์์ฑ ๊ธฐ๋ฒ์ ๋ค๋ค, 517๋ฒ์ ์ฒดํ์ ํ
์คํธ ๊ฒ์ ์์ฑ ๋ฐฉ์๊ณผ ๋น๊ต ๊ฐ๋ฅํ ๋์์ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ์ ์๋ฒ ์ด์ ์๋ํ ๋ฐ ํต์ฌ ๋ด์ฉ ์ถ์ถ ๋ฐฉ๋ฒ๋ก ์ผ๋ก, MASSW์ workflow ๊ตฌ์กฐํ์ ๋น๊ต ์ฐ๊ตฌ๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
780์ ํด๋ฆฌ์คํฑ๊ณผ ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ํ์ ์ค๋ฌธ ์๋์์ฑ ํ๋ ์์ํฌ๋ฅผ, 781์ LLM์ ํ์ฉํ ์ค๋ฌธ ์๋ํ ์ ๊ทผ๋ฒ์ ์ ์ํด ์๋ก ๋ค๋ฅธ ์ ๋ต์ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
780์์๋ LLM ๊ธฐ๋ฐ ํ์ ์๋ฒ ์ด์ ์์๋ผ์ธ ์์ฑ ๋ฐ ์ฅ๊ธฐ ๋งฅ๋ฝ ๊ณํ ์ ๋ต์ ๊ฒํ ํ์ฌ, 157์ ์ด์ง์ ์ฌ๊ท ๊ณํ ํ๋ ์์ํฌ์ ๋น๊ต์ ์ ๊ทผ๋ฐฉ์์ ๋ณด์ธ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋
ผ๋ฌธ ์ค๋ฌธ์ด๋ ๋ํํ ์ฝํ
์ธ ์๋ํ ๋ฑ LLM ๊ธฐ๋ฐ ๋
ผ๋ฌธ ์ ํ์ ๋ค์ํ ์ค์ฉ์ ์ฌ๋ก๋ฅผ ๋ค๋ฃน๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ํ๋ ํ์ ์ง์ ๊ทธ๋ํ ์์ฑ์ ์ ์ฌํ ๋ฐฉ๋ฒ๋ก ์ ์ทจํ๋ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
LLM์ ํ์ฉํ ๋
ผ๋ฌธ ์ค๋ฌธ(์๋ฒ ์ด) ์๋ํ ๋ฑ ์ ์ฒด ํ
์คํธ ํ์ฉ ์ ์ฑ์ ์์ฝ์ ์ค์ง์ ํ๋ ์ฌ๋ก๋ฅผ ๋ค๋ฃน๋๋ค.
์์ฉ ์ฌ๋ก
780์ LLM ๊ธฐ๋ฐ ์๋ฒ ์ด ์๋ํ ๋ฐ ์ฅ๊ธฐ๊ธฐ์ต ํ์ฉ์ ๋ค๋ฃจ์ด, 215์์ ๋
ผ๋ฌธ ํธ๋ฆฌ ๊ตฌ์กฐ๊ฐ ์ค์ ์ด๋ป๊ฒ ๋ฌธํ์ข
ํฉ, ์์ฝ์ ์ ๋ชฉ๋๋์ง ๋ณด์ฌ์ค๋ค.
์์ฉ ์ฌ๋ก
RelevAI-Reviewer ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ ์ค๋ฌธ ๋ฐ ์๋ฒ ์ด ํ๊ฐ ๋ฐ์ดํฐ์
์์ ๋ฆฌ๋ทฐ์ด ์ผ๊ด์ฑ ๋ถ์์ ํ์ฉ๋ ์ ์์ต๋๋ค.
์์ฉ ์ฌ๋ก
019 'A review of llm-assisted ideation' ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ ํ์ ์กฐ์ฌ์์ ์์ด๋์ด ๋์ถ ๋ฐ ๊ตฌ์กฐ์ ์๋ฒ ์ด ์์ฑ์ ์ค์ ์ ์ฉ ์์๋ก, SurveyForge ์ฐ๊ตฌ์ ์ฐ๊ณํด ์ฝ์ ๊ฐ์น๊ฐ ์์ต๋๋ค.
์์ฉ ์ฌ๋ก
์๋ ์ค๋ฌธ ์์ฑ ํ๋ ์์ํฌ๊ฐ ์ค์ AI ๊ธฐ๋ฐ ์ฐ๊ตฌ ์๋ช
์ฃผ๊ธฐ ์ค ๋ฌธํ ์์ฑ ๋ฐ ๋ฆฌ๋ทฐ ๊ณผ์ ๊ณผ ์ฐ๊ฒฐ๋ฉ๋๋ค.