Essence
2020-2024๋
LLM ๋ฐ LLM ๊ธฐ๋ฐ ์์ด์ ํธ ๋
ผ๋ฌธ ์ถ์ด
๋ณธ ๋
ผ๋ฌธ์ ์ํํธ์จ์ด ๊ณตํ(SE) ๋ถ์ผ์์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)๊ณผ LLM ๊ธฐ๋ฐ ์์ด์ ํธ์ ํํฉ์ ๊ตฌ๋ถํ์ฌ ์ฒด๊ณ์ ์ผ๋ก ๋ถ์ํ๋ ์ฒซ ๋ฒ์งธ ํฌ๊ด์ ์กฐ์ฌ์ด๋ค. ์๊ตฌ์ฌํญ ๊ณตํ, ์ฝ๋ ์์ฑ, ์์จ์ ์์ฌ๊ฒฐ์ , ์ํํธ์จ์ด ์ค๊ณ, ํ
์คํธ ์์ฑ, ์ํํธ์จ์ด ๋ณด์ ๋ฐ ์ ์ง๋ณด์์ 6๊ฐ์ง ํต์ฌ ์์ญ์์ 139๊ฐ ๋
ผ๋ฌธ์ ์์งํ์ฌ LLM๊ณผ LLM ๊ธฐ๋ฐ ์์ด์ ํธ์ ์ฐจ์ด์ ์ ๋ช
ํํ ํ๋ค.
Evaluation
Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.3/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ LLM๊ณผ LLM ๊ธฐ๋ฐ ์์ด์ ํธ๋ฅผ ๋ช
ํํ ๊ตฌ๋ถํ ์ฒซ ๋ฒ์งธ ํฌ๊ด์ ์กฐ์ฌ๋ก์, ๋น ๋ฅด๊ฒ ์งํํ๋ AI ๊ธฐ๋ฐ ์ํํธ์จ์ด ๊ณตํ ๋ถ์ผ์์ ์์์ฑ ๋์ ๊ธฐ์ฌ๋ฅผ ์ ๊ณตํ๋ค. ๋ค๋ง ๋ฒค์น๋งํฌ ํ์คํ ๋ถ์ฌ์ ์ค๋ฌด ๊ฒ์ฆ ๋ถ์กฑ์ด ํ๊ณ์ด๋ฉฐ, ํ์ ์ฐ๊ตฌ๊ฐ ์ด๋ฌํ ๊ฒฉ์ฐจ๋ฅผ ๋ฉ์ฐ๊ธฐ๋ฅผ ๊ธฐ๋ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
CodeGen ๋
ผ๋ฌธ์ ์ํํธ์จ์ด ์ฝ๋ ์์ฑ ๋ํ์ธ์ด๋ชจ๋ธ์ ๊ธฐ๋ณธ ํ๋ ์์ํฌ๋ก, ์ํํธ์จ์ด ๊ณตํ์์ LLM ํ์ฉ ์ฌ๋ก๋ฅผ ๋น๊ต๊ฐ๋ฅํ๊ฒ ํด์ค๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ์์ด์ ํธ์ ์ด๋ก ์ ๊ธฐ๋ฐ๊ณผ ์ํคํ
์ฒ๋ฅผ ์ ๊ณตํ๋ ์ ํ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
499๋ฒ ๋
ผ๋ฌธ์ LLM๊ณผ ํด ํตํฉ ์๋ฒ ์ด๋ก, 362๋ฒ์์ ์ํํธ์จ์ด ๊ณตํ ๋ด LLM๊ณผ ์์ด์ ํธ์ ์ค์ ํ์ฉ ๋ฐฉ๋ฒ๋ก ๊ธฐ์ด๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM๊ธฐ๋ฐ ์์ด์ ํธ์ ์ํํธ์จ์ด/์๋ฎฌ๋ ์ด์
์๋ํ ์ฐ๊ตฌ๋ฅผ ๋ค๋ฃจ๋ฉฐ, cross-domain transfer์ ์ํํธ์จ์ด์ ํ์ฅ์ ๋ํ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
From LLMs to LLM-based Agents for Software Engineering ๋
ผ๋ฌธ์ LLM ์์ด์ ํธ๊ฐ ์ํํธ์จ์ด ๊ฐ๋ฐ๋ฌธ์ ์ ์ด๋ป๊ฒ ์ ์ฉ๋๋์ง ์ข
ํฉ์ ๋ฐฐ๊ฒฝ์ ์ดํดํ๋ ๋ฐ ๋์์ ์ค๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
From LLMs to LLM-based Agents for Software Engineering ๋
ผ๋ฌธ์ ๋ฒค์น๋งํฌ ์ค๊ณ ๋ฐ ์ธ์ง์ ๊ณผ์ ํ๊ฐ์ ๊ดํด ์ด๋ก ์ ๋ฐ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
From LLMs to LLM-based Agents for Software Engineering๋ ์์ด์ ํธ ๊ธฐ๋ฐ ์์คํ
์ ํ๊ฐ์ ๋ฐ์ ๋ฐฉํฅ์ ๋ํด ์๊ฐ๋์ด ์์ด MLRC-Bench์ ํ๊ฐ์ฒด๊ณ์ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ฝ๋ ์์ฑ ๋ฐ ์ํํธ์จ์ด ๊ฐ๋ฐ์์ LLM์ ์ญํ ์ ๋ถ์ํ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
205๋ฒ ChatDev ๋
ผ๋ฌธ์ ์ํํธ์จ์ด ๊ฐ๋ฐ์ฉ ๋ค์ค ์์ด์ ํธ๋ฅผ ์ปค๋ฎค๋์ผ์ด์
๊ตฌ์กฐ๋ก ์ค๊ณํ์ฌ, 362๋ฒ์ ์ํํธ์จ์ด ๊ณตํ ๋ถ์ผ ๋ด LLM ๋ฐ ์์ด์ ํธ ์ ์ฉ ์กฐ์ฌ์ ์๋ก ๋ค๋ฅธ ์ ๊ทผ๋ฒ์ ๋ณด์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
From LLMs to LLM-based Agents ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ ๊ณผํํ๊ตฌ์ ์ค์ ์ ์ฌ๋ฌ ์ํํธ์จ์ด ์์ง๋์ด๋ง ๋ถ์ผ ์์ฉ๊น์ง ํ์ฅ์ ์ ์ฉ ์ฌ๋ก์ ๋์ ๊ณผ์ ๋ฅผ ๋ค๋ฃฌ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ํํธ์จ์ด ๊ณตํ์์ LLM ๊ธฐ๋ฐ ์์ด์ ํธ์ ํ์ฉ์ ๋ค๋ฃจ๋ ์ ์ฌํ ์กฐ์ฌ ๋
ผ๋ฌธ์ผ๋ก, ๋ค๋ฅธ ๊ด์ ์์ ๊ฐ์ ์ฃผ์ ๋ฅผ ๋ถ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ํํธ์จ์ด ๊ณตํ ์๋ํ๋ฅผ ์ํ LLM ํ์ฉ์ ๋ค๋ฃจ๋ ์ ์ฌํ ์กฐ์ฌ ๋
ผ๋ฌธ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
From LLMs to LLM-based Agents for Software Engineering ๋
ผ๋ฌธ์ ๊ณผํ์ฐ๊ตฌ ์ธ ์ํํธ์จ์ด ๋๋ฉ์ธ์์ ์์ด๋์ด ์์ฑ ๋ฐ ํ๊ฐ๋ฅผ ์๋ํํ๋ ์ ๊ทผ์ ๋ณด์ฌ์ค๋ค.
๋ค๋ฅธ ์ ๊ทผ
From LLMs to LLM-based Agents for Software Engineering์ LLM ์์ด์ ํธ์ ์ถ๋ก ๊ณผ์ ์ฌํ ๋ฐ ๊ฒ์ฆ ๊ด๋ จ ๋
ผ์์์, ๋ฌผ๋ฆฌ ๋ฌธ์ ์ค์ฌ ํด์๊ฐ๋ฅ์ฑ ๊ฐํ๋ผ๋ 2246 ๋
ผ๋ฌธ์ ์์ด๋์ด์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ์ํํธ์จ์ด ๊ณตํ ์์
์ ์ ์ฉํ๋ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ๋ ๊ด๋ จ ์กฐ์ฌ ๋
ผ๋ฌธ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
362๋ SW ์์ง๋์ด๋ง์ ์ํ LLM ๊ธฐ๋ฐ ์์ด์ ํธ ์ ๋ฐ์ ๋ฆฌ๋ทฐํ์ฌ, 3288์ ๊ณผํ SW ์์ฑ AI ์ฌ๋ก์ ๋ค์ํ ์๋ํ ์์คยท์ ๋ต ๋น๊ต๋ฅผ ๊ฐ๋ฅ์ผ ํ๋ค.
ํ์ ์ฐ๊ตฌ
362๋ ์ํํธ์จ์ด ์์ง๋์ด๋ง์์ LLM ๊ธฐ๋ฐ ์์ด์ ํธ ์ ์ฉ์ ๋จ๊ณ๋ณ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ, 327์ ๊ฒฝํ์ ํ๋ ฅํ์ต์ ์ด์ด์ง๋๋ค.
ํ์ ์ฐ๊ตฌ
362๋ LLM ๊ธฐ๋ฐ ์ํํธ์จ์ด ๊ฐ๋ฐ ์ง์ ์์ด์ ํธ์ ํฌ๊ด์ ๋ฆฌ๋ทฐ๋ฅผ ์ ์ํด, 205์ ChatDev ์ค ์ฌ๋ก๋ฅผ ๋ ๋์ ๋งฅ๋ฝ์์ ํด์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
ํ์ ์ฐ๊ตฌ
StableToolBench๋ ์ฝ๋ ์์ฑยท๋๋ฒ๊น
์ฉ LLM ํ๊ฐ ์ค์ํธ๋ก, ์ฐ๊ตฌํ์ฅ์์ LLM ๊ธฐ๋ฐ ์ํํธ์จ์ด ๊ณตํ ํจ์ฉ์ ๊ฒ์ฆํ ์ ์๊ฒ ํฉ๋๋ค.
์์ฉ ์ฌ๋ก
From LLMs to LLM-based Agents for Software Engineering ๋
ผ๋ฌธ์ ์ฝ๋ LLM์ ์ค์ ์ํํธ์จ์ด ์์ง๋์ด๋ง ๋ถ์ผ์ ์ ์ฉํ๋ ๋ฐฉ๋ฒ๋ก ๊ณผ ํ๊ณ๋ฅผ ํ๊ตฌํ๋ค.
์์ฉ ์ฌ๋ก
894 ๋
ผ๋ฌธ์ 362์ ์๋ฒ ์ด ๊ฒฐ๊ณผ๋ฅผ ๋ฐํ์ผ๋ก LLM ๊ธฐ๋ฐ ์ฝ๋ฉ ํ์ง ํฅ์ ๋ฐ ์ค์ฆ์ ์ฝ๋ ์๋ํ ์ ์ฉ ์ฌ๋ก๋ฅผ ๋ณด์ฌ์ค๋๋ค.