Essence
๊ทธ๋ฆผ 1: ์ํํธ์จ์ด ์์ง๋์ด๋ง ์์
์ ํด๊ฒฐํ๊ธฐ ์ํ ๊ฐ๋ฐ์์ ์ ํ์ ์ธ ์ํฌํ๋ก์ฐ (๋ถ์ & ๊ณํ โ ๊ธฐ๋ฅ ์์น ํ์
โ ์ฝ๋ ํธ์ง โ ์คํ)
HYPERAGENT๋ ์ธ๊ฐ ๊ฐ๋ฐ์์ ์ํฌํ๋ก์ฐ๋ฅผ ๋ชจ๋ฐฉํ๋ ๋ฉํฐ์์ด์ ํธ ์์คํ
์ผ๋ก, ํ๋๋(Planner), ๋ค๋น๊ฒ์ดํฐ(Navigator), ์ฝ๋ ์๋ํฐ(Code Editor), ์คํ๊ธฐ(Executor)์ ๋ค ๊ฐ์ง ์ ๋ฌธํ๋ ์์ด์ ํธ๋ก ๊ตฌ์ฑ๋์ด ๋ค์ํ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด์ ์ํํธ์จ์ด ์์ง๋์ด๋ง ์์
์ ์ผ๋ฐ์ ์ผ๋ก ํด๊ฒฐํ ์ ์๋ ์ต์ด์ ํตํฉ ์์คํ
์ด๋ค.
Evaluation
Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.2/5
์ดํ: HYPERAGENT๋ ์ธ๊ฐ ๊ฐ๋ฐ์์ ์ํฌํ๋ก์ฐ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ๋ชจ๋ฐฉํ๋ ์ค๊ณ ์ฒ ํ์ผ๋ก ๋ฒ์ฉ์ฑ, ํจ์จ์ฑ, ํ์ฅ์ฑ์ ๋ชจ๋ ๋ฌ์ฑํ ์ค์ฉ์ ์ด๊ณ ํ์ ์ ์ธ ๋ฉํฐ์์ด์ ํธ ์์คํ
์ด๋ฉฐ, ๋ค์ํ ๋ฒค์น๋งํฌ์์์ ๊ฐ๋ ฅํ ์ฑ๋ฅ ์
์ฆ์ผ๋ก ์ค์ ์ํํธ์จ์ด ๊ฐ๋ฐ ํ๊ฒฝ์ผ๋ก์ ์ฆ์์ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ฃผ๋ ์๋ฏธ ์๋ ๊ธฐ์ฌ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
From LLMs to LLM-based Agents for Software Engineering ๋
ผ๋ฌธ์ LLM ์์ด์ ํธ๊ฐ ์ํํธ์จ์ด ๊ฐ๋ฐ๋ฌธ์ ์ ์ด๋ป๊ฒ ์ ์ฉ๋๋์ง ์ข
ํฉ์ ๋ฐฐ๊ฒฝ์ ์ดํดํ๋ ๋ฐ ๋์์ ์ค๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ฒ์ฉ ์ํํธ์จ์ด ๊ฐ๋ฐ ์ํฌํ๋ก์ฐ์ ์์ด์ ํธ ์์คํ
์ ๊ตฌ์ฑํ๋ ๊ตฌ์กฐ์ ์์๋ค์ ์๋ํ ๋๊ตฌ ์์ฑ์ ์ ์ดํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
416๋ฒ ๋
ผ๋ฌธ์ ๋ฒ์ฉ ์ํํธ์จ์ด ์์ง๋์ด๋ง ์์ด์ ํธ(Hyperagent)๋ก์ ChatDev์ ๋ค์ค ์์ด์ ํธ ํ๋ SW์ค๊ณ์ ๊ฐ๋
์ ยท๊ธฐ์ ์ ์ฐจ์ด๋ฅผ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Executable Code Actions ๋
ผ๋ฌธ์ ๋ค์ํ ์ค์ธ๊ณ ์ฝ๋ฉ ์์
์์ LLM ์์ด์ ํธ ์ฑ๋ฅ์ ์ํํด HYPERAGENT์ ์ ์ฌ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ์ง๋ง ์ ๊ทผ ๋ฐฉ์์ด ๋ค๋ฆ
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ํํธ์จ์ด ์์ง๋์ด๋ง ์์
์ ์ํ AI ๊ฐ๋ฐ์ ํ๋ซํผ์ผ๋ก, ๋ค์ํ ์ธ์ด ๋ฐ ํ๊ฒฝ์์์ ๋ฒ์ฉ์ฑ๊ณผ ์ค์ฉ์ฑ์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
416๋ฒ ๋
ผ๋ฌธ์ ์ผ๋ฐ ์ํํธ์จ์ด ์์ง๋์ด๋ง ์์ด์ ํธ ์ค๊ณ ๊ด์ ์์ OpenHands์ ๋น๊ต๋๋ ์ด์ ์ผ๋ก, ๋ค์ํ ์ฝ๋ฉ ์์ด์ ํธ platform ๊ตฌํ์ ๋
ผํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
AutoP2C๋ ๋
ผ๋ฌธ ๊ธฐ๋ฐ ์ฝ๋ ์ ์ฅ์ ์๋ํ์ ์ง์คํ๋ ๋ฐ๋ฉด, HyperAgent๋ ๋ฒ์ฉ ์ํํธ์จ์ด ์์ง๋์ด๋ง ์์
์์์ ์๋ํ ๋ฅ๋ ฅ์ ๋ณด์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฉํฐ์์ด์ ํธ ์์คํ
์ ๊ณผํ ๋ฌธ์ ์ ์ฉ ์ฌ๋ก๋ก, ์ํํธ์จ์ด ์ธ ๊ณผํ ์คํ ์๋ํ์์ ํ์ฅ์ฑ์ ๋น๊ตํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
๋ฌผ๋ฆฌ ํตํฉํ ๋ฌธ์ ํด๊ฒฐ๋ฟ๋ง ์๋๋ผ ๋ฒ์ฉ ์ํํธ์จ์ด ์์ง๋์ด๋ง ์๋ํ๋ฅผ ์งํฅํ๋ ์ผ๋ฐํ๋ ๋
ผ์๋ฅผ ์ ๊ณตํ๋ค.
ํ์ ์ฐ๊ตฌ
๊ณต๊ฐ๋ ๋
ผ๋ฌธ ์ฝ๋ ์ ์ฅ์๋ก๋ถํฐ LLM ๋๊ตฌ๋ฅผ ์๋ ์์ฑํ๋ ์์ด์ ํธ ํ๋ ์์ํฌ๋ก, HYPERAGENT์ ์๋ํ๋ ์ฝ๋ฉ workflow ์งํ์ ์ ํฉํฉ๋๋ค.
์์ฉ ์ฌ๋ก
์ค์ ์ํํธ์จ์ด ๊ฐ๋ฐ์์ LLM ์์ด์ ํธ ์๋ํ๊ฐ ์คํ๋ ๋ค์ํ ๋ฌธ์ ํด๊ฒฐ ์ฌ๋ก๋ฅผ ์ถ๊ฐ๋ก ์ดํด๋ณผ ์ ์์ต๋๋ค.