Essence
Figure 2. From Scaffolded Experiential Learning to Autonomous Generalisation. The
๋ณธ ๋
ผ๋ฌธ์ Kolb์ ๊ฒฝํ ํ์ต ์ด๋ก ๊ณผ Vygotsky์ ๊ทผ์ ๋ฐ๋ฌ์์ญ(ZPD)์ ๊ธฐ๋ฐ์ผ๋ก LLM ์์ด์ ํธ๋ฅผ ์ํ ๊ตฌ์กฐํ๋ ํ์ต ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. Agent K๋ผ๋ ์์จ ์์คํ
์ ํตํด Kaggle ๋ฐ์ดํฐ ๊ณผํ ๊ฒฝ์์์ ์ธ๊ฐ ์์ค์ ์ฑ๋ฅ(Elo-MMR 1694)์ ๋ฌ์ฑํ์ฌ LLM ๊ธฐ๋ฐ ์์ด์ ํธ์ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ์
์ฆํ๋ค.
Achievement
Figure 4. Comparison of Agent Kโs Elo-MMR score with that of human participants. The
Agent K์ ์ฃผ์ ์ฑ๊ณผ: 1. Kaggle 81๊ฐ ์์
์์ ์์ ์์จ ๋ฐ์ดํฐ ๊ณผํ ํ์ดํ๋ผ์ธ ๊ตฌํ ๋ฐ Elo-MMR 1694 ๋ฌ์ฑ (Kaggle ์์ 2% Masters ์ค์๊ฐ ์ด๊ณผ), 2. ์๊ธ ๊ฒฝ์์์ 4๊ธ 4์ ๋ฉ๋ฌ ์์ค ์ฑ๋ฅ, ๋ค์ํ ํ์
๊ฒฝ์์์ 5๊ธ 8์ 12๋ ๋ฉ๋ฌ ์์ค ์ฑ๋ฅ ๋ฌ์ฑ, 3. ํ ํ์, ์ปดํจํฐ ๋น์ , ์์ฐ์ด ์ฒ๋ฆฌ ๋ฑ ๋ค์ํ ์์ญ์์ ์ผ๊ด๋ ์ธ๊ฐ ๊ฒฝ์ ์์ค ์ฑ๋ฅ ์ฆ๋ช
, 4. ๊ธฐ์กด ์๋ํ ๋ฐฉ๋ฒ(AutoML ๋ฑ)๊ณผ ๋ฌ๋ฆฌ ์ ์ฒด ๋ฐ์ดํฐ ๊ณผํ ํ์ดํ๋ผ์ธ์ ์์จ์ ์ผ๋ก ๊ด๋ฆฌํ๋ฉด์๋ ๊ณต์ ์ต์ข
๋ฆฌ๋๋ณด๋์์ ์ธ๊ฐ ์ฐธ๊ฐ์์ ์ง์ ๋น๊ต.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 5/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ์ธ์ง ๊ณผํ ์ด๋ก ์ ๊ธฐ๋ฐ์ผ๋ก LLM ์์ด์ ํธ์ ๊ตฌ์กฐํ๋ ํ์ต ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๊ณ , ์ค์ ๊ฒฝ์ ํ๊ฒฝ์์ ์ธ๊ฐ ์์ค์ ์ฑ๋ฅ์ ๋ฌ์ฑํจ์ผ๋ก์จ ์ผ๋ฐํ ๋ฅ๋ ฅ ์๋ AI ๊ฐ๋ฐ์ ์๋ฏธ ์๋ ์ง์ ์ ๋ณด์๋ค. Kolb์ ๊ฒฝํ ํ์ต ์ด๋ก ๊ณผ Vygotsky์ ZPD๋ฅผ ๊ณ์ฐ์ ์ผ๋ก ๊ตฌํํ ์๋๋ ๋
์ฐฝ์ ์ด๋ฉฐ, Kaggle์์์ ๊ด๋ฒ์ํ ์ค์ฆ์ ๊ฒ์ฆ์ ๋ฐฉ๋ฒ๋ก ์ ์ค์ฉ์ฑ์ ์
์ฆํ๋ค. ๋ค๋ง ํน์ ๋๋ฉ์ธ ์ต์ ํ, ๊ณ์ฐ ๋น์ฉ ์์ธํ, ํ ์์ญ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ ๋ํ ์ถ๊ฐ ์ฐ๊ตฌ๊ฐ ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Kolb ํ์ต ์ด๋ก ๋ฑ ๊ฒฝํ์ ํ์ต๊ณผ AI ๊ณผํ์์ ์ฌ์์ ํ ๋๋ฅผ ์ ๊ณตํ๋ฉฐ, ํ์ต ๊ณผ์ ์ ์๊ธฐ ๊ฐํ ๋ฃจํ ์ธก๋ฉด์ ๊ณต์ ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
476๋ฒ ๋
ผ๋ฌธ์์ ๊ฐ์ค๋ฐ๊ฒฌยท๊ท์นํ์ต ๋ฑ LLM Reasoning์ ์ด๋ก ์ ๊ธฐ๋ฐ์ Peirce/๊ต์ก์ฌ๋ฆฌ ๊ธฐ๋ฐ์ผ๋ก ํด์ํ 363๋ฒ ๋
ผ๋ฌธ์ด ์ค์ํ ๋ฐฐ๊ฒฝ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋์๊ฐ ๋ชจ๋์ ๊ธฐ์ต ๋ฉ์ปค๋์ฆ ๋ฐ ์์ด์ ํธ ์ค๊ณ๋ฅผ ์ฌ์ธต์ ์ผ๋ก ๋ฆฌ๋ทฐํ๋ฉฐ, ๊ฒฝํ์ ํ์ต ๊ธฐ๋ฐ ์์ด์ ํธ์ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
763๋ฒ ๋
ผ๋ฌธ์ LLM์ ํตํ ๊ตฌ์กฐํ๋ ๋
ผ๋ฌธ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ ํ๋ ์์ํฌ๋ฅผ ์คํยทํ๊ฐํ์ฌ, 476๋ฒ์ Agent K ์ฌ๋ก์ ์ฑ๊ณผ ๋น๊ต๊ฐ ๊ฐ๋ฅํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ค์ค๋ก ์๋ก์ด ์ฐ๊ตฌ ์์ด๋์ด๋ฅผ ์์ฑํ๊ณ ์คํ์ ์ํํ๋ ์คํ ๋ฆฌ์์น ์์คํ
์ ๋ฒค์น๋งํฌ๋ก ์ ์ํ์ฌ, Kolb ํ์ต ์ด๋ก ๊ตฌํ๊ณผ๋ ๋ค๋ฅธ ์๋ํ ํจ๋ฌ๋ค์์ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ์์ด์ ํธ์ ๋ฅ๋ ฅ๊ณผ ํ๊ณ๋ฅผ ๋ค๋ฅธ ๊ด์ ์์ ์ข
ํฉ์ ์ผ๋ก ๊ฒํ ํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
Co-Scientist๋ ๋ค์ค ์์ด์ ํธ LLM ๊ธฐ๋ฐ ๊ตฌ์กฐํ ๊ณผํ์ ์ฌ๊ณ ๋ก Agent K์ ์ ์ฌ ๋ชฉํ๋ฅผ ๊ตฌํํ์ง๋ง, ๋ฐฉ๋ฒ๋ก ์ด ๋ค๋ฆ
๋๋ค.
ํ์ ์ฐ๊ตฌ
Agent K๋ Kolb ๋ฑ ์ธ๊ฐ ํ์ต ์ด๋ก ์ ๊ธฐ๊ณ์ ์ผ๋ก ๊ตฌํํ์ฌ AI Scientist์ ์ค์ ์คํ ๊ฐ๋ฅ์ฑ์ ๋ณด์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Large Language Models Orchestrating Structured Reasoning ๋
ผ๋ฌธ์ ์ค๋ฐ์ดํฐ ๊ณผํ ๋ํ ๋ฑ์ ํตํ LLM ์์ด์ ํธ์ ๋ฐ์ดํฐ ํ์ฉ ๋ฐ ๋ฒค์น๋งํน์ ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
Reinforcing clinical decision support through multi-agent ์์คํ
์ญ์ ์ค์ ์ ๋ฌธ๊ฐ ์์ค์ ์์ฌ๊ฒฐ์ ์ง์์ agentic LLM์ ์ ์ฉํ ์ฌ๋ก๋ก, Agent K์์ ํฌ๋ก์ค๋๋ฉ์ธ ํ์ฅ ๋
ผ์์ ์ ํฉํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Agent K ์ญ์ ์๊ธฐ๊ฒ์ฆ, ์๊ธฐ์กฐ์งํ ๋ฉ์ปค๋์ฆ์ ๋์
ํ LLM ๊ธฐ๋ฐ ๋ฐ์ดํฐ์ฌ์ด์ธ์ค ์์ด์ ํธ๋ก, GeneAgent ์์คํ
์ ํ์ฅ์ ๋
ผ์๋ฅผ ์ ๊ณตํฉ๋๋ค.
์์ฉ ์ฌ๋ก
InfiAgent-DABench๋ LLM ์์ด์ ํธ์ ๋ฐ์ดํฐ ๋ถ์ ๋ฅ๋ ฅ์ ์ค์ ๊ณผ์
์ผ๋ก ํ๊ฐํ๋ ๋ํ์ ์์ฉ ๋ฒค์น๋งํฌ๋ค.