Essence
๋ณธ ๋
ผ๋ฌธ์ ์ธ์ด๊ณผํ ๋ถ์ผ์์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ๋ฌด๋ถ๋ณํ ์ ์ฉ์ผ๋ก ์ธํ ๋ฐฉ๋ฒ๋ก ์ ํผ๋์ ํด๊ฒฐํ๊ธฐ ์ํด, ์ฐ๊ตฌ ๋ชฉํ์ LLM ๊ธฐ๋ฒ์ ์ฒด๊ณ์ ์ผ๋ก ์ฐ๊ณํ๋ ๋ ๊ฐ์ง ํฌ๊ด์ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค.
Evaluation
Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.25/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ์ธ์ด๊ณผํ ๋ถ์ผ์ LLM ์์ฉ์์ ์ค๋๋ ๋ฐฉ๋ฒ๋ก ์ ํผ๋์ ํด๊ฒฐํ๊ธฐ ์ํด ํฌ๊ด์ ์ด๊ณ ์ฒด๊ณ์ ์ธ ํ๋ ์์ํฌ๋ฅผ ์ ์ํจ์ผ๋ก์จ, ํ๋ฌธ์ ์ฑ์๋์ ์ฌํ์ฑ์ ํฌ๊ฒ ํฅ์์ํฌ ์ ์๋ ์ค์ํ ๊ธฐ์ฌ๋ฅผ ํ๋ค. ๋ค๋ง ๊ตฌ์ฒด์ ๋ฐ์ดํฐ ํธํฅ ๋์์ฑ
๊ณผ ์ ํฅ ๊ธฐ๋ฒ์ ๋ํ ์ง์นจ ๊ฐํ๊ฐ ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
A survey on large language model based autonomous agents ๋
ผ๋ฌธ์ ๋ค์ํ LLM ๊ธฐ๋ฐ agent ํ๋ ์์ํฌ์ ๋ฐ์ ๊ฒฝํฅ ๋ถ์์ผ๋ก ๋ณธ ๋
ผ๋ฌธ์ ๋ฐฉ๋ฒ๋ก ์ฒด๊ณํ ๋
ผ์์ ์ง์ ์ฐ๊ฒฐ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
A Survey of Large Language Models ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฒ๊ณผ ํ์ฉ๋ฐฉ์์ ๋ํ ํฌ๊ด์ ์ธ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ ํ์ฉ ๋ฐฉ๋ฒ๋ก ์ ํํฉ๊ณผ ๋ถ๋ฅ๋ฅผ ์ฌ๋ ์๊ฒ ๋ค๋ค ๋ณธ ๋
ผ๋ฌธ์ ์ฒด๊ณ์ ํ๋ ์์ํฌ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM With Tools: A Survey ๋
ผ๋ฌธ์ LLM ๋๊ตฌ ์ฌ์ฉ ๋งฅ๋ฝ๋ณ ์ฒด๊ณํ์ ๊ดํ ๋
ผ์๋ก, ๋ณธ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฒ ์ฒด๊ณํ ๋ชฉ์ ๊ณผ ๋ง๋ฟ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Systematic Framework of Application Methods for Large Language Models ๋
ผ๋ฌธ์ LLM์ ์์ฉ๋ฒ ํ๊ฐ์ ์ฐ๊ณํ์ฌ SciCode ๋ฒค์น๋งํฌ ํ์ฉ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ธ์ด๋ชจ๋ธ ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ๊ดํ Survey ๋
ผ๋ฌธ์ LLM ์ ์ฉ ๋ฐฉ๋ฒ ์ฒด๊ณํ ํ์์ฑ ๋
ผ์์ ๊ทผ๊ฐ์ด ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Towards an AI co-scientist ๋
ผ๋ฌธ์ LLM์ด co-scientist๋ก ์๋ํ ๋ ์๊ตฌ๋๋ ๋ฐฉ๋ฒ๋ก ๋ฐ ์ค๋ฆฌ์ , ์ ๋ขฐ์ฑ ์ด์๋ฅผ ๋
ผ์ํ์ฌ, ์ฒด๊ณ์ LLM ์ ์ฉ ํ๋ ์์ํฌ์ ๋น๊ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Structuring scientific innovation ๋
ผ๋ฌธ์ ํ์ ์ ์ฐ๊ตฌ ๋ฐฉ๋ฒ๋ก ๊ณผ LLM ์ ์ฉ์ ์ฐ๊ฒฐํ๋ ์๋ก์ด ๋ถ์ ํ๋ ์์ํฌ๋ฅผ ์ ์ํด ๋ฐฉ๋ฒ๋ก ์ฒด๊ณํ์ ์ ์ฌ ๋ฌธ์ ๋ฅผ ๋ค๋ฃน๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ๊ธฐ๋ฐ ์ฐ๊ตฌ ์์ด๋์ด ๋ฐ ์ธ์ด๋ชจ๋ธ ์ ์ฉ ๋ฐฉ๋ฒ์ ๋ํ ๋ค์ํ ๊ด์ ์ ๋น๊ตํด๋ณผ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Agentic AI for Scientific Discovery: A Survey ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ณผํ์ ์ถ๋ก ๋ฐ ๋ค์ํ ์ ์ฉ ์ฌ๋ก/ํ๊ณ์ ์ ํ๊ตฌํ๋ฉฐ 784์ ์ฒด๊ณ์ ๋ฐฉ๋ฒ๋ก ๊ณผ ๊ด์ ์ ๊ณต์ ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Systematic Framework of Application Methods ๋
ผ๋ฌธ์ LLM ์ ์ฉ์ ์ ๋ขฐ์ฑ ๋ฌธ์ ์ ๋ฐฉ๋ฒ๋ก ์ ํผ๋ ํด์๋ฅผ ์ํ ํ๋ ์์ํฌ๋ฅผ ์ ์ํด, capability-reliability gap์ ์กฐ์ง์ ๋ถ์์ ๋ณด์ํ๋ค.
์์ฉ ์ฌ๋ก
๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ์ ๋ค์ํ ์์ฉ๋ฒ ์ฌ๋ก๋ฅผ ์ฒด๊ณํํ ํ๋ ์์ํฌ๋ก, 405์์์ ๋ฐ์ดํฐ ์ฆ๊ฐ ๊ธฐ๋ฒ์ด ๋ค๋ฅธ NLP ํ์คํฌ์ ์ด๋ป๊ฒ ์ ์ฉ๋๋์ง ํต์ฐฐ์ ์ ๊ณตํฉ๋๋ค.
์์ฉ ์ฌ๋ก
Systematic Framework of Application Methods ๋
ผ๋ฌธ์ LLM์ ์ธ์ง ๋ฐ ํธํฅ ๋ฌธ์ ๋ฅผ ์ธ์ด๊ณผํ ์ฐ๊ตฌ์ ์ฒด๊ณ์ ์ ์ฉ ํ๋ ์์ํฌ์ ์ฐ๊ฒฐํ์ฌ ํ์ฉ ์ฌ๋ก๋ฅผ ์ ์ํ๋ค.
์์ฉ ์ฌ๋ก
ResearchGym์ ์ค์ AI ์ฐ๊ตฌ ๋
ผ๋ฌธ ์ํฌํ๋ก์ฐ์์ capability-reliability gap์ ์ค์ฆ์ ์ผ๋ก ๋๋ฌ๋ด์ด, LLM ํ์ฉ ํ๋ ์์ํฌ ์ ์ฉ์ ์ค์ ๋ฌธ์ ๋ฅผ ๋ณด์ฌ์ค๋ค.