Essence
Figure 1. Flowchart of the LLM-Feynman framework. (I) The input consists of data, meaning,
LLM-Feynman์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ๊ธฐํธ ํ๊ท์ ๊ฒฐํฉํ์ฌ ๊ณผํ์ ๊ณต์์ ์๋์ผ๋ก ๋ฐ๊ฒฌํ๋ ํ๋ ์์ํฌ์ด๋ค. ์ด ๋ฐฉ๋ฒ์ ์๋ํ๋ ํน์ฑ ์์ง๋์ด๋ง, LLM ๊ธฐ๋ฐ์ ์์ฒด ํ๊ฐ, ๊ทธ๋ฆฌ๊ณ Monte Carlo tree search๋ฅผ ํตํด ํด์ ๊ฐ๋ฅํ๊ณ ์ผ๋ฐํ ๊ฐ๋ฅํ ๊ณผํ ๊ณต์์ ๋ฐ๊ฒฌํ๋ค.
Limitation & Further Study
- LLM ํนํ์ฑ: ChatGPT, LLaMA, DeepSeek ๋ฑ ํน์ LLM์ ์์กดํ๋ฏ๋ก ๋ค์ํ ๋ชจ๋ธ์์์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ ๋ฏธ๊ฒ์ฆ
- ๋๋ฉ์ธ ์ง์ ์์กด์ฑ: ์ด๊ธฐ ํน์ฑ์ ๋ฌผ๋ฆฌ์ ์๋ฏธ์ ์ฐจ์ ์ ๋ณด๊ฐ ์
๋ ฅ์ผ๋ก ํ์ํ์ฌ, ์์ ํ ๋ฏธ์ง์ ๋๋ฉ์ธ์์์ ์๋ ์ ์ฉ ํ๊ณ
- ๊ณ์ฐ ๋น์ฉ: 500 ๋ฐ๋ณต์ LLM ํธ์ถ ๋ฐ MCTS ๊ธฐ๋ฐ ํด์์ผ๋ก ์ธํ ๋์ ๊ณ์ฐ ๋น์ฉ ๋ฏธ๋ถ์
- ๊ณต์์ ์ธ์ฝ์ฑ: ํ๋ จ ๋ฐ์ดํฐ ๋ฒ์ ์ธ์์์ ๊ณต์ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ๋ํ ์ฒด๊ณ์ ํ๊ฐ ๋ถ์กฑ
- ๋ณต์ก๋ ์ธก์ ์ ์: ๊ณต์ ๋ณต์ก๋(C)์ ์ ํํ ์ ์ ๋ฐ ์ ๊ทํ ๋ฐฉ์์ด ๋ช
์๋์ง ์์
ํ์ ์ฐ๊ตฌ: ๊ณ์ฐ ํจ์จ์ฑ ๊ฐ์ , ๋ค์ํ LLM ๋ชจ๋ธ ๋น๊ต, ์ธ์ฝ์ฑ ํ๊ฐ, ๋ ๊ด๋ฒ์ํ ๋๋ฉ์ธ ์์ฉ ํ๋
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: LLM-Feynman์ ๋๋ฉ์ธ ์ง์๊ณผ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ๊ธฐํธ ํ๊ท์ ์ฐฝ์์ ์ผ๋ก ๊ฒฐํฉํ์ฌ ํด์ ๊ฐ๋ฅํ๊ณ ์ผ๋ฐํ ๊ฐ๋ฅํ ๊ณผํ ๊ณต์ ๋ฐ๊ฒฌ์ ์๋ก์ด ํจ๋ฌ๋ค์์ ์ ์ํ๋ค. Feynman ๊ณต์์ 90% ์ด์ ์ฌ๋ฐ๊ฒฌ๊ณผ ๋ค์ํ ์ฌ๋ฃ ๊ณผํ ์์ฉ์์์ ์ฑ๊ณผ๋ ๋ฐฉ๋ฒ์ ์คํจ์ฑ์ ์
์ฆํ๋ค. ๋ค๋ง LLM ํนํ์ฑ, ๋๋ฉ์ธ ์ง์ ์ฌ์ ์๊ตฌ, ๊ณ์ฐ ๋น์ฉ ๋ฑ์ ๋ํ ์ฌํ ๋ถ์์ด ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
502๋ฒ ๋
ผ๋ฌธ์ LLM์ด ๊ณผํ์ ๋ฒ์น์ ์๋๋ฐ๊ฒฌ(์: ํ์ธ๋ง์ ๋ฐฉ์ ์)์ ์ฌ์ฉ๋ ์ ํ ์ฐ๊ตฌ๋ก, 533๋ฒ์ ๋ฉํ-์คํ ์ค๊ณ ์์ด๋์ด์ ํ ๋์
๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ๊ณผํ ๋ฐฉ์ ์ ๋ฐ๊ฒฌ์ ์ด๋ก ์ ๋ฐฉ๋ฒ๊ณผ ํ๊ฐ ์ฒด๊ณ๋ฅผ ์ ์ํ์ฌ 502์ ์ฐ๊ตฌ ํ๋ ์์ํฌ๋ฅผ ๋ณด์ํด์ค๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋์นญ์ฑ ์ ๋ณด๋ฅผ ํ์ฉํ ๋์ญํ ์์คํ
๊ณต์ ๋ฐ๊ฒฌ์ ์ด๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํ์ฌ, ๋ณธ ๋
ผ๋ฌธ์ ๋ฐฉ์๊ณผ ์กฐํฉ ๊ฐ๋ฅ์ฑ์ ์์ฌํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
502๋ฒ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ณผํ ๊ณต์ ๋ฐ๊ฒฌ ํ๋ ์์ํฌ๋ฅผ ์ ์ํด, 547๋ฒ์์ ๋
ผ์ํ๋ ์ ์ฐจ์ ์ขํ๊ณ ๋ฐ ์ง๋ฐฐ๋ฐฉ์ ์ ์๋ํ์ ์ด๋ก ์ ์ฐ๊ณ๊ฐ ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
502๋ฒ ๋
ผ๋ฌธ์์ ์๊ฐํ LLM ํ์ฉ ๊ณผํ์ ๋ฐ๊ฒฌ ๋ฐฉ๋ฒ๋ก ์ด AlphaEvolve์ LLM-์ฝ๋ ๋ฒ์ญ ๋ชจ๋ธ๊ณผ ๊ฐ๋
์ ์ผ๋ก ์ฐ๊ฒฐ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ฌผ๋ฆฌ/์ํ ์์คํ
์ ์ด๋ก ๋ฐ๊ฒฌ์ ์ํ LLM ๊ธฐ๋ฐ ์์ ์ถ๋ก ๋ฐ ๊ฒ์ฆ ์ ๋ต์ด SEVerA์ ํ์์ ์์ ์ฑ ํ๋ ์์ํฌ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
502 ๋
ผ๋ฌธ์ LLM์ ๋ฌผ๋ฆฌ ๋ชจ๋ธ ๋ฐ๊ฒฌ ํ๋ ์์ํฌ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ์๊ฐํ๋ฉฐ, 3031์์ ์์ฑ๋ชจ๋ธ ํ์ต์ผ๋ก ์๋ฐ์ ์ธ ํด๋ฐํ ๋์ ์ถํ์ ์ํ์ ์ผ๋ก ํด์ํ ์ ์๋ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ๋ก๊ทธ๋๋ฐ ๊ธฐ๋ฐ LLM ๊ณผํ ๋ฐฉ์ ์(๊ณต์) ๋ฐ๊ฒฌ ์์คํ
์ผ๋ก, 502์ ์ ์ฌ ๋ฌธ์ ์ ๋ค๋ฅธ ์ ๊ทผ์ ์๋ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
502 ๋
ผ๋ฌธ์ LLM์ ์ฌ์ฉํ์ฌ ๋ฒ์ฉ ๋ฌผ๋ฆฌ๊ณต์์ ํ๋ก๊ทธ๋๋ฐ์ ๋ฐ๊ฒฌ์ ์ด์ ์ ๋ง์ถฐ, 232์์ ์ ๊ทผ ๋ฐ ๊ฒฐ๊ณผ ๋น๊ต๊ฐ ๊ฐ๋ฅํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
502 ๋
ผ๋ฌธ ์ญ์ LLM ๊ธฐ๋ฐ ์์/๊ณผํ ๋ฐฉ์ ์ ๋ฐ๊ฒฌ์ ๋ค๋ฃจ๋, 289์์๋ ๋ฐ์ดํฐ-์ด๋ ฅ ๊ธฐ๋ฐ ์ด์ค์ถ๋ก , 502์์๋ ์ ๋๋ฒ์ค ๊ณต์ํ๋ฅผ ๊ฐ์กฐํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM๊ณผ ๋๊ตฌ ํ์ฉ ๊ธฐ๋ฐ์ ์ฆ๊ฑฐ ์์ฑ ๋ฐ ๊ฒ์ฆ ํ๋ ์์ํฌ๋ก, AgentMD์ ์์ ํ๋จ ์ ๋น์ฑ ๋ณด์ ๋ฐฉ๋ฒ ์ ๊ณต.
ํ์ ์ฐ๊ตฌ
547๋ฒ ๋
ผ๋ฌธ์ ๋ฉํฐ๋ชจ๋ฌ LLM์ ํตํ ๊ณ ์ฐจ์ ๋ฐ์ดํฐ์ ๋ฐฉ์ ์ ๋ฐ๊ฒฌ์ผ๋ก, 502๋ฒ ๋
ผ๋ฌธ์ ๊ณผํ ๊ณต์ ์๋ํ ์ ๊ทผ์ ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
504๋ฒ ๋
ผ๋ฌธ์ ๋ฐฉ์ ์ ๋ฐ๊ฒฌ ๋ฒค์น๋งํฌ๋ก์จ, 502๋ฒ์ ์ฑ๋ฅ๊ณผ ๋ฐฉ๋ฒ๋ก ์ด ์ค์ ๋ก ์ด๋ป๊ฒ ํ๊ฐ๋๋์ง ํ์ธํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
502 ๋
ผ๋ฌธ์ 085์ ์์ฐํ์์์ ๋ฌผ๋ฆฌ ๋ฒ์น์ ๋ฐ๊ฒฌํ๋ LLM ๊ธฐ๋ฐ ์์คํ
์ ๋์ฑ ์ผ๋ฐํ๋ ์์ ๋ฐ๊ฒฌ ์์ญ์ผ๋ก ํ์ฅํฉ๋๋ค.
์์ฉ ์ฌ๋ก
A comprehensive survey of cross-domain policy transfer ๋
ผ๋ฌธ์ ์๋ํ๋ ๊ณผํ ๊ณต์ ๋ฐ ์ต์ ํ ๋ฐ๊ฒฌ ํ๋ ์์ํฌ์ ์ค์ ๋ค๋ถ์ผ ์์ฉ ๊ฐ๋ฅ์ฑ์ ๋๋ฌ๋
๋๋ค.
์์ฉ ์ฌ๋ก
LLM๊ณผ ์ต์ ํ๋ก ํด์ ๊ฐ๋ฅํ ๊ณผํ๊ณต์ ํ์์ ์ฑ๊ณตํ์ฌ, 482์ ์์ฐ์ด ์ฌ๊ณ -์ฆ๋ช
ํ๋ ์์ํฌ๊ฐ ์ค์ ๊ณผํ์ ๋ฐ๊ฒฌ์ ์ด๋ป๊ฒ ์ฐ๊ฒฐ๋๋์ง๋ฅผ ๋ณด์ฌ์ค๋ค.