LLM-Feynman: Leveraging Large Language Models for Universal Scientific Formula and Theory Discovery

์ €์ž: Zhilong Song, Qionghua Zhou, Chunjin Ren, Chongyi Ling, Minggang Ju | ๋‚ ์งœ: 2025 | DOI: N/A 📄 PDF


Essence

Figure 1

Figure 1. Flowchart of the LLM-Feynman framework. (I) The input consists of data, meaning,

LLM-Feynman์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์„ ๊ธฐํ˜ธ ํšŒ๊ท€์™€ ๊ฒฐํ•ฉํ•˜์—ฌ ๊ณผํ•™์  ๊ณต์‹์„ ์ž๋™์œผ๋กœ ๋ฐœ๊ฒฌํ•˜๋Š” ํ”„๋ ˆ์ž„์›Œํฌ์ด๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ์ž๋™ํ™”๋œ ํŠน์„ฑ ์—”์ง€๋‹ˆ์–ด๋ง, LLM ๊ธฐ๋ฐ˜์˜ ์ž์ฒด ํ‰๊ฐ€, ๊ทธ๋ฆฌ๊ณ  Monte Carlo tree search๋ฅผ ํ†ตํ•ด ํ•ด์„ ๊ฐ€๋Šฅํ•˜๊ณ  ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅํ•œ ๊ณผํ•™ ๊ณต์‹์„ ๋ฐœ๊ฒฌํ•œ๋‹ค.

Motivation

Achievement

Figure 2

Figure 2. Performance of the LLM-Feynman framework. Comparison of (a) 1โˆ’R2 vs.

How

Figure 1

Figure 1. Flowchart of the LLM-Feynman framework. (I) The input consists of data, meaning,

Originality

Limitation & Further Study

ํ›„์† ์—ฐ๊ตฌ: ๊ณ„์‚ฐ ํšจ์œจ์„ฑ ๊ฐœ์„ , ๋‹ค์–‘ํ•œ LLM ๋ชจ๋ธ ๋น„๊ต, ์™ธ์‚ฝ์„ฑ ํ‰๊ฐ€, ๋” ๊ด‘๋ฒ”์œ„ํ•œ ๋„๋ฉ”์ธ ์‘์šฉ ํ™•๋Œ€

Evaluation

Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: LLM-Feynman์€ ๋„๋ฉ”์ธ ์ง€์‹๊ณผ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์„ ๊ธฐํ˜ธ ํšŒ๊ท€์™€ ์ฐฝ์˜์ ์œผ๋กœ ๊ฒฐํ•ฉํ•˜์—ฌ ํ•ด์„ ๊ฐ€๋Šฅํ•˜๊ณ  ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅํ•œ ๊ณผํ•™ ๊ณต์‹ ๋ฐœ๊ฒฌ์˜ ์ƒˆ๋กœ์šด ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์ œ์‹œํ•œ๋‹ค. Feynman ๊ณต์‹์˜ 90% ์ด์ƒ ์žฌ๋ฐœ๊ฒฌ๊ณผ ๋‹ค์–‘ํ•œ ์žฌ๋ฃŒ ๊ณผํ•™ ์‘์šฉ์—์„œ์˜ ์„ฑ๊ณผ๋Š” ๋ฐฉ๋ฒ•์˜ ์‹คํšจ์„ฑ์„ ์ž…์ฆํ•œ๋‹ค. ๋‹ค๋งŒ LLM ํŠนํ™”์„ฑ, ๋„๋ฉ”์ธ ์ง€์‹ ์‚ฌ์ „ ์š”๊ตฌ, ๊ณ„์‚ฐ ๋น„์šฉ ๋“ฑ์— ๋Œ€ํ•œ ์‹ฌํ™” ๋ถ„์„์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
502๋ฒˆ ๋…ผ๋ฌธ์€ LLM์ด ๊ณผํ•™์  ๋ฒ•์น™์˜ ์ž๋™๋ฐœ๊ฒฌ(์˜ˆ: ํŒŒ์ธ๋งŒ์˜ ๋ฐฉ์ •์‹)์— ์‚ฌ์šฉ๋œ ์„ ํ–‰ ์—ฐ๊ตฌ๋กœ, 533๋ฒˆ์˜ ๋ฉ”ํƒ€-์‹คํ—˜ ์„ค๊ณ„ ์•„์ด๋””์–ด์˜ ํ† ๋Œ€์ž…๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋ฐฉ์ •์‹ ๋ฐœ๊ฒฌ์˜ ์ด๋ก ์  ๋ฐฉ๋ฒ•๊ณผ ํ‰๊ฐ€ ์ฒด๊ณ„๋ฅผ ์ œ์‹œํ•˜์—ฌ 502์˜ ์—ฐ๊ตฌ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋ณด์™„ํ•ด์ค€๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Œ€์นญ์„ฑ ์ •๋ณด๋ฅผ ํ™œ์šฉํ•œ ๋™์—ญํ•™ ์‹œ์Šคํ…œ ๊ณต์‹ ๋ฐœ๊ฒฌ์˜ ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•˜์—ฌ, ๋ณธ ๋…ผ๋ฌธ์˜ ๋ฐฉ์‹๊ณผ ์กฐํ•ฉ ๊ฐ€๋Šฅ์„ฑ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
502๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๊ณต์‹ ๋ฐœ๊ฒฌ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•ด, 547๋ฒˆ์—์„œ ๋…ผ์˜ํ•˜๋Š” ์ €์ฐจ์› ์ขŒํ‘œ๊ณ„ ๋ฐ ์ง€๋ฐฐ๋ฐฉ์ •์‹ ์ž๋™ํ™”์™€ ์ด๋ก ์  ์—ฐ๊ณ„๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
502๋ฒˆ ๋…ผ๋ฌธ์—์„œ ์†Œ๊ฐœํ•œ LLM ํ™œ์šฉ ๊ณผํ•™์‹ ๋ฐœ๊ฒฌ ๋ฐฉ๋ฒ•๋ก ์ด AlphaEvolve์˜ LLM-์ฝ”๋“œ ๋ฒˆ์—ญ ๋ชจ๋ธ๊ณผ ๊ฐœ๋…์ ์œผ๋กœ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฌผ๋ฆฌ/์ˆ˜ํ•™ ์‹œ์Šคํ…œ์˜ ์ด๋ก  ๋ฐœ๊ฒฌ์„ ์œ„ํ•œ LLM ๊ธฐ๋ฐ˜ ์ˆ˜์‹ ์ถ”๋ก  ๋ฐ ๊ฒ€์ฆ ์ „๋žต์ด SEVerA์˜ ํ˜•์‹์  ์•ˆ์ „์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ์— ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
502 ๋…ผ๋ฌธ์€ LLM์˜ ๋ฌผ๋ฆฌ ๋ชจ๋ธ ๋ฐœ๊ฒฌ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ์†Œ๊ฐœํ•˜๋ฉฐ, 3031์—์„œ ์ƒ์„ฑ๋ชจ๋ธ ํ•™์Šต์œผ๋กœ ์ž๋ฐœ์ ์ธ ํ•ด๋ฐ€ํ† ๋‹ˆ์•ˆ ์ถœํ˜„์„ ์ˆ˜ํ•™์ ์œผ๋กœ ํ•ด์„ํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ”„๋กœ๊ทธ๋ž˜๋ฐ ๊ธฐ๋ฐ˜ LLM ๊ณผํ•™ ๋ฐฉ์ •์‹(๊ณต์‹) ๋ฐœ๊ฒฌ ์‹œ์Šคํ…œ์œผ๋กœ, 502์™€ ์œ ์‚ฌ ๋ฌธ์ œ์— ๋‹ค๋ฅธ ์ ‘๊ทผ์„ ์‹œ๋„ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
502 ๋…ผ๋ฌธ์€ LLM์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ฒ”์šฉ ๋ฌผ๋ฆฌ๊ณต์‹์˜ ํ”„๋กœ๊ทธ๋ž˜๋ฐ์  ๋ฐœ๊ฒฌ์— ์ดˆ์ ์„ ๋งž์ถฐ, 232์™€์˜ ์ ‘๊ทผ ๋ฐ ๊ฒฐ๊ณผ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
502 ๋…ผ๋ฌธ ์—ญ์‹œ LLM ๊ธฐ๋ฐ˜ ์ˆ˜์‹/๊ณผํ•™ ๋ฐฉ์ •์‹ ๋ฐœ๊ฒฌ์„ ๋‹ค๋ฃจ๋‚˜, 289์—์„œ๋Š” ๋ฐ์ดํ„ฐ-์ด๋ ฅ ๊ธฐ๋ฐ˜ ์ด์ค‘์ถ”๋ก , 502์—์„œ๋Š” ์œ ๋‹ˆ๋ฒ„์„ค ๊ณต์‹ํ™”๋ฅผ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM๊ณผ ๋„๊ตฌ ํ™œ์šฉ ๊ธฐ๋ฐ˜์˜ ์ฆ๊ฑฐ ์ƒ์„ฑ ๋ฐ ๊ฒ€์ฆ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, AgentMD์˜ ์ž„์ƒ ํŒ๋‹จ ์‹ ๋น™์„ฑ ๋ณด์™„ ๋ฐฉ๋ฒ• ์ œ๊ณต.
ํ›„์† ์—ฐ๊ตฌ
547๋ฒˆ ๋…ผ๋ฌธ์€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์„ ํ†ตํ•œ ๊ณ ์ฐจ์› ๋ฐ์ดํ„ฐ์˜ ๋ฐฉ์ •์‹ ๋ฐœ๊ฒฌ์œผ๋กœ, 502๋ฒˆ ๋…ผ๋ฌธ์˜ ๊ณผํ•™ ๊ณต์‹ ์ž๋™ํ™” ์ ‘๊ทผ์„ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
504๋ฒˆ ๋…ผ๋ฌธ์€ ๋ฐฉ์ •์‹ ๋ฐœ๊ฒฌ ๋ฒค์น˜๋งˆํฌ๋กœ์จ, 502๋ฒˆ์˜ ์„ฑ๋Šฅ๊ณผ ๋ฐฉ๋ฒ•๋ก ์ด ์‹ค์ œ๋กœ ์–ด๋–ป๊ฒŒ ํ‰๊ฐ€๋˜๋Š”์ง€ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
502 ๋…ผ๋ฌธ์€ 085์˜ ์ž์—ฐํ˜„์ƒ์—์„œ ๋ฌผ๋ฆฌ ๋ฒ•์น™์„ ๋ฐœ๊ฒฌํ•˜๋Š” LLM ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์„ ๋”์šฑ ์ผ๋ฐ˜ํ™”๋œ ์ˆ˜์‹ ๋ฐœ๊ฒฌ ์˜์—ญ์œผ๋กœ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
A comprehensive survey of cross-domain policy transfer ๋…ผ๋ฌธ์€ ์ž๋™ํ™”๋œ ๊ณผํ•™ ๊ณต์‹ ๋ฐ ์ตœ์ ํ™” ๋ฐœ๊ฒฌ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์‹ค์ œ ๋‹ค๋ถ„์•ผ ์‘์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ๋“œ๋Ÿฌ๋ƒ…๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
LLM๊ณผ ์ตœ์ ํ™”๋กœ ํ•ด์„ ๊ฐ€๋Šฅํ•œ ๊ณผํ•™๊ณต์‹ ํƒ์ƒ‰์— ์„ฑ๊ณตํ•˜์—ฌ, 482์˜ ์ž์—ฐ์–ด ์‚ฌ๊ณ -์ฆ๋ช… ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ์‹ค์ œ ๊ณผํ•™์  ๋ฐœ๊ฒฌ์— ์–ด๋–ป๊ฒŒ ์—ฐ๊ฒฐ๋˜๋Š”์ง€๋ฅผ ๋ณด์—ฌ์ค€๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •