Essence
Figure 1: The LLM-SR framework, consisting of three main steps: (a) Hypothesis Generation, where
LLM-SR์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ์ ๊ณผํ ์ง์๊ณผ ์ฝ๋ ์์ฑ ๋ฅ๋ ฅ์ ํ์ฉํ์ฌ ๋ฐ์ดํฐ๋ก๋ถํฐ ๊ณผํ ๋ฐฉ์ ์์ ๋ฐ๊ฒฌํ๋ ํ๋ ์์ํฌ๋ก, ๋ฐฉ์ ์์ ํ๋ก๊ทธ๋จ์ผ๋ก ํํํ๊ณ ์งํ ํ์๊ณผ ๊ฒฐํฉํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: LLM-SR์ ๊ณผํ์ ๋ฐฉ์ ์ ๋ฐ๊ฒฌ์ด๋ผ๋ ์ค์ํ ๋ฌธ์ ์ ๋ํด LLM์ ๊ฐ์ ์ ์ฐฝ์์ ์ผ๋ก ํ์ฉํ๋ ํ์ ์ ์ธ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ฉฐ, ์คํ์ ์ผ๋ก ์ฐ์ํ ์ฑ๋ฅ์ ์
์ฆํ๋ค. LLM ์๊ธฐ ์ํ์ ๊ณ ๋ คํ ์ ์คํ ๋ฒค์น๋งํฌ ์ค๊ณ์ ํฌ๊ด์ ์ธ ํ๊ฐ๊ฐ ์ด ์์
์ ์ ๋ขฐ์ฑ์ ๋์ธ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
์์น๋ฐฉ์ ์์ ๋์นญ์ฑ ๊ธฐ๋ฐ ๋ฐ๊ฒฌ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ฉฐ, LLM-SR๊ณผ ๊ฐ์ ํ๋ก๊ทธ๋๋ฐ ๊ธฐ๋ฐ ์๋ ๋ฐฉ์ ์ ๋ฐ๊ฒฌ์ ํต์ฌ์ ์ด๋ก ์ ์ ์ํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM-SR ๋
ผ๋ฌธ์ LLM์ด ํ๋ก๊ทธ๋๋ฐ์ ํตํ ๊ณผํ ๋ฐฉ์ ์ ๋ฐ๊ฒฌ์ ์ด๋ป๊ฒ ์ ๊ทผํ๋์ง์ ๋ํ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
25๋ฒ ๋
ผ๋ฌธ์ ์์ฌ ๊ณผํ์์์ LLMยทFM ์์ฉ ๋ฆฌ๋ทฐ๋ก, LLM-SR ๊ฐ์ด ๊ณผํ ๋
ผ๋ฆฌ ๋ฐ๊ฒฌ์ ํ์ฉ๋ ์ธ๊ณต์ง๋ฅ ๋ฐฉ๋ฒ๋ก ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
289๋ฒ ๋
ผ๋ฌธ์ ๊ฒฝํ ๊ธฐ๋ฐ/๋ฐ์ดํฐ ๊ธฐ๋ฐ ์ด์ค ์ถ๋ก ์ ๋ชฉ์ ํตํ ๊ณผํ ๋ฐฉ์ ์ ๋ฐ๊ฒฌ์ ์๋ํ๋ฏ๋ก, 2209์ LLM ํ๋ก๊ทธ๋จ-๊ธฐ๋ฐ ๋ฐฉ์ ์ ํ์๊ณผ์ ๋ฐฉ๋ฒ๋ก ์ ์ฐจ์ด๋ฅผ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM-Feynman ๋
ผ๋ฌธ์ LLM์ ํ์ฉํด ๊ณผํ ๋ฒ์น ๋ฐ๊ฒฌ์ ์๋ํํ์ฌ, LLM-SR์ด ์ถ๊ตฌํ๋ ๋ฐฉ์ ์ ๋ฐ๊ฒฌ์ ๋๋ค๋ฅธ ์คํ ์ฌ๋ก์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ธฐ๊ณํ์ต๊ณผ ๋ฌผ๋ฆฌ์ ๋์นญ์ฑ์ ๊ฒฐํฉํ์ฌ ๊ณผํ์ ๋ฒ์น์ ๋ฐ์ดํฐ๋ก๋ถํฐ ํ์ตํ๋ ์ ์ฌํ ๋ฐฉ๋ฒ๋ก ์ ์ ๊ทผ์ ๊ณต์ ํ๋ค.
ํ์ ์ฐ๊ตฌ
623๋ฒ ๋
ผ๋ฌธ์ ์๋ฆฌ ๊ธฐ๋ฐ ๋ค์ค ์์ด์ ํธ ๊ณผํ ๋ฐ๊ฒฌ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ, 2209์ LLM-SR ํ๋ ์์ํฌ์ ํจ๊ป ๊ณผํ ๋ฐฉ์ ์ ๋ฐ๊ฒฌ ์์คํ
์ ์ค์ง์ ํ์ฅ์ฑ์ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM-SRBench๋ LLM-SR ํ๋ ์์ํฌ์ ์์ด์ ํธ ๊ธฐ๋ฐ ๊ณผํ ๋ฐฉ์ ์ ๋ฐ๊ฒฌ ์ฑ๋ฅ์ ์ฒด๊ณ์ ์ผ๋ก ์ธก์ ํ๋ฉฐ ์ค์ ๋ฒค์น๋งํฌ๋ก ์ด์ด์ง๋ค.
ํ์ ์ฐ๊ตฌ
2209๋ฒ ๋
ผ๋ฌธ์ ๊ณผํ ๋ฐฉ์ ์ ์๋ ๋ฐ๊ฒฌ์ด๋ผ๋ ์์ฉ ์ธก๋ฉด์์ 142๋ฒ์ ์๋ ์๋ฒ ์์คํ
์ด ์ค์ ๊ณผํ ๋ฐ์ดํฐ ํด์ ๋ฐ ๋ฐฉ์ ์ ๋ฐ๊ฒฌ์ ์ง์ ์ ์ฉ๋ ์ ์๋ ํ์ฅ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค๋๋ค.
์์ฉ ์ฌ๋ก
2209๋ฒ ๋
ผ๋ฌธ์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ์ ํ์ฉํ ๊ณผํ ๋ฐฉ์ ์ ๋ฐ๊ฒฌ์์ ํ๋ก๊ทธ๋จํ๋ ํ
์ด๋ธ ๊ธฐ๋ฐ ํ๊ธฐยท์ฐ์ฐ์ ์ฌ์ฉํด 841์ ํ
์ด๋ธ ๊ตฌ์กฐ ์ถ๋ก ๊ณผ ์ฐ๊ด์ด ๊น์ต๋๋ค.