How
- ์ด๊ธฐ ๊ฐ์ค ์์ฑ(Initialization): ํ๋ จ ์งํฉ S์ ๋ถ๋ถ์งํฉ S_init์ ๋ํด LLM์ ํ๋กฌํํธํ์ฌ ๊ณ ์์ค์ ๊ฐ์ค๋ค ์์ฑ โ ์ด๊ธฐ ๊ฐ์ค ์ํ H ๊ตฌ์ฑ
- ๋ฐ๋ณต์ ๊ฐ์ค ์
๋ฐ์ดํธ(Iterative Update):
- ๊ฐ ํ๋ จ ์์ s์ ๋ํด ํ์ฌ ๊ฐ์ค ํ์์ ๋ณด์์ด ๋์ ์์ k๊ฐ ๊ฐ์ค ์ ์
- ๊ฐ ๊ฐ์ค์ผ๋ก s๋ฅผ ์์ธกํ๊ณ ์ ํ์ฑ ํ๊ฐ ํ ๋ณด์ ์
๋ฐ์ดํธ
- ์ค์์ธก ๊ฐ์ค ์๊ฐ ์๊ณ๊ฐ ์ด์์ด๋ฉด s๋ฅผ ํ๋ฆฐ ์์ ์ํ W์ ์ถ๊ฐ
- |W|์ด ์ต๋๊ฐ w_max์ ๋๋ฌํ๋ฉด W์ ์์ ๋ค๋ก๋ถํฐ ์ ๊ฐ์ค ์์ฑ ๋ฐ ํตํฉ
- UCB ๊ธฐ๋ฐ ๋ณด์ ํจ์:
```
r_i = [์ ํ๋ ํญ] + ฮฑโ(log t / |S_i|)
```
์ฒซ ๋ฒ์งธ ํญ์ ๊ฐ์ค์ ํ๋ จ ์ ํ๋, ๋ ๋ฒ์งธ ํญ์ ํ์ ๋ณด๋์ค๋ก ์ ํ ๋น๋๊ฐ ๋ฎ์ ๊ฐ์ค์ ์ฅ๋ ค
- ๋ค์ํ ์ถ๋ก ์ ๋ต:
- Best-accuracy hypothesis: ๊ฐ์ฅ ๋์ ์ ํ๋์ ๋จ์ผ ๊ฐ์ค ์ฌ์ฉ
- Filter and weighted vote: ๊ด๋ จ ๊ฐ์ค๋ค ํํฐ๋ง ํ ๊ฐ์ค ํฌํ
- Single-step adaptive inference: ํ ๋ฒ์ ์ฅ๋ฌธ ํ๋กฌํํธ๋ก ๊ฐ์ฅ ์ ์ ํ ๊ฐ์ค ์ ์
- Two-step adaptive inference: ์ ์ ํ ๊ฐ์ค ์ ์ ๊ณผ ์์ธก์ ๋ ๋จ๊ณ๋ก ๋ถ๋ฆฌ
Evaluation
Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ LLM์ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ํ์ฉํ๋ ์๋ก์ด ์๋๋ก, ๋ค์ค ์ฌ๋กฏ ๋จธ์ ์ด๋ก ์ ๊ธฐ๋ฐํ ์ฒด๊ณ์ ์ด๊ณ ์ค์ฉ์ ์ธ ์๊ณ ๋ฆฌ์ฆ์ ์ ์ํ๋ฉฐ ์ค์ฆ์ ์ผ๋ก ๊ฐ๋ ฅํ ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ๋ค. ํนํ ์์ฑ๋ ๊ฐ์ค์ ๋ชจ๋ธ ๊ฐ ํธํ์ฑ๊ณผ ํด์ ๊ฐ๋ฅ์ฑ์ LLM์ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ์์ฌํ๋ ์ค์ํ ๋ฐ๊ฒฌ์ด๋ค. ๋ค๋ง, ๋ ๊น์ ์ด๋ก ์ ๋ถ์๊ณผ ์ค์ ๊ณผํ ์ปค๋ฎค๋ํฐ์์ ํ๋ ฅ์ ํตํ ๊ฐ์ค ํ์ง์ ๊ฒ์ฆ์ด ์ด๋ฃจ์ด์ง๋ค๋ฉด ๋์ฑ ์ค๋๋ ฅ ์๋ ๊ธฐ์ฌ๊ฐ ๋ ๊ฒ์ผ๋ก ๊ธฐ๋๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Hypothesis Generation with Large Language Models ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ณผํ์ ์์ด๋์ด ์์ฑ ๊ธฐ๋ฒ์ ์ด๋ก ์ ์ผ๋ก ๋ถ์ํ์ฌ PaperRobot์ ๊ทผ๊ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ฒ ๋
ผ๋ฌธ์ LLM์ ํ์ฉํ ๊ณผํ์ ๊ฐ์ค ์์ฑ ์ผ๋ฐ๋ก ์ ๋ค๋ค, 882๋ฒ์ LLM๊ณผ ์ธ์ฉ ๋ถ์ ์ ์ ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ผ๋ก ์ ํฉํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ LLM์ ๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ฅ๋ ฅ์ ๋น๊ต ํ๊ฐํ๋ ์ด๋ก ์ /๋ฒค์น๋งํฌ์ ๋ฐฐ๊ฒฝ์ ์ ์ํด, 468์ zero-shot ๋ฅ๋ ฅ ๋
ผ์๋ฅผ ์ฌํํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ์ ํตํ ๊ณผํ์ ๊ฐ์ค ์์ฑ ๊ธฐ์ด์ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ก ์ ํ๊ณ๋ฅผ ์ค๋ช
ํ์ฌ, ๋ณธ ๋
ผ๋ฌธ์ด ์ด๋ฃฌ ๋์ฝ์ ์ดํดํ๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Hypothesis Generation with Large Language Models ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ ๊ธฐ๋ณธ ์๋ฆฌ๋ฅผ ์ ๋ฆฌํ์ฌ KG-CoI ์์คํ
์ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ LLM ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ์ด์ ์ ๋ง์ถ ๋
ผ๋ฌธ์ผ๋ก, MOOSE-Chem์ unseen hypothesis discoverability ์ฃผ์ ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ฒ ๋
ผ๋ฌธ์ LLM์ ํ์ฉํ ๊ฐ์ค ์์ฑ๊ณผ์ ์์ฒด๋ฅผ ๋ค๋ฃจ๋ฉฐ ๋์กฐํ์ต ๊ธฐ๋ฐ ์ฝ๋ฌผ-์ง๋ณ ์ํธ์์ฉ ๋ชจ๋ธ๋ง๊ณผ ์ฐ๊ฒฐ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Hypothesis Generation with Large Language Models ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ฐ์ค์์ฑ ๋ฐฉ๋ฒ๋ก ์ ๋ํ ๊ธฐ๋ฐ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ์ฌ, ํตํฉ์ ๊ฐ์ค ์์ฑ ๋ชจ๋ธ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
669์์ ์ ์๋ LLM ๊ธฐ๋ฐ ๊ณผํ์ ์๊ฐ/๊ฐ์ค์์ฑ-์์ํ ํ๋ก์ธ์ค๋ 419์ LLM ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ ์๋ฆฌ์ ์ง์ ์ฐ๊ฒฐ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ LLM ๊ธฐ๋ฐ ๊ณผํ ๊ฐ์ค ์์ฑ์ ๊ทผ๊ฐ ๊ฐ๋
๊ณผ ํ๊ณ๋ฅผ ์ค๋ช
ํ์ฌ, 820์ ์ ๋ขฐ์ฑ ํ๊ฐ์ ๋์์ฑ
์ค์ ์ ๋ฐฐ๊ฒฝ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ฒ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค์์ฑ ๋ฐ ๊ด๋ จ ๋
ผ๋ฌธ ๊ฒ์ ์ด๋ก ์ ์ ๊ณตํ์ฌ, 540๋ฒ ๋
ผ๋ฌธ์ ๋ฐฉ๋ฒ๋ก ์๊ฐ ๊ฒ์ ์์
์ ์์ ์ด๋ก ์ ํ ๋๋ฅผ ๋ง๋ จํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ฒ์ LLM ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ฉ์ปค๋์ฆ์ ์์ธํ ๋ค๋ฃจ์ด, 631๋ฒ์ ํ์ฅ์คํ(outcome) ์์ธก ํ์คํฌ๊ฐ ์ด๋ค ์ ์ ์ ํ๊ณ ์์ ์ค๊ณ๋๋์ง ์ดํด๋ฅผ ๋๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
GraphEval์ ๊ณผํ ์์ด๋์ด ํ๊ฐ ํ๋ ์์ํฌ๋ LLM ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ์ ๊ดํ ์ต์ ์ฐ๊ตฌ์ ์ด๋ก ์ ํ ๋ ์์์ ๊ตฌ์ถ๋์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ LLM ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ฐฉ๋ฒ๋ก ์ ๋์ ์๊ฐ์์ ๋ถ์ํ์ฌ, 763์ ๋ฐ์ดํฐ์
์ค๊ณ์ ํ๊ฐ์ ๋ถ์ ํ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ LLM ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ฐฉ๋ฒ์ ์ข
ํฉ์ ์ผ๋ก ๊ฒํ ํ๋ฉฐ, 149์ ๋ฒ ์ด์ง์ยท์ ๋ณด์ด๋ก ๊ธฐ๋ฐ HypoAgents ๊ฐ๋ฐ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ ๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ฐ reasoning ํ๊ฐ์ ์ด๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํ์ฌ, 837์ ๋๋ฉ์ธ ํนํ reasoning ์คํ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Hypothesis Generation with Large Language Models ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ์ ์ด๋ก ๋ฐ ์ ๊ทผ๋ฐฉ์์ ์ข
ํฉ์ ์ผ๋ก ๋ค๋ฃจ๋ฉฐ, 330์ ๊ฐ์ค ํ๊ฐ ์๋ํ ๋
ผ๋ฆฌ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ LLM ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ชจ๋ธ์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ์ฌ, 711์ SLR/์ฃผ์ฅ ๊ฒ์ฆ ์์คํ
์ ์ด๋ก ์ ๋ฐํ์ ์ค๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ LLM์ ํ์ฉํ ๊ณผํ์ ๊ฐ์ค ์์ฑ ์ฐ๊ตฌ๋ก, 724์ AI4Science readiness ํ๊ฐ์ ๊ฐ๋
์ ๊ธฐ๋ฐ์ ํ์ฑํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
A Survey on Hypothesis Generation for Scientific Discovery ๋
ผ๋ฌธ์ LLM์ ์ด์ฉํ ํ์-ํ์ฉ ๊ตฌ์กฐ์ ๊ณผํ์ ๊ฐ์ค ์์ฑ ์ฐ๊ตฌ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์์ธํ ์ค๋ช
ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ LLM์ ํ์ฉํ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ๊ธฐ์ด ์๋ฆฌ๋ฅผ ๋ค๋ฃจ๋ฉฐ, 666์ ์ฐ๊ตฌ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419 ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ๊ฐ๋
๋ฐ ๊ธฐ๋ฒ์ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ์ฌ, 719์ ๊ฐ์ค ์์ฑ ์ค์ฆ ์ฐ๊ตฌ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Hypothesis Generation with Large Language Models ๋
ผ๋ฌธ์ HypoChainer์ ๊ณผํ์ ๋ฐ๊ฒฌ ์ง์์ ์ํ LLM ๊ธฐ๋ฐ ๊ฐ์ค์์ฑ ์์คํ
์ ๊ทผ๊ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
AI ๊ธฐ๋ฐ ๊ณผํ์ ์ํ ๊ฐ๋
์ ํ ๋์ ์ด๋ก ์ ๋
ผ์๋ฅผ ํตํด, 419์ LLMยทRAG ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ ์์คํ
์ ๋ฏธ๋ ๋ฐฉํฅ์ ์ด๋ก ์ ํต์ฐฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ํ์ธ์ด๋ชจ๋ธ์ ํตํ ์๋ฏธ๋ก ์ ๊ฐ๋
์ง๋ ๊ตฌ์ถ ๋ฐ ์ ๊ณผํ์ ๊ฐ์ค ์์ธก์ ์ด๋ก ์ ๋
ผ์๊ฐ ์ฌ๋ฃ๊ณผํ ๋ฏธ๋ ์ฃผ์ ์์ธก ์์คํ
์ ๊ธฐ์ด์ ์ฐ๊ฒฐ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ zero-shot ๊ฐ์ค ์์ฑ ๋ฅ๋ ฅ์ ๋ถ์ํด HypoGeniC๊ณผ ํ์ ์ ๋ต์ ํจ๊ณผ ์ฐจ์ด๋ฅผ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Sparks of science ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ์ ๊ตฌ์กฐํ๋ ๋
ผ๋ฌธ ์ ๋ณด ํ์ฉ์ ํตํ ๊ฐ์ค ์์ฑ์ ๋๋ค๋ฅธ ์ค์ ์ ์ฉ ์ฌ๋ก๋ฅผ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ ๋
ผ๋ฌธ ๋ชจ๋ LLM ๊ธฐ๋ฐ ๊ณผํ ๊ฐ์ค ์์ฑ์ ํ๊ฐ์ ์ต์ ํ์ ๊ด๋ จ๋์ด ์์ผ๋ฉฐ, ํ๊ฐ ๋ฒค์น๋งํฌ์ ๋ฐฉ๋ฒ๋ก ์ฐจ์ด๋ฅผ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ํ๋ ๊ณผํ์ ๋ฐ๊ฒฌ ๋ฐ ๊ฐ์ค ์์ฑ์ ์ํ AI ์์คํ
์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
419๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ํ์ฉํ ๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ฐฉ๋ฒ๋ก ์ ์๊ฐํด 632์ ์ฐ๊ตฌ ๋ฐฉํฅ ์์ธก์ ํ ๋จ๊ณ ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
๊ฐ์ค ์์ฑ์ ์ง์๊ทธ๋ํ(KG)์ ๊ฒฐํฉํด ๊ฐํํ๋ ๋
ผ๋ฌธ์ผ๋ก, 419์ LLM ๊ธฐ๋ฐ ๋ฐ๋ณต์ ๊ฐ์ค ํ์์ ๊ตฌ์กฐ์ ์ ๋ณด ํ์ฉ์ด๋ผ๋ ์๋ก์ด ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
425๋ ์ค์ ์ฐ๊ตฌ์์ ์์ด๋์ด ์์ฑ ๋ณด์กฐ ํจ๊ณผ์ ๊ฒ์ฆ ๊ณผ์ ์ ๋ค๋ฃจ์ด, 419์ ์๋ ๊ฐ์ค ์์ฑ ๊ฒฐ๊ณผ์ ์ธ๊ฐ ์ํธ์์ฉ ๋ฐ ๊ฒ์ฆ ์ธก๋ฉด์ ๋ํด์ค๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ์ ๊ฐ์ค ์์ฑ์์ RAG(๊ฒ์-์ฆ๊ฐ์์ฑ) ๊ธฐ๋ฐ ๋ฐ๋ณต์ ๊ฐ์ค ์
๋ฐ์ดํธ๋ผ๋ ์์ด๋์ด๊ฐ HiPerRAG์ ๋์ฉ๋ ๊ณผํ๋
ผ๋ฌธ ์ฒ๋ฆฌ ๋ฐ ์ฆ๊ฑฐ ๊ธฐ๋ฐ QA์ ์๋์ง๋ฅผ ์ด๋ฃน๋๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ ์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ ํ๋ ์์ํฌ ๋
ผ๋ฌธ์ HypoGeniC์ ํ์-ํ์ฉ ๊ธฐ๋ฐ ์๋ ๊ฐ์ค ์์ฑ์ ๊ตฌ์กฐ์ ํ์ฅ ์์๋ฅผ ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM์ ํ์ฉํ ์๋ฌผํ์ ๊ฐ์ค ์์ฑ ๋ฐ ๋ฐ์ดํฐ ํด์ ์๋ํ ์ฌ๋ก๋ก, ์ฐจ์ธ๋ ๋จ์ผ์ธํฌ ๋ถ์์ LLM ์ ์ฉ์ ํ์ฅ ๋ฐฉํฅ์ฑ์ ์ ์ํฉ๋๋ค.
์์ฉ ์ฌ๋ก
ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ํ์ฉํ ๊ณผํ์ ๊ฐ์ค ์์ฑ ์ฌ๋ก๋ก, LLM์ ์ถ๋ก ๋ฅ๋ ฅ ๊ฒํ ์ ์ฐ๊ณํด ์ค์ ํ์ฉ ๋ฐฉ์์ ๋ณด์ฌ์ค๋ค.