์ ์: Abbi Abdel-Rehim, Hector Zenil, Oghenejokpeme Orhobor, Marie Fisher, Ross J. Collins, Elizabeth Bourne, Gareth W. Fearnley, Emma Tate, Holly X. Smith, Larisa N. Soldatova, Ross King | ๋ ์ง: 06/2025 | DOI: 10.1098/rsif.2024.0674 📄 PDF
Essence
Figure 1. The overall structure of our experiments. GPT4 was previously trained on data on a large fraction of the text
GPT-4๋ฅผ ์ด์ฉํ์ฌ ์ ๋ฐฉ์ ์น๋ฃ๋ฅผ ์ํ ์๋ก์ด ์ฝ๋ฌผ ์กฐํฉ ๊ฐ์ค์ ์์ฑํ๊ณ ์คํ์ค์์ ๊ฒ์ฆํ์ฌ, LLM(Large Language Model)์ด ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ๊ฐ์น ์๋ ๋๊ตฌ์์ ์
์ฆํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ์ฐ๊ตฌ๋ LLM์ด ๋จ์ํ ์ ๋ณด ๋๊ตฌ๋ฅผ ๋์ด ๊ณผํ์ ๋ฐ๊ฒฌ์ ์ค์ง์ ํํธ๋๊ฐ ๋ ์ ์์์ ์ต์ด๋ก ์๊ฒฉํ๊ฒ ์
์ฆํ ํ๊ธฐ์ ์ฐ๊ตฌ์ด๋ค. ์ฝ๋ฌผ ์กฐํฉ ๊ฐ๋ฐ์ด๋ผ๋ ์์์ ์ผ๋ก ์ค์ํ ๋ถ์ผ์์ ์คํ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ฃผ์์ผ๋, ํต๊ณ์ ๊ฒฌ๊ณ ์ฑ๊ณผ ๋ฉ์ปค๋์ฆ ๊ท๋ช
์ ์ํ ์ถ๊ฐ ์ฐ๊ตฌ๊ฐ ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
719๋ LLM ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ํ์์ ์๋ฆฌ๋ฅผ ์ ์ํ์ฌ AlphaFold์ ํ์ ์ ๋ฐ๊ฒฌ์์ ๋ํ๋ AI-์ฃผ๋ ๊ณผํ๋ฐ๊ฒฌ ํ๋ ์์ํฌ์ ์ด๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419 ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ๊ฐ๋
๋ฐ ๊ธฐ๋ฒ์ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ์ฌ, 719์ ๊ฐ์ค ์์ฑ ์ค์ฆ ์ฐ๊ตฌ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Scientific hypothesis generation by large language models ๋
ผ๋ฌธ์ LLM์ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ํ์ฉํ๋ ๊ธฐ๋ณธ ํ๊ณ์ ๋ฌธ์ ๋ฅผ ์ข
ํฉ์ ์ผ๋ก ๊ณ ์ฐฐ, KG-CoI ์์คํ
์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ํ์ฑํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM์ ๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ฐ ์ถ๋ก ์ฑ๋ฅ ๋ฉ์ปค๋์ฆ์ด ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์๋ฎฌ๋ ์ด์
๋ฐฉ์๊ณผ ๊ทผ๋ณธ์ ์ผ๋ก ์ฐ๊ณ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
579 ๋
ผ๋ฌธ์ ๊ณผํ์ ์ฃผ์ฅ ์์ฑ ๋ฐ ๊ฒ์ฆ์ ์ํ ๋ฐ์ดํฐ๋ง์ด๋ ๋ฐฉ์์ ์ ์ํด 719์ LLM ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ์ ๊ธฐ์ด๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ ๋ขฐํ ์ ์๋ ๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ฐ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ํตํด ์คํ์ค ๊ฒ์ฆ ์ฐ๊ตฌ์ ์ ๋ขฐ์ฑ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Scientific hypothesis generation by large language models ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ์ ๊ณผํ์ ๊ฐ์ค ๋ฐ ์คํ ์์ธก์ ์ด๋ก ์ ๊ทผ๊ฑฐ์ ์ฐ๊ตฌ๋ํฅ์ ์ ์ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ๊ฐ์ค ์์ฑ์ LLM์ ์ ์ฉํ ์ฌ๋ก๋ฅผ ์ค์ฌ์ผ๋ก, 002์ ๋ค์ํ ์์ฉ์ด ๊ณผํ์ ๋ฐ๊ฒฌ์ ์ด๋ป๊ฒ ๊ธฐ์ฌํ๋์ง ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์ดํดํ ์ ์๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Scientific hypothesis generation by large language models(719)์ LLM ๊ธฐ๋ฐ ์์ด๋์ด ๋ฐ ๊ฐ์ค ์์ฑ์ ์๋ฆฌ์ ํ๊ณ๋ฅผ ๋
ผ์ํ๋ฉฐ, 425์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์์ด๋์ด ํฅ์ ๊ธฐ๋ฒ์ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
719๋ LLM ๊ธฐ๋ฐ ๊ฐ๋ฐฉํ ๊ณผํ ๊ฐ์ค์์ฑ์ ์ ์ฌ๋ ฅ๊ณผ ํ๊ณ์ ๋ํ ๋น๊ต ํ๊ฐ๋ฅผ ํตํด, 473 ๋
ผ๋ฌธ์ ์๋ํ ์์คํ
๊ณผ ์ํธ ๋ณด์์ ๋
ผ์๊ฐ ๊ฐ๋ฅํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
SciMON์ ์๋์ผ๋ก ๋ฌธํ์ ๊ทผ๊ฑฐ๋ก ์์ด๋์ด๋ฅผ ์์ฑํ๋ฉฐ, LLM ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ์ ๋ ๋ค๋ฅธ ํ๋ ์์ํฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
763 ๋
ผ๋ฌธ์ ๊ฐ์ค์์ฑ์ ๊ตฌ์กฐํ๋ ๋
ผ๋ฌธ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ผ๋ก ์ ๊ทผํ๋ ๋ฐ๋ฉด, 719๋ ์์ ํ์ฉ์ ์ํ ์คํ์ ๊ฒ์ฆ์ ๊ฐ์กฐํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
668๋ฒ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ์ ๋ฐ๋ณต์ ์ธ ์์ด๋์ด ์์ฑ ๋ฐฉ์์ ์ ์ํ์ฌ, LLM์ ๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ฅ๋ ฅ์ ๋ค๋ฅธ ๋ฌธ์ ์์ญ์์ ํ๊ฐํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
โScientific hypothesis generation by large language modelsโ๋ LLM์ ๊ฐ์ค ์์ฑ ๋ฅ๋ ฅ์ ํ๊ฐํ๋ฏ๋ก, ๋ด๋ถ ๊ตฌ์กฐํ์ต๊ณผ ๊ฐ์ค ํ๊ฐ ๊ด์ ์์ ์ํธ๋ณด์์ ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
Scientific hypothesis generation by large language models ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ณผํ์ ์ฐ๊ตฌ ์ฃผ์ ๋ฐ ์กฐํฉ ์์ธก์ ์๋ํ ์ฐ๊ตฌ๋ก์, 3212์ ์ฌ๋ฃ๊ณผํ ํนํ ์์ด๋์ด ์์ธก๊ณผ ๋น๊ตํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ LLM ์์ด๋์ด ์์ฑ ๋ฐ ๊ฐ์ค ์์ฑ ๋ฐฉ๋ฒ์ ์ค์ ์คํ๊ฒ์ฆ ๋จ๊ณ๋ก ํ์ฅํ์๋ค.
ํ์ ์ฐ๊ตฌ
418๋ฒ ๋
ผ๋ฌธ์ LLM์ ํ์ฉํ ์์ฌ ๋ฐ๊ฒฌ ๊ฐ์ค ์์ฑ ๋ฐฉ๋ฒ์ ๋ค๋ฃจ์ด, 719๋ฒ๊ณผ ๋น์ทํ AI ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ์ ์์ฌ ๊ณผํ์ ์์ฉํ๋ค.
ํ์ ์ฐ๊ตฌ
777 ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ฐ์ค ํ์ ๋ฐ ํ์ ์ผ์ฑ ๋ฐฉ์์ ๊ตฌ์กฐ์ ๋ถ์๊ณผ ์ ๋์ ์งํ ๋์
์ผ๋ก ํ์ฅํ์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ฐ ๋งคํ ๋ฅ๋ ฅ์ ํ๊ฐ๋ฅผ ํตํด, 621์ PINN-Kalman ์ตํฉ๋ฐฉ๋ฒ์ด ์ค์ธ๊ณ ๋ฌธ์ ํด๊ฒฐ์ ๋ฏธ์น๋ ์ํฅ์ ๋ถ์ํ๋ค.