Essence
Fig. 1. SciMuse suggests research ideas or collaborations using a knowledge graph and GPT-4. (a), Knowledge
SciMuse๋ 5,800๋ง ๊ฐ์ ์ฐ๊ตฌ๋
ผ๋ฌธ๊ณผ LLM์ ํ์ฉํ์ฌ ๊ฐ์ธํ๋ ์ฐ๊ตฌ ์์ด๋์ด๋ฅผ ์์ฑํ๊ณ , 100๋ช
์ด์์ ์ฐ๊ตฌ ๊ทธ๋ฃน ๋ฆฌ๋์ ํ๊ฐ๋ฅผ ํตํด AI ์์ฑ ์์ด๋์ด์ ํฅ๋ฏธ๋๋ฅผ ์์ธกํ๋ ์์คํ
์ ์ ์ํ๋ค.
Achievement
Fig. 2. Large-scale human evaluation within the Max Planck Society. (a)-(b), The map of Germany, based on the
๋๊ท๋ชจ ํ๊ฐ ๋ฐ์ดํฐ ๊ตฌ์ถ: 54๊ฐ ๋ง์คํ๋ํฌ ์ฐ๊ตฌ์์ 110๋ช
์ฐ๊ตฌ ๊ทธ๋ฃน ๋ฆฌ๋๊ฐ 4,451๊ฐ์ ๊ฐ์ธํ๋ ์์ด๋์ด๋ฅผ ํ๊ฐํ์ฌ ์ฝ 25%๊ฐ ํฅ๋ฏธ๋ 4-5๋ฅผ ๋ฐ์
ํฅ๋ฏธ๋ ์์ธก ๋ชจ๋ธ ๊ฐ๋ฐ: supervised neural network์ unsupervised zero-shot LLM ranking์ ํตํด ์๋ก์ด ์์ด๋์ด์ ํฅ๋ฏธ๋๋ฅผ ์ ํํ ์์ธก ๊ฐ๋ฅ
Knowledge graph ํน์ฑ ๋ถ์: 8๊ฐ์ง knowledge graph ํน์ฑ(๋
ธ๋ ์ค์ฌ์ฑ, ์ธ์ฉ ์งํ, semantic distance ๋ฑ)๊ณผ ์ฐ๊ตฌ์ ํฅ๋ฏธ๋ ๊ฐ์ ์๊ด๊ด๊ณ ๊ท๋ช
ํ์ ๊ฐ ํ๋ ฅ ๊ธฐํ ๋ฐ๊ตด: ๊ฐ์ ๋ถ์ผ ๋ด ํ๋ ฅ(institutional collaboration)๋ณด๋ค ์๋ก ๋ค๋ฅธ ๋ถ์ผ ๊ฐ ํ๋ ฅ ์์ด๋์ด๊ฐ ๋์ ํฅ๋ฏธ๋๋ฅผ ๋ณด์
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ์ฐ๊ตฌ๋ AI ์์ฑ ์ฐ๊ตฌ ์์ด๋์ด์ ๊ฐ์น๋ฅผ ๋๊ท๋ชจ ์ค์ฆ ํ๊ฐ๋ฅผ ํตํด ๊ฒ์ฆํ ํ๊ธฐ์ ์ธ ๋
ผ๋ฌธ์ด๋ฉฐ, dual prediction ๋ฐฉ์๊ณผ knowledge graph ๊ธฐ๋ฐ ์ฒด๊ณํ๋ฅผ ํตํด ์ค์ฉ์ฑ์ ๋์์ผ๋, ํ๊ฐ์ ๊ตฌ์ฑ์ ๋ถ๊ท ํ๊ณผ ์๊ฐ์ ์ ์ฝ์ด ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ ์ ํํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Improving Scientific Hypothesis Generation with Knowledge Graphs ๋
ผ๋ฌธ์ SciMuse์ ์ ์ฌํ๊ฒ ์ง์๊ทธ๋ํ ๊ธฐ๋ฐ ๊ณผํ์ ์์ด๋์ด ์์ฑ ์ ๊ทผ๋ฐฉ๋ฒ์ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ์ฌ, ๋ณธ ๋
ผ๋ฌธ์ ๋ฐฉ๋ฒ๋ก ์ ๊ทผ๊ฑฐ๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
InfiAgent-DABench๋ ๋ฐ์ดํฐ ๋ถ์ ์์
์ ์์ด์ LLM ๊ธฐ๋ฐ ์์ด๋์ด(ํน์ ๊ฐ์ค) ์์ฑ ๋ฐฉ๋ฒ๋ก ๋ฒค์น๋งํฌ๋ฅผ ์ ๊ณตํด, 434์์ ์ ์ํ ์์ด๋์ด ์์ธก ์ฑ๋ฅ ๊ฒ์ฆ์ ์ฐธ๊ณ ํ ๋งํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
434 ๋
ผ๋ฌธ์ LLM+์ง์๊ทธ๋ํ ๊ธฐ๋ฐ ๊ฐ์ธํ ๊ณผํ์์ด๋์ด ์์ฑ ๋ฐ ์ธ๊ฐํ๊ฐ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํด, 518์ ๋ค์ค ์์ด์ ํธ ํ์
์ ์์ด๋์ด ์์ฑ ๋ชจ๋ธ์ ์ด๋ก ์ ์ถ๋ฐ์ ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ง์๊ทธ๋ํ ๋ฐ LLM, ์์ด์ ํธ ๊ธฐ๋ฐ์ ๊ณผํ์ ์์ด๋์ด ์์ฑ ๋ฐฉ๋ฒ์ ๋ณธ ๋
ผ๋ฌธ์ SciAgents ํ๋ ์์ํฌ ๋ฐ์ ๋ฐฉํฅ๊ณผ ์ฐ๊ฒฐํด๋ณผ ์ ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
434๋ ์ง์๊ทธ๋ํ ๊ธฐ๋ฐ์ผ๋ก ๊ณผํ ์์ด๋์ด๋ฅผ ์์ฑํ๋ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ์ด, 132์์ LLM+KG ์กฐํฉ์ ๊ทผ๊ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM๊ณผ ์ง์ ๊ทธ๋ํ๋ฅผ ํ์ฉํ ๊ณผํ ์์ด๋์ด ์์ฑ ๊ด๋ จ ๋ฐฉ๋ฒ๋ก ์ ์ด๋ก ์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ๋ฏ๋ก ๊ฐ์ด ๋ณด๋ฉด ์ข์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ๊ณผํ ์์ด๋์ด ์์ฑ ๋ฐฉ์์ ์ง์คํ ๋
ผ๋ฌธ์ผ๋ก, ResearchLink์ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ ์ฌ๋ก๋ฅผ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ธ๊ณผ ๊ด๊ณ๋ฅผ ํ์ฉํ ํ
์คํธ ์์ฑ ํ์ง ํฅ์์ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
Knowledge graph๋ฅผ ํ์ฉํ ๊ณผํ ์์ด๋์ด ์ฐ๊ฒฐ/์์ฑ ์ฐ๊ตฌ๋ก ๋
ผ๋ฌธ ๊ฐ ๊ด๊ณ ์ค๋ช
๊ธฐ๋ฅ์ ํ ์ ๊ทผ๋ฒ์ ๋ณด์ฌ์ค๋ค.
๋ค๋ฅธ ์ ๊ทผ
Spacer ๋
ผ๋ฌธ์ deliberate decontextualization ๋ฐฉ์์ผ๋ก ์ ๊ฐ๋
๊ณผํ ์์ด๋์ด ์๋์์ฑ์ ์คํํด, knowledge graph+LLM ๊ธฐ๋ฐ SciMuse ์ ๊ทผ์ ๋์์ด ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
434 ๋
ผ๋ฌธ์ LLM๊ณผ ์ง์๊ทธ๋ํ๋ฅผ ๊ฒฐํฉํ ๊ณผํ์ ์์ด๋์ด ์์ฑ ๋ฐฉ์์ผ๋ก, ๊ฐ๋
์ฒด๊ณ(ontological regime) ์์ ์ธก๋ฉด์์ ์ฐธ๊ณ ๋ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
์์ง๊ณ๋ํ์ ๋คํธ์ํฌ ๋ถ์์ ์ถ๊ฐ์ ์ธ ๊ด์ ์์ ๋ฐ์ ์ํจ๋ค.
ํ์ ์ฐ๊ตฌ
AI ๊ฐ๋
์ง์ ๊ทธ๋ํ์์ ๋งํฌ ์์ธก๊ณผ ๊ณผํ์ ์์ด๋์ด ํ์ฅ์ ๊ดํ ์ฐ๊ตฌ๋ก, ๋ฏธ๋ AI ์ฐ๊ตฌ ๋ฐฉํฅ ์์ธก์ ์ถ๊ฐ์ ์ธ ์ ๊ทผ์ ์ ๊ณตํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
518์ ๋ค์ค LLM ์์ด์ ํธ ํ์
(VIRSCI)์ผ ๋ก, 434์ LLM+์ง์๊ทธ๋ํ ๊ธฐ๋ฐ ๊ฐ์ธํ ์์ด๋์ด ์์ฑ์ ์ง๋จ์ ยท์ํธ์ฐธ์กฐ ํ์ฅ ๋ชจ๋ธ์ด๋ค.
ํ์ ์ฐ๊ตฌ
Interesting scientific idea generation using knowledge graph ๋
ผ๋ฌธ์ ์์ฑํ ์ ๊ทผ๋ฒ์ ๊ณผํ ์์ด๋์ด ์์ฑ/์ฌ๊ตฌ์ฑ์ ์ ์ฉํด Graphusion์ ์ค์ ํ์ฉ ๋ฐฉํฅ์ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
Interesting Scientific Idea Generation using Knowledge Graph(434)์ ์ฆ๊ฑฐ ๊ธฐ๋ฐ ์์ด๋์ด ์ถ์ฒ ์ ๊ทผ์ ํ์ฅํ์ฌ, 420์์ ์ ์ํ ์ฆ๊ฑฐ ์ค์ฌ ์ธ์ฉ ์ถ์ฒ์ ํ์ ์ ํ์ฉ๋๋ฅผ ๋ณด์ฌ์ค๋ค.
ํ์ ์ฐ๊ตฌ
์ง์๊ทธ๋ํ ๊ธฐ๋ฐ์ ์๋ ๊ณผํ ์์ด๋์ด ์์ฑ ๋ฐฉ๋ฒ์ ํตํด, AstroAgents์ ๋ฌธํ ๊ฒํ ์ ๋ฐ์ดํฐ ํด์ ๊ธฐ๋ฅ์ ๋ณด์ํ๋ ๋ฐฉ์์ผ๋ก ํ์ฅ๋ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
Interesting Scientific Idea Generation using Knowledge Graph ๋
ผ๋ฌธ์ ๊ฒฝ์ ํ ์ด์ธ ๋ถ์ผ์์ ์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ๊ณผ ํ๊ฐ๋ฌธ์ ๋ฅผ ์ฌ์ธต ๋ถ์ํ๋ฏ๋ก 631 ์ฃผ์ ๋ฅผ ๋ํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
์ง์๊ทธ๋ํ ๊ธฐ๋ฐ ์์ด๋์ด ์์ฑ ์์คํ
์ฐ๊ตฌ๋ก, LLM ๊ธฐ๋ฐ ์์ด๋์์ด์
์ ๊ตฌ์ฒด์ ๋ฐฉ๋ฒ๋ก ์ผ๋ก ๊ตฌํํ ์ฌ๋ก์ฌ์ 019์ ํ๋ ์์ํฌ์ ์ํธ๋ํ์ฑ ํ์ธ ๊ฐ๋ฅ.
ํ์ ์ฐ๊ตฌ
434์ ์์ด๋์ด ์์ฑ์ ๋
ผ๋ฌธ๊ณผ LLM์ ๊ฒฐํฉํ๋ ์์คํ
(SciMuse)์ผ๋ก, 425์ ๋ฐ์ดํฐ ๋ฐ ์๋ ๊ฒ์ฆ ํ์ฉ ์์ด๋์ด ์์ฑ ํ๋ ์์ํฌ์ ํ์ฅ ์ฌ๋ก์ด๋ค.
ํ์ ์ฐ๊ตฌ
434๋ฒ ๋
ผ๋ฌธ์ ์ง์๊ทธ๋ํ ๊ธฐ๋ฐ ๊ณผํ์ ์์ด๋์ด ์์ฑยท์ถ์ฒ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ, 216๋ฒ์ ์ง์๋ฒ ์ด์ค๋ฅผ ์์ฉํ ์ ์๋ ๊ตฌ์กฐ์ ๋์์ ์ ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
VASPilot ๋
ผ๋ฌธ์ ๋ฉํฐ์์ด์ ํธ ๊ธฐ๋ฐ ๊ฐ์ค ํ์ ๋ฐ ์ถ์ฒ ์์คํ
์ ์ค์ ํํยท์ฌ๋ฃ ๋ถ์ผ์ ์ ์ฉํ์ฌ, SciMuse์ ๋ํ ๋
ผ๋ฌธ DB ๊ธฐ๋ฐ ์์ด๋์ด ์์ฑ ๊ตฌ์กฐ๋ฅผ ํ์ฅ ํ์ฉํฉ๋๋ค.
์์ฉ ์ฌ๋ก
434๋ ์ง์ ๊ทธ๋ํ๋ฅผ ์ด์ฉํ ๊ณผํ ์์ด๋์ด ์์ฑ์์ ๋ฅ๋์ ์ง๋ฌธ ์ ํ ๋ฐฉ์์ ์ค์ ์ฐฝ์์ ์์ด๋์ด ์์ฑ์ ์ ์ฉํฉ๋๋ค.
์์ฉ ์ฌ๋ก
Interesting Scientific Idea Generation ๋
ผ๋ฌธ ์ญ์ LLM๊ณผ ์ง์๊ทธ๋ํ๋ฅผ ๊ฒฐํฉํ์ฌ ๊ณผํ์ ์์ด๋์ด ์์ฑ์ ์ง์ํ๋ฏ๋ก, HypoChainer์ ํ์
์ ํ์ ๋ฐ ๊ฐ์ค์ฌ์ฌ ๋ฐฉ๋ฒ๊ณผ ์ง์ ์ ์ผ๋ก ๋ง๋ฟ์ ์์ต๋๋ค.
๋ฐ๋ก /๋นํ
409 ๋
ผ๋ฌธ์ AI ์์ด๋์ด๊ฐ ์ธ๊ฐ ์ฐฝ์์ฑยท๋ค์์ฑยท์งํ์ ๋ฏธ์น๋ ์ํฅ์ ์คํ์ ์ผ๋ก ๋ถ์ํด, 434์ ๋๋น๋๋ ์ธ๊ฐ-AI ์ฐฝ์์ฑ ๋
ผ์์ ๊ธฐ์ฌํ๋ค.