์ ์: Agustรญn Borrego, Danilo Dessรฌ, Daniel Ayala, Inma Hernรกndez, Francesco Osborne, Diego Reforgiato Recupero, Davide Buscaldi, David Ruiz, Enrico Motta | ๋ ์ง: 04/2025 | DOI: 10.1016/j.knosys.2025.113280 📄 PDF
Essence
Fig. 1. The proposed approach to generate research hypotheses from a scientific KG.
ResearchLink๋ knowledge graph์ ๊ฒฝ๋ก ๊ธฐ๋ฐ ํน์ง, KGE, ํ
์คํธ ์๋ฒ ๋ฉ์ ๊ฒฐํฉํ์ฌ ๊ณผํ ๋ถ์ผ ์ ๋ฐ์ ๊ฑธ์ณ ๋๋ฉ์ธ ๋
๋ฆฝ์ ์ผ๋ก ์ฐ๊ตฌ ๊ฐ์ค์ ์์ฑํ๋ ๋ฐฉ๋ฒ๋ก ์ด๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ResearchLink๋ ๊ธฐ์กด์ ๋จ์ KGE ๊ธฐ๋ฐ link prediction ๋ฐฉ๋ฒ์ ๋์ด ํ
์คํธ ์๋ฏธ๋ก ๊ณผ ์์งํ์ ๋งฅ๋ฝ์ ํตํฉํจ์ผ๋ก์จ ์ค์ง์ ์ฐ๊ตฌ ๊ฐ์ค ์์ฑ์ ์ ํฉํ ์ฐฝ์์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ฉฐ, ๊ณต๊ฐ ๋ฐ์ดํฐ์
๊ณผ ์คํ์์ค๋ฅผ ํตํด ์ฌํ์ฑ๊ณผ ํ์ฅ์ฑ์ ํ๋ณดํ ์ฐ์ํ ์ฐ๊ตฌ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ LLM์ ํ์ฉํ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ๊ธฐ์ด ์๋ฆฌ๋ฅผ ๋ค๋ฃจ๋ฉฐ, 666์ ์ฐ๊ตฌ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ง์ ๊ทธ๋ํ์ LLM์ ์ด์ฉํ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ๊ตฌ์ถํ ๋
ผ๋ฌธ์ผ๋ก, KG-CoI ์์คํ
์ ํต์ฌ ๊ฐ๋
๊ณผ ๋งฅ๋ฝ์ด ํตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Research hypothesis generation over scientific knowledge graph ๋
ผ๋ฌธ์ LLM๊ณผ ์ง์๊ทธ๋ํ ๊ธฐ๋ฐ ๊ฐ์ค์์ฑ ๋
ผ์์ ์ด๋ก ์ ๊ทผ๊ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ๊ณผํ ์์ด๋์ด ์์ฑ ๋ฐฉ์์ ์ง์คํ ๋
ผ๋ฌธ์ผ๋ก, ResearchLink์ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ ์ฌ๋ก๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
666๋ฒ ๋
ผ๋ฌธ์ ๊ณผํ์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ์ฐ๊ตฌ ๊ฐ์ค ์์ฑ ๋ฒค์น๋งํฌ๋ก, 3107์ ์ง๋ณ ํน์ด embedding alignment ๋ฐ ๋คํธ์ํฌ ์ ํธ ํตํฉ์ ๊ทผ๊ฑฐ๊ฐ ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
426๋ฒ ๋
ผ๋ฌธ์ ์ง์๊ทธ๋ํ ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ฐฉ๋ฒ์ ์ ์ํ์ฌ, 666๋ฒ์ ResearchLink์์ ๊ฒฝ๋ก ๊ธฐ๋ฐ ์ง์ ๊ทธ๋ํ ํน์ฑ์ ํ์ฉํ ๊ฒ๊ณผ ๋น๊ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ํ ์์คํ
์์ ๋ช
ํํ ์ง๋ฌธ์ ์์ฑํ๋ ๋ค๋ฅธ ์ ๊ทผ๋ฒ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ ๋ฌธํ ๊ธฐ๋ฐ ์ฐ๊ตฌ ๊ฐ์ค ์์ฑ ๋ฐ ํฉํธ์ฒดํฌ๋ฅผ ๋ค์ํ ๊ทธ๋ํ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ผ๋ก ๊ตฌํํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
Knowledge graph์ LLM์ ํ์ฉํ์ฌ ๊ฐ์ค ์๋ ์์ฑ ๋ฐ ํ๊ฐ๋ฅผ ์ํํ๋ ๋๋ค๋ฅธ ๋ฐฉ๋ฒ์ ์ ์ํด, ๋ ์์คํ
์ ํน์ง์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ฐ์ค ๊ฒ์ฆ/์์ ์ง์ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๋, Research hypothesis generation์ ์ง์๊ทธ๋ํ ๊ธฐ๋ฐ ์๋ ์์ฑยทํ๊ฐ ๋ฐฉ์์ ์ฑํํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ ๋
ผ๋ฌธ ๋ชจ๋ knowledge graph์ ์๋ฒ ๋ฉ ๊ธฐ๋ฐ์ผ๋ก ๊ณผํ ์ฐ๊ตฌ ์์ด๋์ด ๋๋ ๊ฐ์ค์ ์์ฑํ๋ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋, ํ๋๋ ๊ฒฝ๋ก ๊ธฐ๋ฐ, ๋ค๋ฅธ ํ๋๋ MAG ๊ธฐ๋ฐ์ ์ฌ์ฉํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
Scientific knowledge graph ๊ธฐ๋ฐ์ ๊ฐ์ค ์์ฑ ํ๊ฐ ํ๋ ์์ํฌ ์ ์๋ก, ์ฌ์ ๋ถํฌ ๊ธฐ๋ฐ ์๋ ํ๊ฐ ๋ฐฉ๋ฒ๊ณผ ๋น๊ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ์ ๋ฐ๊ฒฌ์ ์ํ LLM ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ ๋ฐ ํ๊ฐ๋ฅผ ๋ค๋ฃจ๋ ๋งค์ฐ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
847์ ๋ฉํฐ์์ด์ ํธ ์์คํ
์ ํ์ฉํด ๊ฐ์ค ์์ฑ ๊ณผ์ ์ ๋์ฑ ํ์ ์ ์ผ๋ก ๋ฐ์ ์ํค๋ฏ๋ก 666์ ์ฐ์ฅ์ ์์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
492์์ ๋
ผ๋ฌธ+๋ฐ์ดํฐ ๊ธฐ๋ฐ ์๋์ง ๊ฐ์ค ์์ฑ ์ ๊ทผ๋ฒ์ ์ ์ํ๊ณ , 666์ ์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ๊ณผํ ๊ฐ์ค ์์ฑ ํ๋ ์์ํฌ๋ก ์ด๋ฅผ ๊ตฌ์กฐํํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ ์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ ํ๋ ์์ํฌ ๋
ผ๋ฌธ์ HypoGeniC์ ํ์-ํ์ฉ ๊ธฐ๋ฐ ์๋ ๊ฐ์ค ์์ฑ์ ๊ตฌ์กฐ์ ํ์ฅ ์์๋ฅผ ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
MIR ๋
ผ๋ฌธ๋ KG์ ์๋ฒ ๋ฉ ๊ธฐ๋ฐ์ผ๋ก ์ฐ๊ตฌ ๋ฌธ์ /๊ฐ์ค ์๊ฐ์ ์ฃผ๋ ๊ณผ๊ฑฐ ์ฐ๊ตฌ๋ฅผ ๊ฒ์ยท์กฐํฉํด, ๊ฒฝ๋ก ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ๊ณผ ์ํธ ๋ณด์ ๋ฐ ๋น๊ต ๋ถ์์ด ๊ฐ๋ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ์ ๊ฐ์ค ์์ฑ์ ์ง์ ๊ทธ๋ํ ์ ๊ทผ์ ๋ ๋๊ฒ ์ ์ฉํ ์ฐ๊ตฌ๋ก GraphEval์ ์์ด๋์ด ํ๊ฐ์ ์ฐ๊ฒฐ๋ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
666๋ฒ ๋
ผ๋ฌธ์ ์ง์ ๊ทธ๋ํ ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ฐฉ๋ฒ๋ก ์ ๋
ผ์ํด, 3096์์ ๋ค๋ฃฌ ๋ฐ์ดํฐ ๋ถํ ๋ฐ Benchmark ํ๊ณ๋ฅผ ๊ทน๋ณตํ ์ ์๋ ๋์์ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค.
์์ฉ ์ฌ๋ก
488๋ฒ์ ์ง์๊ทธ๋ํ ๊ธฐ๋ฐ LLM ์ง์์๋ต ์์ฉ์ ๋ค๋ฃจ์ด, 666๋ฒ์ ์ฐ๊ตฌ ๊ฐ์ค ์์ฑ ๋ฉ์ปค๋์ฆ์ ์ค์ ํ์ฉ ์ฌ๋ก๋ก ์ฐ๊ฒฐ๋๋ค.