Essence
Figure 1: Overview of the proposed framework for biomedical knowledge mining. (A) Biomedical knowledge sources, such
์์ํ ์ฐ๊ตฌ๋ฅผ ์ํด Deep Thinking LLM๊ณผ Retrieval-Augmented Generation(RAG)์ ํตํฉํ ์ง์ ์ฑ๊ตด ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ฉฐ, BioStrataKG ์ง์ ๊ทธ๋ํ์ BioCDQA ๋ฐ์ดํฐ์
์ ๊ตฌ์ถํ๊ณ IP-RAR ํ๋ ์์ํฌ๋ก ๋ฌธ์ ๊ฐ ์ถ๋ก ๋ฅ๋ ฅ์ ํฅ์์ํจ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ์์ํ ์ง์ ์ฑ๊ตด์ ์ํ ํฌ๊ด์ ์ด๊ณ ์ฒด๊ณ์ ์ธ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ ์ฐ์ํ ์ฐ๊ตฌ์ด๋ฉฐ, LLM์ ๊น์ ์ถ๋ก ๋ฅ๋ ฅ๊ณผ RAG ๊ธฐ๋ฒ์ ํจ๊ณผ์ ์ธ ํตํฉ์ผ๋ก ๋ฌธ์ ๊ฐ ์ถ๋ก ๋ฅ๋ ฅ์ ํ๊ธฐ์ ์ผ๋ก ํฅ์์์ผฐ๋ค. ์ค์ ์์ ์์ฌ๊ฒฐ์ ๊ณผ ์ฐ๊ตฌ ์ ๋ต ์๋ฆฝ์ ์ง์ํ ์ ์๋ ๋์ ์ค์ฉ์ฑ์ ๊ฐ์ถ๊ณ ์๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
018์ ์์ํ์ง์๊ทธ๋ํ ์ง์์๋ต/์ถ๋ก ํ๋ ์์ํฌ๋ 333์์ ์ ์๋ ๊ทธ๋ํ ๊ธฐ๋ฐ ์ง์ ๊ฒ์ฆ๊ณผ ์๋ฆฌ์ ์ผ๋ก ๋ง๋ฟ์ ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ฒ์ ์ฆ๊ฐ ์์ฑ(RAG) ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
366์ ๊ฒ์ ์ฆ๊ฐ ์์ฑ(RAG) ๋ฐฉ์์ 018์์ ์ ์ํ ์์ํ ์ง์ ๋ง์ด๋ ๋ฐ RAG ๊ธฐ๋ฐ ์ถ๋ก ํ๋ ์์ํฌ์ ์ด๋ก ์ ์ผ๋ก ์ฐ๊ฒฐ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ํ ๋ฌธํ์์ ์ง์ ์ถ์ถ ๋ฐ ๊ทธ๋ํ ๊ตฌ์ถ์ ์ํ LLM ํ์ฉ์ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์ํ ๋ถ์ผ์์ RAG์ ์ง์ ๊ทธ๋ํ๋ฅผ ๊ฒฐํฉํ ์ ๋ณด ๊ฒ์ ๋ฐ ์ถ๋ก ์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์ํ ์ง์ ๊ทธ๋ํ ๊ตฌ์ถ ๋ฐ ์ถ๋ก ์ ์ํ ๋ฅ๋ฌ๋ ์ ๊ทผ๋ฒ์ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
018์ ๋ฅ์ฝํน LLM๊ณผ RAG ํ์ฉ ์์ํ QA ์์คํ
์, 701์ ํํ ๋ถ์ผ ๋๊ท๋ชจ QA ๋ฐ์ดํฐ์ ์ ๋ชจ๋ธ์ ์ ์ํด ๋๋ฉ์ธ๊ณผ ๊ธฐ๋ฒ์์ ์์ดํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์ํ ๋๋ฉ์ธ์์ RAG ๋ฐ Knowledge Graph ๊ธฐ๋ฐ LLM ๊ฐ์ค ์์ฑ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํด, ๋ฏธ๋ฐ๊ฒฌ ๊ฐ์ค ์๋ํ ์ธก๋ฉด์์ ํํ๋ถ์ผ์ ๋ฐฉ๋ฒ์ ๋น๊ตํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
RAG๋ฅผ ํ์ฉํ ๊ณผํ ๋ฌธํ ๊ธฐ๋ฐ ์ง์ ๋ง์ด๋ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
328 'Explainable biomedical claim verification with large language models'๋ ์ด๋ก ์ ์ง์ ๊ทธ๋ํ ์ ๊ทผ์ ์ง์คํ 018๊ณผ ๋ฌ๋ฆฌ, LLM ๊ธฐ๋ฐ ์ค๋ช
๊ฐ๋ฅ์ฑ ํ๋ ์์ํฌ๋ก ๊ณผํ์ ์ฃผ์ฅ ๊ฒ์ฆ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ฏ๋ก ๋ฐฉ๋ฒ๋ก ๋น๊ต์ ์ ํฉํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฅ ์ฝํน๊ณผ ๊ฒ์ ๋ฅ๋ ฅ์ด ๊ฒฐํฉ๋ ๋ณต์กํ ์ธ๊ณผ์ถ๋ก ๋ฌธ์ ์ LLM์ด ์ด๋ป๊ฒ ์ ๊ทผํ๋์ง ๋์์ ์ผ๋ก ๋ณด์ฌ์ค๋ค.
ํ์ ์ฐ๊ตฌ
์์ํ ์ฐ๊ตฌ์ ํนํ๋ ์ง์๊ทธ๋ํ ์ฐ๊ณ LLM์ ํตํ QA ๋ฐ ๊ฐ์ค ์์ฑ ๋ฐฉ๋ฒ์ PubMedQA์ ์ค์ ๋ฐ์ดํฐ๋ฅผ ํ์ฅ์ ์ผ๋ก ํ์ฉํ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
018์ด ๋ค๋ฃฌ Retrieval-Augmented Generation์ ํตํ ๋ฌธ์๊ฐ ์ถ๋ก ์ 005์ long-context LLM์ ํ์ฉํ ๊ณผํ QA ์ต์ ์ฑ๋ฅ ๋ถ์๊ณผ ์ฐ๊ฒฐ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
711 'SciClaims' ๋
ผ๋ฌธ์ ๋ฐ์ด์ค๋ฉ๋์ปฌ ๋ถ์ผ์์ LLM ๊ธฐ๋ฐ ์ฃผ์ฅ-์ฆ๊ฑฐ ์๋ ์ถ์ถ ์์คํ
์ ๊ฐ๋ฐํ์ฌ, 018์ retrieval-augmented knowledge mining๊ณผ ์ค์ ์ ์ฉ ๊ฐ๋ฅํ ๋ฐ์ดํฐ์
/์์ฉ ๊ตฌ์กฐ๋ฅผ ์ํธ ๋ณด์์ ์ผ๋ก ๋ณด์ฌ์ค๋๋ค.
์์ฉ ์ฌ๋ก
018์ RAG ๋ฐ LLM ํ์ฉ ๊ธฐ์ ์ 366์์ ๊ณผํ ๋
ผ๋ฌธ์ ๋ฏธ๋ ์น์
์๋์์ฑ ๋ฑ ์์ฉ ์ฌ๋ก๋ก ์ฐ๊ฒฐ๋ ์ ์์ต๋๋ค.