Essence
์์คํ
์ํคํ
์ฒ: Llama3 8B Instruct ๋ชจ๋ธ๊ณผ Elasticsearch ๊ธฐ๋ฐ ๊ฒ์ ์์ง์ผ๋ก ๊ตฌ์ฑ๋ ์์ํ ๋
ผ๋ฌธ ๋ถ์ ํ์ดํ๋ผ์ธ
SciClaims๋ ์์ํ ํ
์คํธ์์ ๊ณผํ์ ์ฃผ์ฅ์ ์๋์ผ๋ก ์ถ์ถํ๊ณ , PubMed์์ ๊ด๋ จ ์ฆ๊ฑฐ๋ฅผ ๊ฒ์ํ ํ, ๋จ์ผ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ์ฌ์ฉํ์ฌ ๊ฒ์ฆํ๋ ํตํฉ ์์คํ
์ด๋ค. ์ฒด๊ณ์ ๋ฌธํ๊ณ ์ฐฐ(Systematic Literature Review, SLR)๊ณผ ํนํ ๊ฒ์ฆ ๋ฑ ๊ณ ์ํ๋ ํ์ฉ ์ฌ๋ก๋ฅผ ์ง์ํ๋ค.
Evaluation
์ดํ: SciClaims๋ ๊ณผํ์ ์ฃผ์ฅ ๊ฒ์ฆ์ ์์ ํ ํ์ดํ๋ผ์ธ์ ๋จ์ผ LLM์ผ๋ก ํตํฉํ์ฌ ์ค์ ๋ฐฐํฌ ๊ฐ๋ฅํ๋๋ก ์ต์ ํํ ์ฐ์ํ ์์คํ
๋ฐ๋ชจ์ด๋ค. ์์ํ ๋ถ์ผ์ ์ฒด๊ณ์ ๋ฌธํ๊ณ ์ฐฐ ๊ฐ์ ๊ณ ์ํ๋ ํ์ฉ์ ์ง์ ์ ๊ฐ์น๋ฅผ ์ ๊ณตํ๋ฉฐ, ๊ณต๊ฐ ์ฝ๋์ ์ธํฐํ์ด์ค๋ฅผ ํตํด ์ฌํ์ฑ๊ณผ ํ์ฅ์ฑ์ ๋ด๋ณดํ๋ค. ๋ค๋ง ํ๊ฐ ๋ฒ์ ํ๋์ ๋๋ฉ์ธ ์ธ ์ ์ฉ์ฑ ๊ฒ์ฆ์ผ๋ก ๋์ฑ ๊ฐํ๋ ์ ์๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
567 ๋
ผ๋ฌธ์ ์ฝํ ๊ฐ๋
๊ธฐ๋ฐ LLM ๊ณผํ ์ฃผ์ฅ ๊ฒ์ฆ์ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ์ด 711์ ์ฃผ์ฅ ๊ฒ์ฆ ์์คํ
์ ์ฌํ๋ ๊ธฐ์ด๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ณต์กํ ์์ํ์ ์ฃผ์ฅ ์๋ ํฉํธ์ฒดํน๊ณผ ํ๋ก๊ทธ๋จ ๊ธฐ๋ฐ ์ถ๋ก ์ ๋ํ ์ด๋ก ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
419๋ LLM ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ชจ๋ธ์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ์ฌ, 711์ SLR/์ฃผ์ฅ ๊ฒ์ฆ ์์คํ
์ ์ด๋ก ์ ๋ฐํ์ ์ค๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Sciclaimhunt๋ ์ฆ๊ฑฐ ๊ธฐ๋ฐ ๊ณผํ ์ฃผ์ฅ ๊ฒ์ฆ ๋๊ท๋ชจ ๋ฐ์ดํฐ์
์ ์ ๊ณตํ๋ฏ๋ก SciClaims ์์คํ
๊ฐ๋ฐ์ ๋ฆฌ์์ค๊ฐ ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
327 ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์ฐ๊ตฌ ํ์
์์ด์ ํธ์ ์ฌํ์ ๋ฉ์ปค๋์ฆ์ ๋ถ์ํ์ฌ, 711์ ์ค์ง์ ์์ด์ ํธ ํ๋ฒฝ ์ค๊ณ์ ๋์์ ์๊ฐ์ ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
492๋ ๋ฌธํ๊ณผ ๋ฐ์ดํฐ์ ํตํฉ์ ๊ฐ์ค ํ๊ฐ ํ๋ ์์ ์ ์ํ์ฌ, 711์ด ๋ค๋ฃจ๋ ๊ณผํ์ ์ฃผ์ฅ ์ถ์ถ ๋ฐ ๋ฌธํ ๊ฒ์ฆ๊ณผ ์ ๊ทผ๋ฒ์ด ๋ง๋ฟ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
์คํ๋๋ฉ์ธ ๊ณผํ์ ๊ฐ์ค ๊ฒ์ฆ ๋ฐ LLM ์์ด์ ํธ ๊ธฐ๋ฐ ๊ฒ์ฆ ๋ฐฉ๋ฒ๋ก ์ ๋ํ ๋์์ ์ ๊ทผ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ๊ธฐ๋ฐ์ ํ์ ์ ๋ณด ํ์ง ์์คํ
์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฐ์ด์ค๋ฉ๋์ปฌ ์์ญ์ ๊ณผํ์ ํด๋ ์ ์์ฑ ๋ฐ ํฉํธ ๊ฒ์ฆ ์์ฑํ ๋ชจ๋ธ๋ก, KG ๊ฒ์ฆ ์ธ end-to-end ๋ฐฉ์ ์ ๊ทผ์ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
763 ๋
ผ๋ฌธ์ ์์ํ ๋
ผ๋ฌธ ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ๋ชฉํ๋ก ํ๋ฉฐ, ์ฃผ์ฅ ๊ฒ์ฆ๊ณผ ๊ฐ์ค ์์ฑ ๋ชจ๋์์ LLM์ ์์ฉ์ ๋ค๋ฃน๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
SciClaims๋ ๋ฐ์ด์ค๋ฉ๋์ปฌ ๋๋ฉ์ธ์์ ์๋์ ์ผ๋ก ๊ณผํ์ ์ฃผ์ฅ ์ถ์ถ ๋ฐ ๊ฒ์ฆ ์์คํ
์ ์ ์ํ์ฌ, NSF-SCIFY์ ๋ฐฉ์๊ณผ ๋น๊ต๋ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
SciClaims ๋
ผ๋ฌธ์ ๋ฐ์ด์ค๋ฉ๋์ปฌ ๊ณผํ์์ ์์ฑ์ ๋ฐฉ์์ผ๋ก ์ฃผ์ฅ ๋ฐ ์ฆ๊ฑฐ ์ฒด๊ณ ๊ตฌ์ถ์ ์ด์ ์ ๋ง์ถ๋ฉฐ, SciClaimHunt ๋ฐ์ดํฐ์
์ ์ฆ๊ฑฐ ๊ทผ๊ฑฐ ๊ตฌ์กฐ์ ๋น๊ตํด๋ณผ ์ฌ๋ก๋ฅผ ์ ๊ณตํ๋ค.
ํ์ ์ฐ๊ตฌ
711 ๋
ผ๋ฌธ์ ์์ํ ํด๋ ์์ ๋ํ ์์ฑ์ ๊ฒ์ฆ ์์คํ
์ ์ ์ํ์ฌ, 057์ ๋ฐ์๋ ๋ฐฉ์์ ์์ํ ๋ฑ ํน์ ๋๋ฉ์ธ์ ํ์ฅํ ์ฌ๋ก์
๋๋ค.
ํ์ ์ฐ๊ตฌ
711 'SciClaims' ๋
ผ๋ฌธ์ ๋ฐ์ด์ค๋ฉ๋์ปฌ ๋ถ์ผ์์ LLM ๊ธฐ๋ฐ ์ฃผ์ฅ-์ฆ๊ฑฐ ์๋ ์ถ์ถ ์์คํ
์ ๊ฐ๋ฐํ์ฌ, 018์ retrieval-augmented knowledge mining๊ณผ ์ค์ ์ ์ฉ ๊ฐ๋ฅํ ๋ฐ์ดํฐ์
/์์ฉ ๊ตฌ์กฐ๋ฅผ ์ํธ ๋ณด์์ ์ผ๋ก ๋ณด์ฌ์ค๋๋ค.
์์ฉ ์ฌ๋ก
168์ ๋ฒ์ฉ ๋ฐ์ด์ค๋ฉ๋์ปฌ AI ์์ด์ ํธ๋ SciClaims์ฒ๋ผ ์ฃผ์ฅ ๋ถ์ ๋ฐ ์ฆ๊ฑฐ ๊ฒ์ ๊ธฐ๋ฅ์ ์ค์ ์์ ๋ฑ ๋ค์ํ ๋ฐ์ดํฐ์ ์ ์ฉํ๋ค.
์์ฉ ์ฌ๋ก
SCI-IDEA๋ ๊ณผํ์ ์์ด๋์ด๋ฅผ ๋
ผ๋ฌธ ๊ธฐ๋ฐ LLM์ผ๋ก ์์ฑํ๋ ์ค์ ์ฌ๋ก๋ก, ์ฆ๊ฑฐ ๊ฒ์ฆ๊ณผ ๊ฒฐํฉ์ ํ์ฉ๋ฐฉ์์ ์์ฌํ๋ค.