Essence
Figure 2: Unlabeled attachment score (UAS) perfor-
biomedical ๋ฐ scientific ํ
์คํธ ์ฒ๋ฆฌ๋ฅผ ์ํด spaCy๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ scispaCy ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ๊ฐ๋ฐํ์ฌ POS tagging, dependency parsing, NER ๋ฑ์ ์์
์์ robustํ๊ณ ๋น ๋ฅธ ์ฑ๋ฅ์ ์ ๊ณตํ๋ค.
Evaluation
Novelty: 3/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: biomedical NLP์ ์ค์ฉ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ ์ค๊ณ๋ library๋ฅผ ์ ์ํ๋ฉฐ, ๊ณต๊ฐ ์์๊ณผ ๋ฒค์น๋งํฌ๋ฅผ ์ ๊ณตํจ์ผ๋ก์จ community์ ์๋ฏธ ์๋ ๊ธฐ์ฌ๋ฅผ ํ๋ค. ์ฑ๋ฅ๊ณผ ์๋์ ๊ท ํ์ ์ ์ ์งํ๊ณ ์์ด ์ค๋ฌด ์ ์ฉ ๊ฐ๋ฅ์ฑ์ด ๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
161์ ๋ฐ์ด์ค๋ฉ๋์ปฌ ํ
์คํธ ์ฒ๋ฆฌ์ ํนํ๋ BERT ๊ธฐ๋ฐ ๋ชจ๋ธ๋ก, 734์ scispaCy ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ค๊ณ์ ํต์ฌ์ ์ด๋ก ๊ณผ ๋ฐ์ดํฐ๋ฅผ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
707 ๋
ผ๋ฌธ์ ๊ณผํ ํ
์คํธ๋ฅผ ์ํ ์ฌ์ ํ์ต ์ธ์ด๋ชจ๋ธ๋ก์, 734์ ์์ํ ์ธ์ด์ฒ๋ฆฌ ํนํ ํ๋ ์์ํฌ์ ๋ชจ๋ธ ๊ตฌ์กฐ์ ์ผ๋ก ๋์์ฑ์ ๊ฐ์ง๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ScispaCy๋ ๋ฐ์ด์ค๋ฉ๋์ปฌ ๋ถ์ผ ๋
ผ๋ฌธ ์์ฝ๊ณผ ์ ๋ณด ์ถ์ถ์ ์ํ ์ ์/๊ฐ๊ฑด ๋ชจ๋ธ์ ์ ๊ณตํ์ฌ, ๋ถ๊ณผ๋ณ ๊ด๋ จ ์ฐ๊ตฌ ์๋ํ ๋ฐฉ๋ฒ ๋น๊ต๊ฐ ๊ฐ๋ฅํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
734๋ฒ ๋
ผ๋ฌธ์ ๋ฐ์ด์ค๋ฉ๋์ปฌ ํ
์คํธ ์ฒ๋ฆฌ(ScispaCy)๋ฅผ ์ํ ๋๊ตฌ๋ฅผ ์ ๊ณตํด, 522๋ฒ์ ์ฌ๋ฃ ๊ณผํ ์์ฐ์ด ์ธํฐํ์ด์ค์ ๋น๊ต๋๋ LLM ํ์ฉ ์ฌ๋ก์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์ํยท๊ณผํ์ ๋งฅ๋ฝ์์ ๋ค์๋ ์ํฐํฐ ์ธ์, ๋งฅ๋ฝ ์ดํด ์ฑ๋ฅ ํ๊ฐ ๋ฐ์ดํฐ์
์ ๊ฐ๋ฐํ์ฌ SciCUEval๊ณผ ๋ชฉ์ ์ด ์ ์ฌํจ.
๋ค๋ฅธ ์ ๊ทผ
734๋ ๋ฐ์ด์ค๋ฉ๋์ปฌ NER ๋ฐ ์ํฐํฐ ๋งํฌ ํนํ ๋ชจ๋ธ์ ์ ๊ณตํ์ฌ 3251์ CoPaLink ๊ฐ๋
๊ณผ ์ ์ฌํ๊ฒ ์ ์ฉ ๊ฐ๋ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
530 ๋
ผ๋ฌธ์ ์์ํ ๋ฐ ์๋ฃ QA ์ต์ ํ๋ฅผ ์ํ ์ธ์ด๋ชจ๋ธ ํ์ธํ๋ ๊ฒฝ๋ก๋ฅผ ๋ค๋ค, 734 ํ๋ ์์ํฌ์ ์ค์ ํ์ฉ ์์ญ์ ํ์ฅ์ํต๋๋ค.
์์ฉ ์ฌ๋ก
699์ ๋จ์ผ์ธํฌ ๋ฐ์ดํฐ ๋ถ์ ํ์ดํ๋ผ์ธ์์ scispaCy์ NER์ ํ
์คํธ ํ์ฑ ๊ธฐ๋ฅ์ด ์ค์ ๋ฐ์ดํฐ ์ฒ๋ฆฌ์ ํ์ฉ๋ ์ ์์ต๋๋ค.