Essence
Fig. 1. The left sub-figure shows an example of a negative scientific claim
๋ณธ ๋
ผ๋ฌธ์ ๊ณผํ์ ์ฃผ์ฅ(scientific claims) ๊ฒ์ฆ์ ์ํ ๋ ๊ฐ์ ๋๊ท๋ชจ ๋ฐ์ดํฐ์
์ธ SciClaimHunt์ SciClaimHunt Num์ ์ ์ํ๋ค. ๊ธฐ์กด ๋ฐ์ดํฐ์
์ ํฌ๊ธฐ ์ ํ, ์ด๋ก ์์ฃผ์ ์ฆ๊ฑฐ ์ฌ์ฉ, ์์น์ ์ฃผ์ฅ ๋ถ์ฌ ๋ฑ์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด ์ฐ๊ตฌ๋
ผ๋ฌธ์ ๊ฒฐ๊ณผ, ๋
ผ์, ๊ฒฐ๋ก ์น์
์์ ์ถ์ถํ ์ฃผ์ฅ์ LLM ๊ธฐ๋ฐ few-shot prompting์ผ๋ก ์์ฑํ๊ณ , ๋ถ์ ์ ์ฃผ์ฅ์ ๋ถ์ ๊ณผ ๊ฐ์ฒด๋ช
๊ต์ฒด ๋ฐฉ์์ผ๋ก ์์ฑํ๋ค.
Limitation & Further Study
- ์๋ ์์ฑ ์ฃผ์ฅ์ ํ์ง ํธํฅ์ฑ ๊ฐ๋ฅ์ฑ: LLM ๊ธฐ๋ฐ ์์ฑ์ผ๋ก ์ธํ ํน์ ๋๋ฉ์ธ์ด๋ ์ฃผ์ฅ ์ ํ์ ๋ํ ํธ์ค ๊ฐ๋ฅ์ฑ
- ์ ํ๋ ์๋ ์ถ์ถ ์ํ: ๊ธฐ์ค ์์๋ก ์ฌ์ฉ๋ 12๊ฐ ๋
ผ๋ฌธ์ ์๊ฐ ์ ์ด ๋ค์ํ ๋๋ฉ์ธ ์ปค๋ฒ๋ฆฌ์ง ๋ฏธํก ๊ฐ๋ฅ
- ํ๊ฐ ๊ธฐ์ค์ ์ ๋จ์์ฑ: ์ ์๋ ๊ธฐ์ค์ ๋ชจ๋ธ๋ค์ ์์ธํ ์ํคํ
์ฒ์ ์ฑ๋ฅ ๋น๊ต ๋ถ์กฑ
- ๋ค๋ฅธ ์ธ์ด ๋ฐ ๋๋ฉ์ธ: ํ์ฌ ์ฐ๊ตฌ๋ ์์ด ๋
ผ๋ฌธ ์์ฃผ์ด๋ฉฐ ํน์ ๋๋ฉ์ธ์ ๊ตญํ ๊ฐ๋ฅ์ฑ
- ์ธ๊ฐ ํ๊ฐ์ ํ์ฅ์ฑ: ์ ๋ฌธ๊ฐ ์ฃผ์์ ๋น์ฉ์ผ๋ก ์ธํ ํ๊ฐ ๊ท๋ชจ ์ ํ ๊ฐ๋ฅ
ํ์ ์ฐ๊ตฌ ๋ฐฉํฅ: ๋ ๋ค์ํ ๋๋ฉ์ธ์ ๋
ผ๋ฌธ์ ํฌํจํ์ฌ ๋ฐ์ดํฐ์
ํ์ฅ, ๋ ๊ฐ๋ ฅํ ๊ธฐ์ค์ ๋ชจ๋ธ ๊ฐ๋ฐ, ๋ค๊ตญ์ด ์ง์, ํผํฉ ๋๋ฉ์ธ ํ๊ฐ ์ค์
Evaluation
Novelty: 3/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 3/5 Overall: 3/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ๊ณผํ์ ์ฃผ์ฅ ๊ฒ์ฆ์ ์ํ ๋๊ท๋ชจ ๋ฐ์ดํฐ์
๊ตฌ์ถ์ด๋ผ๋ ๋ช
ํํ ๋ชฉํ๋ฅผ ๊ฐ์ง๊ณ ๊ธฐ์กด ๋ฐ์ดํฐ์
์ ์ฃผ์ ํ๊ณ๋ค(ํฌ๊ธฐ, ์ฆ๊ฑฐ ์ ํ, ์์น ์ฃผ์ฅ ๋ถ์ฌ)์ ์ฒด๊ณ์ ์ผ๋ก ํด๊ฒฐํ๋ ค ์๋ํ๋ค. LLM ๊ธฐ๋ฐ์ ์๋ํ๋ ๋ฐ์ดํฐ์
์์ฑ๊ณผ ์์น ์ฃผ์ฅ ์ ๋ฌธ ๋ฐ์ดํฐ์
์ ๊ด์ฐฎ์ ๊ธฐ์ฌ์ด๋, ์ ์๋ ๊ธฐ์ค์ ๋ชจ๋ธ์ ๊ธฐ์ ์ ์ฌํ, ์ ๋์ ํ๊ฐ ๊ฒฐ๊ณผ์ ๋ช
ํํ ์ ์, ๋ฐ์ดํฐ ์์ฑ ํ๋ก์ธ์ค์ ์๊ฒฉํ ํ์ง ๊ฒ์ฆ์ด ๋ ํ์ํ๋ค. ๋ฐ์ดํฐ์
์ ์ค์ฉ์ ๊ฐ์น๋ ๋์ผ๋ ๋ฐฉ๋ฒ๋ก ์ ์ฐธ์ ์ฑ๊ณผ ๊ธฐ์ ์ ํ๋น์ฑ ์ธก๋ฉด์์ ๋ณด์์ด ํ์ํ ์ํ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
710์์ ๋ค๋ฃจ๋ ๊ณผํ ์ฃผ์ฅ ๊ฒ์ฆ์ ๊ทผ๊ฐ์ 332์ ๊ฐ์ ํ๋ก๊ทธ๋จ-์ ๋ ๊ธฐ๋ฐ ๋ณต์ก ์ฃผ์ฅ ํฉํธ์ฒดํน ๋
ผ์์ ๊ธฐ์ดํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Sciclaimhunt๋ ์ฆ๊ฑฐ ๊ธฐ๋ฐ ๊ณผํ ์ฃผ์ฅ ๊ฒ์ฆ ๋๊ท๋ชจ ๋ฐ์ดํฐ์
์ ์ ๊ณตํ๋ฏ๋ก SciClaims ์์คํ
๊ฐ๋ฐ์ ๋ฆฌ์์ค๊ฐ ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ์ฃผ์ฅ ๊ฒ์ฆ ๋ฐ์ดํฐ ๊ตฌ์ถ ๋ฐ ํธํฅ ๋ถ์์ ์ค์ฆ ์ฐ๊ตฌ๊ฐ LLM ์์ฝ ์ผ๋ฐํ ํธํฅ ๋
ผ๋ฌธ์ ํ๊ฐ ์ฒด๊ณ๋ฅผ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์ํ ๋ถ์ผ์์ ๊ทผ๊ฑฐ ๊ธฐ๋ฐ ๊ณผํ์ ์ฃผ์ฅ ๊ฒ์ฆ์ ๋ค๋ฃจ์ด, ํ์์ ๋ณด ๊ฒ์ถ ๋งฅ๋ฝ์์ ๋ฐ์ดํฐ์
๊ณผ ์ ์ฉ ๋ฐฉ๋ฒ ์ฐจ์ด๋ฅผ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฏธ ๊ธฐ๋ฐ ๊ฒ์์ ํ์ฉํ ๊ณผํ์ ์ฃผ์ฅ ๊ฒ์ฆ์์ ์ ์ฌํ ๋ฌธ์ ๋ฅผ ๋ค๋ฅธ ๋ฐฉ๋ฒ์ผ๋ก ํด๊ฒฐํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
NSF-SCIFY๋ ์ง์๊ธ ์ด๋ก์์ ๊ณผํ ์ฃผ์ฅ ์ถ์ถ, SciClaimHunt๋ ๋
ผ๋ฌธ์ฆ๊ฑฐ์ ๊ธฐ๋ฐํ ์ฃผ์ฅ ๊ฒ์ฆ์ผ๋ก ๊ณผํ ์ฃผ์ฅ ๋ฐ์ดํฐ ํ์ฉ ๊ด์ ์ด ๋ค๋ฅด๋ค.
๋ค๋ฅธ ์ ๊ทผ
SciClaims ๋
ผ๋ฌธ์ ๋ฐ์ด์ค๋ฉ๋์ปฌ ๊ณผํ์์ ์์ฑ์ ๋ฐฉ์์ผ๋ก ์ฃผ์ฅ ๋ฐ ์ฆ๊ฑฐ ์ฒด๊ณ ๊ตฌ์ถ์ ์ด์ ์ ๋ง์ถ๋ฉฐ, SciClaimHunt ๋ฐ์ดํฐ์
์ ์ฆ๊ฑฐ ๊ทผ๊ฑฐ ๊ตฌ์กฐ์ ๋น๊ตํด๋ณผ ์ฌ๋ก๋ฅผ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ ๋ค ์๋ ํฉํธ์ฒดํน ์์คํ
๊ณผ ์ฃผ์ฅ ์ถ์ถยทํ๊ฐ์ ์ด์ ์ ๋์ง๋ง, 827์ ์ถ์ถ ํ๋ ์์ํฌ์ ์๋ก์ด ํ๊ฐ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์ฝํ ์ฆ๊ฑฐ(supervision)๋ฅผ ํ์ฉํ ๊ณผํ์ ์ฃผ์ฅ ๊ฒ์ฆ ๋ฐฉ๋ฒ์ ํ์ฅํ ๋
ผ๋ฌธ์ผ๋ก, SciClaimHunt์ ํ์ฉ ๊ฐ๋ฅ ๋ฒ์๋ฅผ ๋ํ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
Sciclaimhunt๋ ์ฆ๊ฑฐ ๊ธฐ๋ฐ ๊ณผํ ์ฃผ์ฅ ๊ฒ์ฆ์ ์ฌ์ฉํ ์ ์๋ ๋๊ท๋ชจ ๋ฐ์ดํฐ์
๊ณผ ํ์คํฌ๋ฅผ ์ ๊ณตํด, 880์์ ๋ถ์ํ ๊ฒ์ฆ ๋ถ๊ฐ๋ฅ ์ฃผ์ฅ ์ผ์ด์ค์ ๊ณ๋์ ์ฐ๊ตฌ๋ฅผ ํ์ฅ ์ ์ฉํ ์ ์๊ฒ ํด์ค๋ค.
์์ฉ ์ฌ๋ก
Sciclaimhunt ๋
ผ๋ฌธ์ ์ธ๋ถ์ ๊ณผํ ์ฃผ์ฅ ๊ฒ์ฆ ๋ฌธ์ ์ LLM๊ณผ ๊ฒ์ ๊ธฐ๋ฐ ํ๋กฌํํธ ๋ฐฉ์(832์ ๋ฐฉ๋ฒ๋ก ) ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ์๊ฐํฉ๋๋ค.
์์ฉ ์ฌ๋ก
Sciclaimhunt ๋
ผ๋ฌธ์ ์ฆ๊ฑฐ๊ธฐ๋ฐ ๊ณผํ ์ฃผ์ฅ ๊ฒ์ฆ ๋ฐ์ดํฐ์
์ ์ ์ํ์ฌ, ๋ณธ ๋
ผ๋ฌธ์์ ๊ฐ์กฐํ PubMed ๊ธฐ๋ฐ ๊ฑด๊ฐ ์ง๋ฌธ ์๋ต ์์คํ
์ ํ๊ฐ ๋ฐ ์์ฉ์ ๋์์ด ๋ฉ๋๋ค.
์์ฉ ์ฌ๋ก
710 ๋
ผ๋ฌธ์ ๋ฐ์ด์ค๋ฉ๋์ปฌ ๋ถ์ผ์์ ์๋ ํด๋ ์ ์์ฑ ๋ฐ ๊ฒ์ฆ ์์คํ
์ ์ ์ฉํด ์ค์ ์ฐ๊ตฌ ์๋ํ ํ์ดํ๋ผ์ธ์ ์คํจ์ฑ ๊ฒ์ฆ ์ฌ๋ก๋ฅผ ๋ณด์ํฉ๋๋ค.