Semantic Scholar

์ €์ž: Kyle Lo, Lucy Lu Wang, Mark E Neumann, Rodney Kinney, Daniel S. Weld | ๋‚ ์งœ: | DOI: N/A 📄 PDF


Essence

Figure 1

Figure 1: Inline citations and references to ๏ฌgures and

S2ORC๋Š” 81.1M๊ฐœ์˜ ์˜๋ฌธ ํ•™์ˆ ๋…ผ๋ฌธ์„ ์ˆ˜์ง‘ํ•˜๊ณ  8.1M๊ฐœ ์˜คํ”ˆ์•ก์„ธ์Šค ๋…ผ๋ฌธ์˜ ๊ตฌ์กฐํ™”๋œ ์ „๋ฌธ(full text)์„ ์ œ๊ณตํ•˜๋Š” ๋Œ€๊ทœ๋ชจ ๊ณต๊ฐœ ์ฝ”ํผ์Šค๋กœ, ์ธ์šฉ(citation), ๋„ํ‘œ(figure), ํ‘œ(table) ๋“ฑ์ด ์ž๋™์œผ๋กœ ์ฃผ์„ ์ฒ˜๋ฆฌ๋˜์–ด ์žˆ๋‹ค.

Motivation

Achievement

Figure 1

Figure 1: Inline citations and references to ๏ฌgures and

How

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: S2ORC๋Š” ํ•™์ˆ  NLP ์—ฐ๊ตฌ๋ฅผ ์œ„ํ•œ ๊ธฐ์ดˆ ์ž์›์œผ๋กœ์„œ ๊ธฐ์กด ๋Œ€๋น„ 3๋ฐฐ ์ด์ƒ์˜ ๊ตฌ์กฐํ™” ์ „๋ฌธ์„ ์ œ๊ณตํ•˜๊ณ , ํ’๋ถ€ํ•œ ์ฃผ์„ ์ •๋ณด์™€ ํ•™์ œ๊ฐ„ ๊ด‘๋ฒ”์œ„์„ฑ์œผ๋กœ ํš๊ธฐ์ ์ธ ๊ณต๊ฐœ ์ฝ”ํผ์Šค์ด๋‹ค. ์‹ค์ œ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์ด ๋งค์šฐ ๋†’์œผ๋ฉฐ, ํ›„์† ํ•™์ˆ  ํ…์ŠคํŠธ ๋งˆ์ด๋‹ ์—ฐ๊ตฌ์˜ ํ† ๋Œ€๊ฐ€ ๋  ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
S2ORC์™€ ์—ฐ๊ด€๋œ ๋Œ€๊ทœ๋ชจ ๊ณต๊ฐœ ์ฝ”ํผ์Šค ๊ตฌ์ถ• ๋ฐ ํ™œ์šฉ ๋ฐฉ์•ˆ์„ ๋‹ค๋ฃจ๋Š” ๋…ผ๋ฌธ์œผ๋กœ ๋ฐ์ดํ„ฐ์…‹ ํ™•์žฅ์— ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Semantic Scholar(S2ORC) ์ฝ”ํผ์Šค๋Š” ๊ณ„์ธต์  ๋ถ„๋ฅ˜ ๋ฐ ์ธ์šฉ ๋ถ„์„ ์ž‘์—…์— ํ•„์š”ํ•œ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ์†Œ์Šค๋กœ ํ™œ์šฉ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
993๋ฒˆ ๋…ผ๋ฌธ์€ S2ORC์™€ ๊ฒฌ์ค„ ์ˆ˜ ์žˆ๋Š” ์˜คํ”ˆ ์ธ๋ฑ์Šค(OpenAlex)๋ฅผ ์†Œ๊ฐœํ•˜๋ฉฐ, 913๋ฒˆ์˜ ๋Œ€๊ทœ๋ชจ ๊ณผํ•™ ๋ฐ์ดํ„ฐ ์ฝ”ํผ์Šค์™€ ๋น„๊ต ๋ถ„์„์ด ๊ฐ€๋Šฅํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ตฌ์กฐํ™”๋œ ํ•™์ˆ  ์š”์•ฝ ์ƒ์„ฑ์„ ์œ„ํ•œ ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์„ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
OAG-Bench(580)๋Š” ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ๊ฐ€ ํ’๋ถ€ํ•œ ๋Œ€๊ทœ๋ชจ ํ•™์ˆ  ๋ฌธํ—Œ ๊ทธ๋ž˜ํ”„๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋‹ค์–‘ํ•œ ๋ถ„์„ยท๊ฒ€์ฆ ์„ฑ๋Šฅ์„ ์‹œํ—˜ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
593๋ฒˆ ๋…ผ๋ฌธ์€ ๊ณผํ•™ ๋ฌธํ—Œ ์ •๋ณด๋ฅผ RAG ๋ฐฉ์‹์œผ๋กœ ํ†ตํ•ฉ ๊ฒ€์ƒ‰ยท์ƒ์„ฑํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•ด, 913๋ฒˆ์˜ S2ORC ๊ธฐ๋ฐ˜ ๋Œ€๊ทœ๋ชจ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ๊ตฌ์ถ•๋ฐฉ์‹๊ณผ ๋‹ค๋ฅธ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ•™์ˆ  ๋ฌธํ—Œ ๊ฒ€์ƒ‰ ๋ฐ ์ธ์šฉ ์ถ”์ฒœ์˜ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
913์€ Semantic Scholar ๋“ฑ ํ˜์‹ ์  AI ๊ฒ€์ƒ‰ ํ”Œ๋žซํผ์˜ ์„ฑ๊ณตยทํ•œ๊ณ„ ์‚ฌ๋ก€ ๋ถ„์„์œผ๋กœ, 2250์—์„œ ๋‹ค๋ฃจ๋Š” ๊ฒฝ์Ÿ์ž ๋„๊ตฌ ๋น„๊ต ๋…ผ์˜๋ฅผ ๊ตฌ์ฒดํ™”ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ์›Œํฌํ”Œ๋กœ์šฐ ์žฌํ˜„์„ฑ ํ–ฅ์ƒ์„ ์œ„ํ•œ ์œ ์‚ฌํ•œ ์ž๋™ํ™” ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
S2ORC๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๊ฑฐ๋‚˜ ์œ ์‚ฌํ•œ ๋Œ€๊ทœ๋ชจ ํ•™์ˆ  ์ฝ”ํผ์Šค๋ฅผ ํ™œ์šฉํ•œ ์—ฐ๊ตฌ๋กœ ์ง์ ‘์ ์œผ๋กœ ์—ฐ๊ด€๋œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ณผํ•™ ๋…ผ๋ฌธ ๋„ํ‘œ ๋ฐ ํ‘œ ์ž๋™ ์ฃผ์„๊ณผ ๊ด€๋ จํ•˜์—ฌ SciCap์€ ๋„ํ‘œ ์บก์…˜ ์ƒ์„ฑ์ด๋ผ๋Š” ์‘์šฉ ๋ถ„์•ผ๋ฅผ ๋‹ค๋ฃฌ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
581๋ฒˆ ๋…ผ๋ฌธ์€ S2ORC ๊ฐ™์€ ๋ฐ์ดํ„ฐ์…‹์˜ ์ž๋™ ๋ ˆ์ด๋ธ”๋ง ๋ฐ ํ™œ์šฉ์„ ๊ตฌ์ฒดํ™”ํ•˜์—ฌ, 913๋ฒˆ ์ธ์šฉ/ํ‘œ/๋„ํ‘œ ์ฃผ์„ ์ฒ˜๋ฆฌ์™€ ์‹ค์ œ ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ์ด์–ด์ค€๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
885๋Š” ๋…ผ๋ฌธ ์ฒ ํšŒ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ๊ณตํ•˜์—ฌ, 913์˜ ๋Œ€๊ทœ๋ชจ S2ORC ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ์™€ ๊ฒฐํ•ฉํ•˜๋ฉด ๋…ผ๋ฌธ ํ’ˆ์งˆ๊ณผ ์‹ ๋ขฐ ์—ฐ๊ตฌ์— ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
789๋ฒˆ ๋…ผ๋ฌธ์€ S2ORC์˜ ์ธ์šฉยท๋ฉ”ํƒ€๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•ด ๊ณ„์ธต์  ๋ถ„๋ฅ˜ ์ฒด๊ณ„ ๊ตฌ์ถ•์— ์ ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
668๋ฒˆ ๋…ผ๋ฌธ์€ ๊ณผํ•™ ๋…ผ๋ฌธ ์•„์ด๋””์–ด ์ƒ์„ฑ์„ ์œ„ํ•œ ๊ณผํ•™ ๋ฐ์ดํ„ฐ์…‹์„ ํ™œ์šฉํ•˜์—ฌ, 913๋ฒˆ์—์„œ ๊ตฌ์ถ•ํ•œ ๊ตฌ์กฐํ™” ๋ฌธํ—Œ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ์˜ ์‹ค์ œ ํ™œ์šฉ ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค€๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •