Mir: Methodology inspiration retrieval for scientific research problems

์ €์ž: Aniketh Garikaparthi, Manasi Patwardhan, Aditya Kanade, Ahmed E. Hassan, Lovekesh Vig, Arman Cohan | ๋‚ ์งœ: 2025 | DOI: arXiv:2506.00249v1 📄 PDF


Essence

Figure 1

Figure 1: ์ผ๋ฐ˜์ ์ธ ๊ฒ€์ƒ‰(์ƒ)์€ ์˜๋ฏธ๋ก ์  ์œ ์‚ฌ์„ฑ๋งŒ์œผ๋กœ ๋น„๊ด€๋ จ ๋…ผ๋ฌธ์„ ๊ฒ€์ƒ‰ํ•˜์ง€๋งŒ, ์ œ์•ˆ ๋ฐฉ๋ฒ•(ํ•˜)์€ ๋ฐฉ๋ฒ•๋ก ์  ์˜๊ฐ์„ ํฌ์ฐฉ

๋ณธ ๋…ผ๋ฌธ์€ ๊ณผํ•™ ์—ฐ๊ตฌ ๋ฌธ์ œ ํ•ด๊ฒฐ์„ ์œ„ํ•ด ๋ฐฉ๋ฒ•๋ก ์  ์˜๊ฐ(Methodology Inspiration)์„ ์ค„ ์ˆ˜ ์žˆ๋Š” ์„ ํ–‰ ์—ฐ๊ตฌ๋ฅผ ๊ฒ€์ƒ‰ํ•˜๋Š” ์ƒˆ๋กœ์šด ๊ณผ์ œ(MIR)๋ฅผ ์ •์˜ํ•˜๊ณ , ์ธ์šฉ ๋„คํŠธ์›Œํฌ์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ณ„๋ณด๋ฅผ ํฌ์ฐฉํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก  ์ธ์ ‘ ๊ทธ๋ž˜ํ”„(MAG)๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๋ฐ€์ง‘ ๊ฒ€์ƒ‰๊ธฐ(dense retriever)๋ฅผ ํ•™์Šตํ•˜๋Š” ๊ธฐ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.

Motivation

Achievement

Figure 2

Figure 2: ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ• ๊ณผ์ • - MultiCite ๋ฐ์ดํ„ฐ ์ ์‘ ๋ฐ arXiv ์ฆ๊ฐ•

  1. ์ƒˆ๋กœ์šด ๊ณผ์ œ ๋ฐ ๋ฐ์ดํ„ฐ์…‹: MIR ๊ณผ์ œ๋ฅผ ํ˜•์‹ํ™”ํ•˜๊ณ , MultiCite ๋ฐ์ดํ„ฐ์…‹์„ ํ™•์žฅํ•˜์—ฌ MIR ํ‰๊ฐ€์šฉ ๋ฐ์ดํ„ฐ์…‹(MIR-MultiCite)์„ ๊ตฌ์ถ•ํ–ˆ๋‹ค. ์ด ๋ฐ์ดํ„ฐ์…‹์€ ์—ฐ๊ตฌ ์ œ์•ˆ๊ณผ ๊ทธ์— ๋Œ€ํ•œ ๋ฐฉ๋ฒ•๋ก ์  ์˜๊ฐ์„ ์ฃผ๋Š” ๋…ผ๋ฌธ ์Œ์œผ๋กœ ๊ตฌ์„ฑ๋œ๋‹ค.
  2. ๋ฐฉ๋ฒ•๋ก  ์ธ์ ‘ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ํ•™์Šต: ์ธ์šฉ ๋„คํŠธ์›Œํฌ์—์„œ 'methodology' ๋˜๋Š” 'non-methodology' ์˜๋„๋กœ ๋ผ๋ฒจ๋œ ์—ฃ์ง€๋ฅผ ๊ฐ€์ง„ MAG๋ฅผ ๊ตฌ์ถ•ํ•˜๊ณ , ์ด๋กœ๋ถ€ํ„ฐ ํ•ฉ์„ฑ๋œ ์‚ผ์ค‘ ์†์‹ค(triplet loss)์„ ํ†ตํ•ด ๊ฒ€์ƒ‰๊ธฐ๋ฅผ ๋ฏธ์„ธ์กฐ์ •ํ•จ์œผ๋กœ์จ Recall@3์—์„œ +5.4, Mean Average Precision(mAP)์—์„œ +7.8์˜ ํ–ฅ์ƒ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค.
  3. LLM ๊ธฐ๋ฐ˜ ์žฌ์ˆœ์œ„: LLM์„ ํ™œ์šฉํ•œ ์žฌ์ˆœ์œ„(re-ranking) ์ „๋žต์„ MIR์— ์ ์‘์‹œ์ผœ ์ถ”๊ฐ€๋กœ Recall@3์—์„œ +4.5, mAP์—์„œ +4.8์˜ ๊ฐœ์„ ์„ ์–ป์—ˆ๋‹ค.
  4. ๊ฐ€์„ค ์ƒ์„ฑ ํ‰๊ฐ€: ๊ฒ€์ƒ‰๋œ ๋…ผ๋ฌธ๋“ค์ด LLM ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ ์ž‘์—…์—์„œ ์‹ค์ œ๋กœ ์–ผ๋งˆ๋‚˜ ํšจ๊ณผ์ ์ธ์ง€ LLM-as-a-judge ํ‰๊ฐ€๋ฅผ ํ†ตํ•ด ๊ฒ€์ฆํ–ˆ๋‹ค.

How

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ๊ณผํ•™ ๋ฐœ๊ฒฌ์—์„œ ๋ฐฉ๋ฒ•๋ก ์  ์˜๊ฐ ๊ฒ€์ƒ‰์˜ ์ค‘์š”์„ฑ์„ ์ธ์‹ํ•˜๊ณ  ์ด๋ฅผ ์œ„ํ•œ ์ƒˆ๋กœ์šด ๊ณผ์ œ, ๋ฐ์ดํ„ฐ์…‹, ๋ฐฉ๋ฒ•๋ก ์„ ์ฒด๊ณ„์ ์œผ๋กœ ์ œ์‹œํ–ˆ๋‹ค๋Š” ์ ์—์„œ ์˜๋ฏธ๊ฐ€ ์žˆ์œผ๋‚˜, ํ‰๊ฐ€ ๋„๋ฉ”์ธ์˜ ์ œํ•œ์„ฑ๊ณผ ๊ธˆํ‘œ์ค€ ์ •์˜์˜ ์• ๋งคํ•จ์ด ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ์— ๋Œ€ํ•œ ์˜๋ฌธ์„ ๋‚จ๊ธด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ง€์‹๊ทธ๋ž˜ํ”„ ๋ฐ ๊ด€๋ จ ๋ฌธํ—Œ๊ฒ€์ƒ‰ ๋ฐฉ๋ฒ•์˜ ์ตœ์‹  ์ด๋ก ์  ๋™ํ–ฅ์„ ํฌ๊ด„ํ•ด MIR ๊ณผ์ œ์˜ ๋ฌธ์ œ์˜์‹๊ณผ ๋ฐฉ๋ฒ•๋ก ์„ ๋„“ํ˜€์ค๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
419๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค์ƒ์„ฑ ๋ฐ ๊ด€๋ จ ๋…ผ๋ฌธ ๊ฒ€์ƒ‰ ์ด๋ก ์„ ์ œ๊ณตํ•˜์—ฌ, 540๋ฒˆ ๋…ผ๋ฌธ์˜ ๋ฐฉ๋ฒ•๋ก  ์˜๊ฐ ๊ฒ€์ƒ‰ ์ž‘์—… ์ •์˜์— ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ๋งˆ๋ จํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
426 ๋…ผ๋ฌธ์€ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๊ฐ€์„คยท๋ฐฉ๋ฒ•๋ก  ์ถ”์ฒœ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ์–ด, 540์˜ ๋ฐฉ๋ฒ•๋ก  ์ธ์ ‘ ๊ทธ๋ž˜ํ”„(MAG) ๊ฒ€์ƒ‰ ๊ณผ์ œ ์„ค์ •ยท์ž…์ฆ์— ์ „๊ฑฐ๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ResearchBench์˜ ์˜๊ฐ ๊ฒ€์ƒ‰ยท๊ฐ€์„ค ์ˆœ์œ„ ๊ฒฐ์ • ์ž‘์—…์€ ์ด์ „์˜ Methodology inspiration retrieval ์—ฐ๊ตฌ ๋งฅ๋ฝ์—์„œ ํƒ„์ƒํ•œ ์ ‘๊ทผ๋ฒ•์ž…๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณผํ•™์  ์•„์ด๋””์–ด, ์˜๊ฐ, ๋ฐฉ๋ฒ•๋ก  ๊ฒฐํ•ฉ์˜ ์ฒด๊ณ„ ๋ถ„์„์„ ํ†ตํ•ด Spacer์˜ ์ปจํ…์ŠคํŠธ ๋ถ„ํ•ด ๋ฐ ์˜๊ฐ ์ƒ์„ฑ ๋…ผ์˜์˜ ์ด๋ก  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ธ์šฉ ๋„คํŠธ์›Œํฌ ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ์ถ”์ฒœ ๋ฐ ๊ด€๋ จ ๋…ผ๋ฌธ์˜ ๋ถ„๋ฅ˜/๋žญํ‚น ๊ธฐ๋ฒ•์„ ์ œ์‹œํ•ด MIR์˜ ๋ฌธ์ œ์„ค์ •๊ณผ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
293๋ฒˆ ๋…ผ๋ฌธ์€ LLM์„ ํ†ตํ•œ ์ž๋™ํ™” ๋ฐ์ดํ„ฐ๊ณผํ•™ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, 540๋ฒˆ์—์„œ ์„ ํ–‰๋ฐฉ๋ฒ• ๊ฒ€์ƒ‰ ์ค‘์‹ฌ์œผ๋กœ ๋‹ค๋ฃจ๋Š” ๋ฌธ์ œ๋ฅผ ์ „์ฒด ์—ฐ๊ตฌ ๋ผ์ดํ”„์‚ฌ์ดํด ์ž๋™ํ™” ๊ด€์ ์—์„œ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
540๋ฒˆ ๋…ผ๋ฌธ์€ ์˜๋ฏธ ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ์˜๊ฐ์„ ์œ„ํ•œ ์‹œ์Šคํ…œ์„ ๋‹ค๋ฃจ๊ณ  ์žˆ์–ด, ๊ฒ€์ƒ‰ ๋ฐ ์•„์ด๋””์–ด ์ƒ์„ฑ์˜ ๋‹ค๋ฅธ ์ ‘๊ทผ์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
540์€ ๊ณผํ•™ ์—ฐ๊ตฌ๋ฌธ์ œ ํ•ด๊ฒฐ์‹œ ์„ ํ–‰์—ฐ๊ตฌ ๋ฐฉ๋ฒ•๋ก  ๊ฒ€์ƒ‰์— ์ดˆ์ ์„ ๋‘” ๊ฒƒ์œผ๋กœ, 425์˜ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ์ƒ์„ฑ๊ณผ ์ƒํ˜ธ๋ณด์™„์ ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‘ ๋…ผ๋ฌธ ๋ชจ๋‘ knowledge graph์™€ ์ž„๋ฒ ๋”ฉ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ณผํ•™ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ๋˜๋Š” ๊ฐ€์„ค์„ ์ƒ์„ฑํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•˜๋‚˜, ํ•˜๋‚˜๋Š” ๊ฒฝ๋กœ ๊ธฐ๋ฐ˜, ๋‹ค๋ฅธ ํ•˜๋‚˜๋Š” MAG ๊ธฐ๋ฐ˜์„ ์‚ฌ์šฉํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Mir: Methodology inspiration retrieval ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์ฐฝ์˜์  ์˜๊ฐ ๊ฒ€์ƒ‰์ด๋ผ๋Š” ์œ ์‚ฌ ๋ชฉ์ ์„ ๋‹ค๋ฅธ retrieval ํŒŒ์ดํ”„๋ผ์ธ ๊ธฐ๋ฐ˜์œผ๋กœ ์ ‘๊ทผํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
SciMON ์—ญ์‹œ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์˜๊ฐ ์‹œ์Šคํ…œ์œผ๋กœ, ๋‹ค์–‘ํ•œ ์˜๊ฐ ์›์ฒœ(ํŠนํ—ˆ, ๋…ผ๋ฌธ ๋“ฑ)์„ ๊ฒฐํ•ฉํ•˜์—ฌ MIR์˜ ์‘์šฉ ํ™•์žฅ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค€๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
216(Chimera)๋Š” ์‹ค์ œ ๋…ผ๋ฌธ์˜ ๋ฐฉ๋ฒ•๋ก  ์•„์ด๋””์—์ด์…˜์„ ์ง€์›ํ•˜๋Š” ์•„์ด๋””์–ด ์žฌ์กฐํ•ฉ ์‚ฌ๋ก€๋กœ์„œ, 540์˜ ๋ฐฉ๋ฒ•๋ก ์  ์˜๊ฐ ๊ฒ€์ƒ‰ ์ž‘์—…์˜ ์‹ค์งˆ์  ์‘์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ํ™•์žฅํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Mir: Methodology inspiration retrieval for scientific research ๋…ผ๋ฌธ์€ LLM์ด ํ•™์ˆ  ์ž‘์„ฑ ๋ฐ ์ธ์šฉ ์ถ”์ฒœ์— ์ฃผ๋Š” ์ฐฝ์˜์  ์˜๊ฐ๊ณผ ์‹ ๋ขฐ์„ฑ ๋ฌธ๋งฅ์— ๋Œ€ํ•œ ํ™•์žฅ์  ๋…ผ์˜๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
MIR ๋…ผ๋ฌธ๋„ KG์™€ ์ž„๋ฒ ๋”ฉ ๊ธฐ๋ฐ˜์œผ๋กœ ์—ฐ๊ตฌ ๋ฌธ์ œ/๊ฐ€์„ค ์˜๊ฐ์„ ์ฃผ๋Š” ๊ณผ๊ฑฐ ์—ฐ๊ตฌ๋ฅผ ๊ฒ€์ƒ‰ยท์กฐํ•ฉํ•ด, ๊ฒฝ๋กœ ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ๊ณผ ์ƒํ˜ธ ๋ณด์™„ ๋ฐ ๋น„๊ต ๋ถ„์„์ด ๊ฐ€๋Šฅํ•˜๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Mir: Methodology inspiration retrieval for scientific research ๋…ผ๋ฌธ์€ citation intent, ๋งฅ๋ฝ ๊ธฐ๋ฐ˜ ์ •๋ณด ์ถ”์ฒœ/์ƒ์„ฑ ๋ฐฉ์‹์„ ์‹ค์ œ ์—ฐ๊ตฌ ๋ฐฉ๋ฒ•๋ก  ์ถ”์ฒœ์— ์ ์šฉํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
494๋ฒˆ์€ LLM์˜ ๊ณผํ•™ ์ฐฝ์˜์„ฑโ€ง์•„์ด๋””์–ด ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ๊ฐ๊ด€์ ์œผ๋กœ ํ‰๊ฐ€ํ•˜์—ฌ, 540๋ฒˆ์˜ ๋ฐฉ๋ฒ•๋ก  ์˜๊ฐ ์‹œ์Šคํ…œ์˜ ์‹ค์ œ ํšจ๊ณผ ๊ฒ€์ฆ์— ๋„์›€์„ ์ค๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •