Grounding fallacies misrepresenting scientific publications in evidence

์ €์ž: Max Glockner, Yufang Hou, Preslav Nakov, Iryna Gurevych | ๋‚ ์งœ: 2024 | DOI: N/A 📄 PDF


Essence

๊ฑด๊ฐ• ๊ด€๋ จ ํ—ˆ์œ„์ •๋ณด๋Š” ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ์ƒ์˜ํ•™ ๋…ผ๋ฌธ์„ ์ฆ๊ฑฐ๋กœ ์ž˜๋ชป ์ธ์šฉํ•˜๋ฉฐ, ๋…ผ๋ฆฌ์  ์˜ค๋ฅ˜(logical fallacy)๋ฅผ ์ ์šฉํ•˜์—ฌ ๊ฑฐ์ง“ ์ฃผ์žฅ์„ ์ง€์›ํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋ณด์ด๊ฒŒ ํ•œ๋‹ค. ๋ณธ ๋…ผ๋ฌธ์€ ์‹ค์ œ ํ•™์ˆ ์ง€ ๊ตฌ์ ˆ์— ๊ธฐ๋ฐ˜ํ•˜์—ฌ ์ด๋Ÿฌํ•œ ์˜ค๋ฅ˜๋ฅผ ํƒ์ง€ํ•˜๊ณ  ์„ค๋ช…ํ•˜๊ธฐ ์œ„ํ•ด MISSCIPLUS ๋ฐ์ดํ„ฐ์…‹์„ ์ œ์‹œํ•œ๋‹ค.

Motivation

Achievement

Figure 1

Figure 1: MISSCI์˜ ์˜์—ญ๋œ ๋งฅ๋ฝ์„ ์‹ค์ œ ๋…ผ๋ฌธ ๊ตฌ์ ˆ๊ณผ ์—ฐ๊ฒฐ. LLM์€ (i) ์›๋ณธ ๋…ผ๋ฌธ์—์„œ ๊ด€๋ จ ๊ตฌ์ ˆ์„ ์ฐพ๊ณ  (ii) ๊ฑฐ์ง“ ์ฃผ์žฅ์„ ์ง€์›ํ•˜๊ธฐ ์œ„ํ•œ ๋…ผ๋ฆฌ์  ์˜ค๋ฅ˜๋ฅผ ์ƒ์„ฑํ•ด์•ผ ํ•จ

  1. ํ˜„์‹ค์  ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•: ํ—ˆ์œ„์ •๋ณด ์ฃผ์žฅ๊ณผ ์‹ค์ œ ํ•™์ˆ ์ง€ ๊ตฌ์ ˆ์„ ์Œ์œผ๋กœ ์—ฐ๊ฒฐํ•œ ์ตœ์ดˆ์˜ ๋…ผ๋ฆฌ์  ์˜ค๋ฅ˜ ๋ฐ์ดํ„ฐ์…‹ ์ œ์‹œ. AFC ๋ชจ๋ธ์ด ์‚ฌ์šฉํ•˜๋Š” ์ž…๋ ฅ๊ณผ ๋™์ผํ•œ ํ˜•ํƒœ๋กœ ๊ตฌ์„ฑ.
  2. ํฌ๊ด„์  ๋ฒค์น˜๋งˆํ‚น:
    • ๊ตฌ์ ˆ ๊ฒ€์ƒ‰ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ ํ‰๊ฐ€ (์ •ํ™•ํ•œ ์ฆ๊ฑฐ ๊ตฌ์ ˆ ์„ ํƒ)
    • LLM์˜ ๋…ผ๋ฆฌ์  ์˜ค๋ฅ˜ ์žฌ๊ตฌ์„ฑ ๋Šฅ๋ ฅ ํ‰๊ฐ€ (๋‹จ์ˆœํ™”๋œ ๋‚ด์šฉ vs. ์›๋ณธ ํ…์ŠคํŠธ)
    • AFC ๋ชจ๋ธ์˜ ํ—ˆ์œ„์ •๋ณด ํƒ์ง€ ์„ฑ๋Šฅ ํ‰๊ฐ€

How

Figure 2

Figure 2: ์‹ค์ œ ๋…ผ๋ฌธ ๊ตฌ์ ˆ (Vincent et al., 2005)์ด MISSCI์˜ ์˜์—ญ๋œ ๋‚ด์šฉ "์—ฐ๊ตฌ๋Š” ์„ธํฌ ๋ฐฐ์–‘์„ ์‚ฌ์šฉํ•จ"๊ณผ ์–ด๋–ป๊ฒŒ ์—ฐ๊ฒฐ๋˜๋Š”์ง€ ๋ณด์—ฌ์คŒ

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4.5/5 Overall: 4.2/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ํ—ˆ์œ„์ •๋ณด ํƒ์ง€์˜ ์‹ค์ œ ์ ์šฉ์„ ์œ„ํ•ด ๋…ผ๋ฆฌ์  ์˜ค๋ฅ˜๋ฅผ ์‹ค์ œ ๊ณผํ•™ ๋…ผ๋ฌธ๊ณผ ์—ฐ๊ฒฐํ•œ ํ˜์‹ ์ ์ธ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ์‹œํ•˜๋ฉฐ, ๊ธฐ์กด AFC ๋ชจ๋ธ๊ณผ LLM์ด ์˜ค๋ฅ˜๊ฐ€ ์žˆ๋Š” ์ฆ๊ฑฐ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ™œ์šฉํ•˜์ง€ ๋ชปํ•จ์„ ์‹ค์ฆ์ ์œผ๋กœ ๋ณด์—ฌ์คŒ์œผ๋กœ์จ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Factkg ๋…ผ๋ฌธ์€ ํŒฉํŠธ ์ฒดํฌ๋ฅผ ์œ„ํ•œ ์ง€์‹๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์ถ”๋ก  ์ ‘๊ทผ์„ ๋‹ค๋ฃจ์–ด 394์˜ ๊ทผ๊ฑฐ ๊ธฐ๋ฐ˜ ์˜ค๋ฅ˜ ํƒ์ง€ ๋ฐฉ๋ฒ•์— ๊ฐœ๋…์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
When large language models meet citation: A survey ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์‹ค์ œ ๋…ผ๋ฌธ ์ธ์šฉ ํŒจํ„ด์— ๋Œ€ํ•œ ์กฐ์‚ฌ๋กœ, ์ž˜๋ชป๋œ ์ธ์šฉ ๊ฒ€์ฆ ๋ฐ ํ—ˆ์œ„์ •๋ณด ์ถ”์  ์—ฐ๊ตฌ์˜ ๊ธฐ๋ฐ˜์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
394๋Š” ๊ณผํ•™ ๊ฒฐ๊ณผ ์†Œํ†ต ๊ณผ์ •์—์„œ ๋ฐœ์ƒํ•˜๋Š” ์˜ค๋ฅ˜์™€ ์˜ค๋ฅ˜ ์œ ํ˜•์„ ๋ถ„์„, 852๊ฐ€ ๋‹ค๋ฃจ๋Š” ์™œ๊ณก ์œ ํ˜• ์ž๋™ ๊ฒ€์ถœ ์—ฐ๊ตฌ์˜ ์ด๋ก ์  ๊ทผ๊ฑฐ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ์ฃผ์žฅ ๊ฒ€์ฆ์— LLMยท์ง€์‹ ๊ทธ๋ž˜ํ”„ ํ™œ์šฉ์ด๋ผ๋Š” ๋™์ผํ•œ ๋ฌธ์ œ์˜ ์„ค๋ช…๊ฐ€๋Šฅ์„ฑ ๊ฐ•์กฐ ์ ‘๊ทผ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‘˜ ๋‹ค ๋Œ€๊ทœ๋ชจ ํ•™์ˆ  ๋…ผ๋ฌธ ๋ฐ์ดํ„ฐ์…‹์„ ํ™œ์šฉํ•ด ๋ฌธํ—Œ์˜ ๊ตฌ์กฐ์ ยท์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ๋ถ„์„์„ ์ถ”๊ตฌํ•˜์ง€๋งŒ, ๊ฐ๊ฐ ์š”์•ฝ๊ณผ ํ—ˆ์œ„์ •๋ณด ํƒ์ง€๋ผ๋Š” ๋‹ค๋ฅธ ๋ฌธ์ œ์— ์ ์šฉํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋…ผ๋ฌธ ๊ทผ๊ฑฐ ๊ธฐ๋ฐ˜ ์˜ค๋ฅ˜ ํƒ์ง€ MISSICIPLUS ๋ฐ์ดํ„ฐ์…‹๊ณผ ํ•จ๊ป˜ ์‚ฌ์‹ค ๊ฒ€์ฆ, ํ—ˆ์œ„ ์ •๋ณด ํƒ์ง€ ๋ชจ๋ธ์˜ ํ˜„์žฅ ์ ์šฉ ์‚ฌ๋ก€ ๋น„๊ต์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ ํ—ˆ์œ„ ์ •๋ณด ํƒ์ง€ ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ๋กœ, ๋‹ค๋ฅธ ๋„๋ฉ”์ธ์˜ ์˜ค๋ณด๋ฅผ ๋‹ค๋ฃฌ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ƒ์˜ํ•™ ๋ถ„์•ผ์—์„œ ๊ทผ๊ฑฐ ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ์ฃผ์žฅ ๊ฒ€์ฆ์„ ๋‹ค๋ฃจ์–ด, ํ—ˆ์œ„์ •๋ณด ๊ฒ€์ถœ ๋งฅ๋ฝ์—์„œ ๋ฐ์ดํ„ฐ์…‹๊ณผ ์ ์šฉ ๋ฐฉ๋ฒ• ์ฐจ์ด๋ฅผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ณผํ•™์  ์‚ฌ์‹ค ๊ฒ€์ฆ์—์„œ ๋ฐ˜์ฆ ์ฆ๊ฑฐ์˜ ๋ถ€์žฌ๋ฅผ ๋‹ค๋ฃจ๋Š” ๋…ผ๋ฌธ์œผ๋กœ, ๋…ผ๋ฆฌ์  ์˜ค๋ฅ˜ ๊ฒ€์ถœ ํ›„ ์‚ฌ์‹ค ๊ฒ€์ฆ์˜ ์‹ค์งˆ์  ํ•œ๊ณ„๊นŒ์ง€ ์—ฐ๊ฒฐํ•ด์„œ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ณผํ•™ ๋…ผ๋ฌธ ๋‚ด ์ž˜๋ชป๋œ ์ธ์šฉ๊ณผ ํ—ˆ์œ„์ •๋ณด ํƒ์ง€ ์„ฑ๋Šฅ์„ LLM์ด ์–ด๋–ป๊ฒŒ ๋‹ฌ์„ฑํ•˜๋Š”์ง€ ์ง์ ‘ ์‹คํ—˜ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
MetaOpenFOAM ๋…ผ๋ฌธ์€ ์ฒดํฌ๋ฆฌ์ŠคํŠธ ๊ธฐ๋ฐ˜์˜ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐ ์ •๋Ÿ‰ ํ‰๊ฐ€๋ฅผ ํ™•๋Œ€ ์ ์šฉํ•˜์—ฌ ๋…ผ๋ฆฌ์  ์˜ค๋ฅ˜ ํƒ์ง€ ๋ฐ ๋ฉ”ํƒ€๋ฆฌ๋ทฐ ์ž๋™ํ™”์— ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ์ฃผ์žฅ ๊ฒ€์ฆ์—์„œ ๋Œ€๊ทœ๋ชจ ์ฃผ์žฅ ๋ฐ์ดํ„ฐ์…‹์„ ํ™œ์šฉํ•จ์œผ๋กœ์จ, ํ—ˆ์œ„์ •๋ณด ํƒ์ง€์˜ ์ž๋ฃŒ ํ™•์žฅ ์‚ฌ๋ก€๋กœ ์ฐธ๊ณ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
NSF ์ œ์•ˆ์„œ๋ฅผ ๋Œ€์ƒ์œผ๋กœ ๋Œ€๊ทœ๋ชจ ๊ณผํ•™์  ์ฃผ์žฅ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ•˜๋ฉฐ ํ—ˆ์œ„์ •๋ณด ๋ถ„์„์˜ ์‹ค์ œ ์‚ฌ๋ก€๋กœ ์ฐธ๊ณ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
394๋Š” ๊ณผํ•™ ๋…ผ๋ฌธ ์š”์•ฝยท์†Œ๊ฐœ๊ธ€์˜ ์˜ค๋ฅ˜(์˜คํ•ด) ์‚ฌ๋ก€๋ฅผ ๋ถ„์„ํ•˜๋ฉฐ, 190์˜ ํ—ˆ์œ„ ์ƒ๊ด€๊ด€๊ณ„ ์ œ๊ฑฐ ์ ‘๊ทผ๋ฒ•์ด ์‹ค์ œ ์–ผ๋งˆ๋‚˜ ์˜ค๋ฅ˜ ์ €๊ฐ์— ๊ธฐ์—ฌํ• ์ง€ ํ† ๋ก ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•œ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
Grounding fallacies misrepresenting scientific publications ๋…ผ๋ฌธ์€ RAG ๋ฐ KG ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์ด ๋ฐœ์ƒ์‹œํ‚ค๋Š” ์˜ค์ธ์˜ ์‹ค์ œ ์‚ฌ๋ก€์™€ ํ•œ๊ณ„, ํ’ˆ์งˆ ์ €ํ•˜ ๋ฌธ์ œ๋ฅผ ๋น„ํŒ์ ์œผ๋กœ ๋ถ„์„ํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •