Automated review generation method based on large language models

์ €์ž: Shican Wu, Xiao Ma, Dehui Luo, Lulu Li, Xiangcheng Shi, Xin Chang, Xiaoyun Lin, Ran Luo, Chunlei Pei, Du, Changying, Zhiโ€Jian Zhao, Jinlong Gong | ๋‚ ์งœ: 2024 | DOI: [๋ฏธ์ œ๊ณต] 📄 PDF


Essence

๋Œ€๊ทœ๋ชจ์–ธ์–ด๋ชจ๋ธ(LLM)์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•™์ˆ ๋…ผ๋ฌธ ๊ฒ€์ƒ‰, ๋ถ„์„, ๋ฆฌ๋ทฐ ์ƒ์„ฑ์„ ์ „์ž๋™ํ™”ํ•˜๋Š” ์—”๋“œ-ํˆฌ-์—”๋“œ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•˜๋ฉฐ, ํ†ต๊ณ„์ ์œผ๋กœ ๊ฒ€์ฆ๋œ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํ†ตํ•ด ์ƒ์„ฑ๋œ ๋ฆฌ๋ทฐ๊ฐ€ ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€ ์ˆ˜์ค€๊ณผ ๋™๋“ฑ ์ด์ƒ์˜ ํ’ˆ์งˆ์„ ๋‹ฌ์„ฑํ•จ์„ ์ž…์ฆํ•œ๋‹ค.

Motivation

Achievement

Figure 5

์ž๋™ํ™”๋œ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐฉ๋ฒ•์˜ ํ”Œ๋กœ์šฐ์ฐจํŠธ

  1. ํ”„๋กœํŒŒ์ธ ํƒˆ์ˆ˜ํ™”(Propane Dehydrogenation, PDH) ์ด‰๋งค ์‚ฌ๋ก€ ์—ฐ๊ตฌ:
    • Google Scholar์—์„œ 1420๊ฐœ ์ดˆ๊ธฐ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ ์ค‘ ์ด์ค‘ ํ•„ํ„ฐ๋ง์œผ๋กœ 343๊ฐœ ๊ด€๋ จ ๋ฌธํ—Œ ์„ ๋ณ„, ์ตœ์ข… 238๊ฐœ ํ™•์ธ
    • 35๊ฐœ ์ฃผ์ œ, ๋‹ค์ค‘ ์ธต ํ’ˆ์งˆ ๊ด€๋ฆฌ๋ฅผ ํ†ตํ•ด ํฌ๊ด„์ ์ธ ๋ฆฌ๋ทฐ ์ƒ์„ฑ
    • ํ‰๊ท  ์ดˆ๋‹น ๋‹จ์œ„์˜ ์ฒ˜๋ฆฌ ์†๋„(LLM ๊ณ„์ •๋‹น)
  2. ํ’ˆ์งˆ ํ‰๊ฐ€ ๋ฐ ๊ฒ€์ฆ:
    • Claude 3.5 Sonnet๊ณผ Qwen2-72b-Instruct ๋ชจ๋ธ์ด ๋†’์€ ์‹ ๋ขฐ๋„ ๋‹ฌ์„ฑ (ICC ํ‰๊ท  74.16%, 69.23%)
    • ํ†ต๊ณ„์  ๊ฒ€์ฆ(Intraclass Correlation Coefficient, Transitive Consistency Ratio)์œผ๋กœ ์ธ๊ฐ„ ํ‰๊ฐ€ ๊ธฐ์ค€ ์ถฉ์กฑ ํ™•์ธ
    • ํ• ๋ฃจ์‹œ๋„ค์ด์…˜ ์œ„ํ—˜์„ 95% ์‹ ๋ขฐ๋„์—์„œ 0.5% ์ดํ•˜๋กœ ๊ฐ์†Œ
  3. ๋ฒ”์šฉ์„ฑ ์ž…์ฆ:
    • 1041๊ฐœ ๋…ผ๋ฌธ ํ™•์žฅ ๋ถ„์„์œผ๋กœ ์ด‰๋งค ํŠน์„ฑ์— ๋Œ€ํ•œ ํฌ๊ด„์  ํ†ต์ฐฐ ์ œ๊ณต
    • ๋„๋ฉ”์ธ ํŠนํ™” ํ›ˆ๋ จ ์—†์ด ๋‹ค์–‘ํ•œ ํ•™๋ฌธ ๋ถ„์•ผ์— ์ ์šฉ ๊ฐ€๋Šฅํ•จ์„ ์ž…์ฆ

How

Figure 1

์ด์ค‘ ๊ธฐ์ค€์„  ๋ฆฌ๋ทฐ ํ’ˆ์งˆ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์‹ ๋ขฐ์„ฑ ๊ฒ€์ฆ ๊ฒฐ๊ณผ

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์ž๋™ํ™” ๋ฆฌ๋ทฐ ์ƒ์„ฑ์˜ ์‹ค์šฉ์  ๊ตฌํ˜„์„ ๋ณด์—ฌ์ฃผ๋Š” ๊ฐ€์น˜ ์žˆ๋Š” ์—ฐ๊ตฌ์ด๋ฉฐ, ์ด์ค‘ ๊ธฐ์ค€์„  ํ‰๊ฐ€ ๋ฐ ๋‹ค์ธต ํ’ˆ์งˆ ๊ด€๋ฆฌ ์ „๋žต์€ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ํ•™์ˆ  AI ๋„๊ตฌ ๊ฐœ๋ฐœ์˜ ์ค‘์š”ํ•œ ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค. ๋‹ค๋งŒ PDH ์ด‰๋งค ๋‹จ์ผ ๋ถ„์•ผ ๊ฒ€์ฆ๊ณผ ๋Œ€๊ทœ๋ชจ ๋ชจ๋ธ ์˜์กด์„ฑ์€ ๊ด‘๋ฒ”์œ„ํ•œ ์ฑ„ํƒ์„ ์ œํ•œํ•  ์ˆ˜ ์žˆ์–ด, ๋‹ค์–‘ํ•œ ๋ถ„์•ผ ๊ฒ€์ฆ๊ณผ ์†Œํ˜• ๋ชจ๋ธ ์ตœ์ ํ™” ์—ฐ๊ตฌ๊ฐ€ ํ›„์†๋˜๋ฉด ๋”์šฑ ๊ฐ•ํ™”๋  ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ๋ฉ๋‹ˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
126๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ ์ž๋™ํ™”์— ๊ด€ํ•œ ๊ธฐ๋ณธ ํ‹€๊ณผ ๋ฉ”ํŠธ๋ฆญ์„ ์ œ๊ณตํ•ด Pre ์–ดํ”„๋กœ์น˜์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM์„ ์ด์šฉํ•œ ์ž๋™ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ, ๋‹ค์ค‘ ์—์ด์ „ํŠธ ํ˜‘์—… ๋Œ€๋น„ ๋‹จ์ผ ๋ชจ๋ธ์˜ ํ•œ๊ณ„ ๋ฐ ์ž…๋ ฅ ํ™•์žฅ์„ฑ ์ฐจ์ด๋ฅผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewerGPT ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ์ž๋™ ์ƒ์„ฑ์˜ ์‹ค์ œ ์‚ฌ์šฉ์„ฑ ๋ฐ ํ•œ๊ณ„, ํ’ˆ์งˆ ํ‰๊ฐ€ ์ธก๋ฉด์—์„œ ๋น„๊ต ์ฝ๊ธฐ์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ž๋™ํ™”๋œ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐฉ๋ฒ•์„ ๋‹ค๋ฃจ๋Š” Automated review generation ๋…ผ๋ฌธ์€ ๋ฐ˜๋ณต ์ตœ์ ํ™”๊ฐ€ ์•„๋‹Œ ๋‹ค๋ฅธ ํ•™์Šต ๋ฐ ํ‰๊ฐ€ ์ „๋žต์„ ๋น„๊ต ๋Œ€์ƒ์œผ๋กœ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Automated review generation ๋…ผ๋ฌธ๋„ LLM์„ ํ™œ์šฉํ•œ ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ์ž๋™ํ™”๋กœ, CHIME ๋ฐฉ์‹๊ณผ ๋น„๊ต๋  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
677์€ ํ”„๋กฌํ”„ํŠธ ์ตœ์ ํ™”๋ฅผ ํ†ตํ•œ AI ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•˜์—ฌ, 126์˜ ์—”๋“œ-ํˆฌ-์—”๋“œ LLM ์ž๋™ ๋ฆฌ๋ทฐ ๋ฐฉ๋ฒ•๊ณผ ๋Œ€์กฐ์  ์ ‘๊ทผ์„ ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
676์€ AI ๋ฆฌ๋ทฐ์™€ ์ธ๊ฐ„ ๋ฆฌ๋ทฐ๋ฅผ ๋น„๊ต ๋ถ„์„ํ•˜๋ฉฐ, 126์˜ ์ „์ž๋™ํ™” ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ๊ณผ ์ƒํ˜ธ๋ณด์™„์ ์œผ๋กœ ์ฝํž ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ถ„์ž๋™์—ญํ•™ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์— AI๋ฅผ ์ ์šฉํ•˜๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜์˜ ์ž๋™ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐ ๊ตฌ์กฐํ™” ๋ฐฉ์•ˆ์— ๋Œ€ํ•œ ๋Œ€์•ˆ์  ์ ‘๊ทผ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ ๋ฆฌ๋ทฐ ์ž๋™ ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•˜๋ฉด์„œ, ๊ต์œก ๋ฐ ์‹ค์ œ ๋ฆฌ๋ทฐ ๋ณด์กฐ ํšจ๊ณผ์— ๋Œ€ํ•œ ์ฒด๊ณ„์  ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ์ž๋™ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ์‹œ์Šคํ…œ์˜ ํšจ๊ณผ์™€ ํ•œ๊ณ„๋ฅผ ๋…ผ์˜ํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ ํ…์ŠคํŠธ ๋ถ„๋ฅ˜ ๋ฐ ์‹ฌ์‚ฌ ์ž๋™ํ™”์˜ ๋Œ€์•ˆ์  ์ ‘๊ทผ๋ฒ•๊ณผ ์„ฑ๋Šฅ ๋น„๊ต๋ฅผ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ•™์ˆ  ๋ถ„์•ผ์˜ ์ง€์  ์ง„ํ™”๋ฅผ ๋„คํŠธ์›Œํฌ ๋ถ„์„ ๋˜๋Š” NLP ๋ฐฉ๋ฒ•์œผ๋กœ ์ถ”์ ํ•œ ์œ ์‚ฌ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋Œ€ํ˜• ์–ธ์–ด๋ชจ๋ธ์˜ ํ‰๊ฐ€ ๋Šฅ๋ ฅ๊ณผ ์ „๋ฌธ๊ฐ€ ํŒ๋‹จ ๋น„๊ต๋ผ๋Š” ์œ ์‚ฌํ•œ ์ฃผ์ œ๋ฅผ ๋‹ค๋ฃฌ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
128์€ 126์—์„œ ์ œ์•ˆํ•œ LLM ๋ฆฌ๋ทฐ ์ƒ์„ฑ์˜ focus-level ํ‰๊ฐ€ ๋ฐ ์ธ๊ฐ„ ์ „๋ฌธ์„ฑ ๋น„๊ต๋ฅผ ๋” ๊ตฌ์ฒด์ ์œผ๋กœ ๋ถ„์„ํ•˜์—ฌ, ์„ฑ๋Šฅ์˜ ํ•œ๊ณ„์™€ ๊ฐœ์„ ์ ์„ ๋„์ถœํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Remor๋Š” LLM ๊ธฐ๋ฐ˜ ์ž๋™ ๋ฆฌ๋ทฐ ์ƒ์„ฑ์— human-like ํ‰๊ฐ€ ์ฒ™๋„๋ฅผ ์ ์šฉ, ์ด ๋…ผ๋ฌธ์˜ ์—”๋“œ-ํˆฌ-์—”๋“œ ์ž๋™ ๋ฆฌ๋ทฐ ์ƒ์„ฑ๊ณผ ์ง์ ‘ ๋น„๊ต ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
270์€ LLM ๊ธฐ๋ฐ˜ ํ”ผ์–ด๋ฆฌ๋ทฐ ์ž๋™ ์ž‘์„ฑ ํƒ์ง€์™€ ํ‰๊ฐ€ ์‚ฌ๋ก€๋กœ, 126์˜ ์ž๋™ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ์ฒด๊ณ„๋ฅผ ์‹ค์ œ ๋ฆฌ๋ทฐ ํ”„๋กœ์„ธ์Šค์™€ ์—ฐ๊ฒฐํ•ด์ค๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
What ChatGPT and generative AI mean for science ๋…ผ๋ฌธ์€ AI ๊ธฐ๋ฐ˜ ๋ฆฌ๋ทฐ ์ƒ์„ฑ์˜ ๊ฐ€๋Šฅ์„ฑ๊ณผ ํ•œ๊ณ„๋ฅผ ํ˜„์žฅ ์—ฐ๊ตฌ์ž ์ธํ„ฐ๋ทฐ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์กฐ๋งํ•˜์—ฌ ์‹ค์งˆ์  ์ƒํƒœ๊ณ„ ์˜ํ–ฅ์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •