Bio-SIEVE: Exploring Instruction Tuning Large Language Models for Systematic Review Automation

์ €์ž: Ambrose Robinson, William Thorne, Ben Wu, Abdullah Pandor, Munira Essat, Mark Stevenson, Xingyi Song (The University of Sheffield) | ๋‚ ์งœ: 2023 | DOI: arXiv:2308.06610 📄 PDF


Essence

Figure 1

์˜๋ฃŒ ์ฒด๊ณ„์  ๋ฌธํ—Œ๊ณ ์ฐฐ(Systematic Review) ํ”„๋กœ์„ธ์Šค์—์„œ Bio-SIEVE๊ฐ€ ์ง€์›ํ•˜๋Š” ์ œ๋ชฉ ๋ฐ ์ดˆ๋ก ์Šคํฌ๋ฆฌ๋‹ ๋‹จ๊ณ„

๋ณธ ๋…ผ๋ฌธ์€ ์˜๋ฃŒ ์ฒด๊ณ„์  ๋ฌธํ—Œ๊ณ ์ฐฐ์˜ ๊ฐ€์žฅ ๋น„์šฉ ์ง‘์•ฝ์ ์ธ ๋‹จ๊ณ„์ธ ์ดˆ๋ก ์Šคํฌ๋ฆฌ๋‹์„ ์ž๋™ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ์ง€์‹œ์–ด ๋ฏธ์„ธ์กฐ์ •(instruction tuning)์„ ํ†ตํ•ด ๋Œ€๊ทœ๋ชจ์–ธ์–ด๋ชจ๋ธ(LLM)์„ ํŠนํ™”์‹œํ‚จ Bio-SIEVE๋ฅผ ์ œ์‹œํ•œ๋‹ค. ์ด ๋ชจ๋ธ์€ ChatGPT๋ฅผ ๋Šฅ๊ฐ€ํ•˜๋Š” ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉด์„œ๋„ ์˜๋ฃŒ ์˜์—ญ ๊ฐ„ ์šฐ์ˆ˜ํ•œ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ˜๋‹ค.

Motivation

Achievement

Figure 2

ํ•™์Šต ๋ฐ์ดํ„ฐ์…‹์˜ ํฌํ•จ/๋ฐฐ์ œ ๋ถ„๋ฅ˜์— ๋”ฐ๋ฅธ ์ฃผ์ œ ๋ถ„ํฌ

  1. ์šฐ์ˆ˜ํ•œ ๋ถ„๋ฅ˜ ์„ฑ๋Šฅ: Bio-SIEVE๋Š” ChatGPT์™€ ๊ธฐ์กด ํ•™์Šต ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์„ ๋ชจ๋‘ ๋Šฅ๊ฐ€ํ•˜๋ฉฐ, ํŠนํžˆ ๋ฐฐ์ œ ์‚ฌ๋ก€์—์„œ ๋†’์€ ์ •ํ™•๋„๋ฅผ ๋‹ฌ์„ฑํ•œ๋‹ค(์˜ˆ: ๊ตฌ๊ฐ• ๊ฑด๊ฐ• ๋ฆฌ๋ทฐ์—์„œ ๊ทผ์œก ์™ธ์ƒ ์—ฐ๊ตฌ ์„ฑ๊ณต์  ๋ฐฐ์ œ).
  2. ๋„๋ฉ”์ธ ๊ฐ„ ์ผ๋ฐ˜ํ™”: ์—ฌ๋Ÿฌ ์˜๋ฃŒ ์˜์—ญ์— ๊ฑธ์ณ ๋” ๋‚˜์€ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ๋ณด์—ฌ, ๋ฏธํ•™์Šต ์ฒด๊ณ„์  ๋ฌธํ—Œ๊ณ ์ฐฐ์— ๋Œ€ํ•œ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ์ž…์ฆํ•œ๋‹ค.
  3. ์„ค๋ช… ๊ฐ€๋Šฅ์„ฑ: ๋ฐฐ์ œ ์ด์œ  ์ž๋™ ์ƒ์„ฑ ๊ธฐ๋Šฅ์œผ๋กœ ๋ชจ๋ธ์˜ ์˜์‚ฌ๊ฒฐ์ • ๊ณผ์ •์— ๋Œ€ํ•œ ํˆฌ๋ช…์„ฑ์„ ์ œ๊ณตํ•˜์—ฌ ์งˆ์  ๊ฒ€์ฆ ๋ฉ”์ปค๋‹ˆ์ฆ˜์œผ๋กœ ํ™œ์šฉ ๊ฐ€๋Šฅํ•˜๋‹ค.
  4. ์žฌํ˜„์„ฑ๊ณผ ํˆฌ๋ช…์„ฑ: ๋ชจ๋ธ ๊ฐ€์ค‘์น˜, ์ฝ”๋“œ, ๋ฐ์ดํ„ฐ์…‹ ์žฌ๊ตฌ์„ฑ์„ ์œ„ํ•œ DOI ๋ชฉ๋ก์„ ๊ณต๊ฐœํ•˜์—ฌ ์™„์ „ํ•œ ์žฌํ˜„์„ฑ์„ ๋ณด์žฅํ•œ๋‹ค.

How

Originality

Limitation & Further Study

Evaluation

์ดํ‰: Bio-SIEVE๋Š” ์ฒด๊ณ„์  ๋ฌธํ—Œ๊ณ ์ฐฐ ์ž๋™ํ™”์— ํŠนํ™”๋œ LLM์„ ์ œ์‹œํ•จ์œผ๋กœ์จ ๊ณ ๊ฐ€์˜ ์˜๋ฃŒ ๋ฆฌ๋ทฐ ํ”„๋กœ์„ธ์Šค ๊ฐœ์„ ์— ์œ ์˜๋ฏธํ•œ ๊ธฐ์—ฌ๋ฅผ ํ•œ๋‹ค. ์žฌํ˜„ ๊ฐ€๋Šฅํ•œ ๊ณต๊ฐœ ๋ชจ๋ธ ๊ณต๊ธ‰๊ณผ ๋ฐฐ์ œ ์ด์œ  ์ƒ์„ฑ์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ๊ณผ์ œ ๋„์ž…์€ ์ด ์—ฐ๊ตฌ์˜ ๊ฐ•์ ์ด๋‚˜, ์‹ค์ œ ์ž„์ƒ ํ™˜๊ฒฝ์—์„œ์˜ ๊ฒ€์ฆ๊ณผ ๋‹ค์ค‘์ž‘์—… ํ•™์Šต ์„ฑ๋Šฅ ๊ฐœ์„ ์ด ํ–ฅํ›„ ํ•„์ˆ˜ ๊ณผ์ œ์ด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
161์€ ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ํ…์ŠคํŠธ ์ „์šฉ์œผ๋กœ ์‚ฌ์ „ํ•™์Šต๋œ BioBERT๋ฅผ ์ œ์•ˆํ•˜๋ฉฐ, 159์™€ ๊ฐ™์ด ๋„๋ฉ”์ธ ํŠนํ™” LLM ๊ฐœ๋ฐœ์˜ ์„ ํ–‰ ๊ธฐ์ˆ ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Bio-SIEVE๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์˜ํ•™ QA ๋ฒค์น˜๋งˆํฌ๋กœ, MMSD2.0๊ณผ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ์ดํ„ฐ์˜ ์‹ ๋ขฐ์„ฑ ๋ฐ ํŽธํ–ฅ ์ œ๊ฑฐ ์ด์Šˆ๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์˜๋ฃŒ ๋ฌธํ—Œ ๋ถ„๋ฅ˜ ๋ฐ ์Šคํฌ๋ฆฌ๋‹์—์„œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์˜๋ฃŒ AI์—์„œ LLM์˜ ํ•œ๊ณ„์™€ hallucination ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
862๋Š” AI ๋ชจ๋ธ์˜ ์ฒด๊ณ„์  ๋ฌธํ—Œ๊ณ ์ฐฐ ์ž๋™ํ™” ์‹ค์ œ ์ ์šฉ์‚ฌ๋ก€๋ฅผ ๋‹ค๋ฃจ์–ด, 159์˜ Bio-SIEVE LLM ๊ธฐ๋ฐ˜ ์ž๋™ ์Šคํฌ๋ฆฌ๋‹๊ณผ ๋น„๊ต ๋Œ€์ƒ์œผ๋กœ ์ ํ•ฉํ•˜๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Bio-SIEVE ๋…ผ๋ฌธ์€ PubMedQA์™€ ๊ฐ™์€ QA ๋ฐ์ดํ„ฐ์…‹์—์„œ instruction tuning์„ ํ†ตํ•ด LLM ๊ธฐ๋ฐ˜ ๋‹ต๋ณ€์˜ ์‹ ๋ขฐ๋„๋ฅผ ์‹ฌ์ธต์ ์œผ๋กœ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
Instruction tuning ๋“ฑ ๋‹ค์–‘ํ•œ ์ตœ์ ํ™” ๋ฐฉ๋ฒ•์ด ์‹ค์ œ QA ํƒœ์Šคํฌ์—์„œ ์–ผ๋งˆ๋‚˜ ์ฐจ์ด๋ฅผ ๋งŒ๋“œ๋Š”์ง€, ๋น„๊ต ๋ถ„์„ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •