Model-in-the-loop (milo): Accelerating multimodal ai data annotation with llms

์ €์ž: Y. Q. Wang, David Stevens, Pranay Shah, Wenwen Jiang, Miao Liu, Xu Chen, Robert Kuo, Na Li, Boying Gong, Daniel J. Lee, Jiabo Hu, Ning Zhang, Bob Kamma | ๋‚ ์งœ: 2024 | DOI: ๋ฏธ์ œ๊ณต 📄 PDF


Essence

Figure 1

MILO ํ”„๋ ˆ์ž„์›Œํฌ: ๋ฐ์ดํ„ฐ ์ฃผ์„ ์‹œ์Šคํ…œ์— AI/ML ๋ชจ๋ธ์„ ํ†ตํ•ฉํ•˜๋Š” ๊ตฌ์กฐ

๋ณธ ๋…ผ๋ฌธ์€ ์ „๋ฌธ ์ธ๊ฐ„ ์ฃผ์„์ž์™€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์˜ ํ˜‘๋ ฅ์„ ํ†ตํ•ด ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI ๋ฐ์ดํ„ฐ ์ฃผ์„ ํ”„๋กœ์„ธ์Šค๋ฅผ ๊ฐ€์†ํ™”ํ•˜๋Š” Model-in-the-Loop (MILO) ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•œ๋‹ค. LLM์„ ์‚ฌ์ „ ์ฃผ์„, ์‹ค์‹œ๊ฐ„ ๋ณด์กฐ, ๊ฒ€์ฆ์ž๋กœ ํ™œ์šฉํ•˜์—ฌ ์ฃผ์„ ์‹œ๊ฐ„ ๋‹จ์ถ• ๋ฐ ํ’ˆ์งˆ ํ–ฅ์ƒ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค.

Motivation

Achievement

Figure 2

๋ฏธ์„ธ์กฐ์ •๋œ Llama ๋ชจ๋ธ์˜ ROC ๊ณก์„  ๋ฐ AUC ๋ฉ”ํŠธ๋ฆญ

Figure 4

์‚ฌ์ „ ์ฃผ์„ LLM ๋ณด์กฐ ๊ธฐ๋Šฅ์˜ ์œ ๋ฌด์— ๋”ฐ๋ฅธ ์ž‘์—…๋‹น ์ฒ˜๋ฆฌ ์‹œ๊ฐ„ ์ฐจ์ด(์ดˆ)

  1. ์ฃผ์„ ํšจ์œจ์„ฑ ํ–ฅ์ƒ: ์‚ฌ์ „ ์ฃผ์„(pre-annotation) LLM ๋ณด์กฐ ๊ธฐ๋Šฅ์„ ํ†ตํ•ด ์ฃผ์„ ์ฒ˜๋ฆฌ ์‹œ๊ฐ„์„ ํ˜„์ €ํžˆ ๋‹จ์ถ•. ์‹ค์‹œ๊ฐ„ LLM ๋ณด์กฐ ๊ธฐ๋Šฅ์€ ๋ณต์žกํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ฃผ์„(์˜ˆ: ์‹œ๊ฐ์  ์งˆ์˜์‘๋‹ต)์—์„œ ์ฒ˜๋ฆฌ ์‹œ๊ฐ„์„ ์ ˆ๊ฐํ•˜๊ณ  ํ’ˆ์งˆ์„ ๊ฐœ์„ .
  2. ์ฃผ์„ ํ’ˆ์งˆ ๊ฐœ์„ : LLM ํŒ์ •์ž(judge)๋กœ์„œ์˜ ์—ญํ• ์„ ํ†ตํ•ด ์ฃผ์„ ์ผ๊ด€์„ฑ ํ™•๋ณด ๋ฐ ๊ฐœ๋ฐฉํ˜• ์ฃผ์„์— ๋Œ€ํ•œ ์„ธ๋ถ„ํ™”๋œ ํ”ผ๋“œ๋ฐฑ ์ œ๊ณต. ์ธ๊ฐ„ ๊ฒ€์ˆ˜์ž์˜ ํŽธํ–ฅ ๊ฐ์†Œ ๋ฐ ๊ฐ๊ด€์  ํ‰๊ฐ€ ๊ธฐ์ค€ ์ œ์‹œ.
  3. ์ฃผ์„์ž ๊ฒฝํ—˜ ํ–ฅ์ƒ: ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์ œ์•ˆ๊ณผ ์ปจํ…์ŠคํŠธ ์ •๋ณด ์ œ๊ณต์œผ๋กœ ์ธ์ง€ ๋ถ€ํ•˜ ๊ฐ์†Œ, ์ฃผ์„์ž ๋งŒ์กฑ๋„ ๋ฐ ์ฐธ์—ฌ๋„ ์ฆ๊ฐ€.

How

Figure 3

์‚ฌ์ „ ์ฃผ์„ LLM ๋ณด์กฐ ๊ธฐ๋Šฅ์ด ํฌํ•จ๋œ ์ฝ”๋ฉ˜ํŠธ ๋ถ„๋ฅ˜ ์ฃผ์„ UI์˜ ์˜ˆ์‹œ

Figure 5

์‹œ๊ฐ์  ์งˆ์˜์‘๋‹ต(VQA) ์ฃผ์„์„ ์œ„ํ•œ ์‹ค์‹œ๊ฐ„ LLM ๋ณด์กฐ ๊ธฐ๋Šฅ ํฌํ•จ/๋ฏธํฌํ•จ UI ๋น„๊ต

MILO ํ”„๋ ˆ์ž„์›Œํฌ์˜ 3๊ฐ€์ง€ ํ•ต์‹ฌ ์—ญํ• :

์‹œ์Šคํ…œ ๊ตฌ์„ฑ:

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 4/5 Significance: 5/5 Clarity: 4/5 Overall: 4.3/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ AI ๊ฐœ๋ฐœ์—์„œ ์‹ค์ œ์  ๊ฐ€์น˜๊ฐ€ ํฐ ์ธ๊ฐ„-LLM ํ˜‘๋ ฅ ์ฃผ์„ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•˜๋ฉฐ, ์‹ค์ œ ํ”„๋กœ๋•์…˜ ํ™˜๊ฒฝ์—์„œ์˜ ๊ฒ€์ฆ์„ ํ†ตํ•ด ์‚ฐ์—…์  ๊ธฐ์—ฌ๋„๊ฐ€ ๋†’๋‹ค. ๋‹ค๋งŒ ๋ชจ๋ธ ํŽธํ–ฅ ์ „ํŒŒ, ๋น„์šฉ-ํŽธ์ต ๋ถ„์„, ๋‹ค์–‘ํ•œ ๋งฅ๋ฝ์—์„œ์˜ ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ์— ๋Œ€ํ•œ ๋ณด์™„์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณผํ•™์  ๋ฐ์ดํ„ฐ ๊ตฌ์ถ• ๋ฐ ์ฃผ์„์—์„œ ์ธ๊ฐ„๊ณผ AI ์—์ด์ „ํŠธ์˜ ํ˜‘์—… ํ”„๋ ˆ์ž„์›Œํฌ์— ๊ด€ํ•œ ๊ธฐ๋ณธ ๊ฐœ๋…์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
228๋ฒˆ CoAuthor ๋…ผ๋ฌธ์€ ๋…ผ๋ฌธ ์ž‘์„ฑ ์ธก๋ฉด์—์„œ ์ธ๊ฐ„๊ณผ AI์˜ ํ˜‘์—… ๊ณผ์ •์„ ์‹ฌ์ธต ๋ถ„์„ํ•˜์—ฌ, 553๋ฒˆ์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI ๋ฐ์ดํ„ฐ Annotation ์ž‘์—…์—์„œ์˜ ์ธ๊ฐ„-AI ํ˜‘์—…์— ๋‹ค๋ฅธ ์ธก๋ฉด์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™์  ์งˆ์˜์‘๋‹ต ์ƒ์„ฑ์— retrieval+generation ์—์ด์ „ํŠธ ๊ตฌ์กฐ๋ฅผ ์ ์šฉ, ๋ฐ์ดํ„ฐ ์ฃผ์„ ๊ฐ€์† ๋ชฉ์ ์—์„œ์˜ ๋‹ค์–‘ํ•œ agentic ์ „๋žต์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ์ž๊ธฐ ๊ฐœ์„ ์„ ์œ„ํ•œ ๋‹ค๋ฅธ ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ ์ฃผ์„์—์„œ ํฌ๋ผ์šฐ๋“œ์†Œ์‹ฑ ๋Œ€์‹  LLM ์‚ฌ์šฉ์ด ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ๊ณผ ํšจ์œจ์„ฑ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ์‹คํ—˜์ ์œผ๋กœ ๋ถ„์„ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
MILO๋Š” ์ „๋ฌธ ๋ฐ์ดํ„ฐ ์ฃผ์„์—์„œ ์ธ๊ฐ„-AI ํ˜‘๋ ฅ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํƒ์ƒ‰ํ•˜๋ฉฐ, MedAgents๋Š” ์ž„์ƒ์  ์˜์‚ฌ๊ฒฐ์ • ์ค‘์‹ฌ์˜ ํ˜‘๋ ฅ๋ฐฉ์‹์„ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
553์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ์ดํ„ฐ ํ˜‘์—… ํ”„๋ ˆ์ž„์›Œํฌ๋Š” PaperBanana๊ฐ€ ์ œ์‹œํ•œ ํ•™์ˆ  ์‹œ๊ฐํ™” ์ž๋™ํ™” ํ™˜๊ฒฝ ๊ตฌ์ถ•์— ์‹ค์งˆ์  ์ž…๋ ฅ(๋ฐ์ดํ„ฐ ๋ผ๋ฒจ๋ง ๋“ฑ) ๊ด€์ ์—์„œ ๋ณด์™„์ฒด๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AI๊ฐ€ ๋ฌธํ—Œ ๋ฆฌ๋ทฐ ๋ฐ ํ‰๊ฐ€์— ๋ฏธ์น˜๋Š” ๊ตฌ์ฒด์  ์˜ํ–ฅ๊ณผ ํ•œ๊ณ„๋ฅผ ์‹ค์ œ ์‚ฌ๋ก€๋กœ ๋ถ„์„ํ•˜๋ฉฐ, MILO์˜ ๊ฒ€์ฆ์ž-ํ˜‘์—… ๋ชจ๋ธ ์‘์šฉ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์‹ค์ œ AI-๋ณด์กฐ ์ฒด๊ณ„๊ฐ€ ์‹œ์Šคํ…œ ๋ฆฌ๋ทฐ์— ์–ด๋–ป๊ฒŒ ํ™œ์šฉ๋˜๋Š”์ง€ ๊ฒฝํ—˜์  ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
PaperBanana์˜ ์ž๋™ ์‹œ๊ฐํ™” ์‹œ์Šคํ…œ์€ MILO์—์„œ ์ƒ์„ฑยท์ฃผ์„๋œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ์ดํ„ฐ์…‹์„ ์‹ค์ œ ํ•™์ˆ  ์ถœํŒ ๋‹ค์ด์–ด๊ทธ๋žจ ์ƒ์„ฑ ํŒŒ์ดํ”„๋ผ์ธ์— ์ ์šฉํ•ด ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
๊ณผํ•™์  ๋ฆฌ๋ทฐ, ์ฃผ์„ ์ž‘์„ฑ์˜ AI ์ ์šฉ์‹œ ํ’ˆ์งˆ ์ €ํ•˜, ๊ฒ€์ฆ ์ด์Šˆ ๋“ฑ ํ•œ๊ณ„์ ์„ ์‹ค์ฆ์ ์œผ๋กœ ๋ถ„์„ํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •