์ ์: Y. Q. Wang, David Stevens, Pranay Shah, Wenwen Jiang, Miao Liu, Xu Chen, Robert Kuo, Na Li, Boying Gong, Daniel J. Lee, Jiabo Hu, Ning Zhang, Bob Kamma | ๋ ์ง: 2024 | DOI: ๋ฏธ์ ๊ณต 📄 PDF
Essence
MILO ํ๋ ์์ํฌ: ๋ฐ์ดํฐ ์ฃผ์ ์์คํ
์ AI/ML ๋ชจ๋ธ์ ํตํฉํ๋ ๊ตฌ์กฐ
๋ณธ ๋
ผ๋ฌธ์ ์ ๋ฌธ ์ธ๊ฐ ์ฃผ์์์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ํ๋ ฅ์ ํตํด ๋ฉํฐ๋ชจ๋ฌ AI ๋ฐ์ดํฐ ์ฃผ์ ํ๋ก์ธ์ค๋ฅผ ๊ฐ์ํํ๋ Model-in-the-Loop (MILO) ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. LLM์ ์ฌ์ ์ฃผ์, ์ค์๊ฐ ๋ณด์กฐ, ๊ฒ์ฆ์๋ก ํ์ฉํ์ฌ ์ฃผ์ ์๊ฐ ๋จ์ถ ๋ฐ ํ์ง ํฅ์์ ๋ฌ์ฑํ๋ค.
How
์ฌ์ ์ฃผ์ LLM ๋ณด์กฐ ๊ธฐ๋ฅ์ด ํฌํจ๋ ์ฝ๋ฉํธ ๋ถ๋ฅ ์ฃผ์ UI์ ์์
์๊ฐ์ ์ง์์๋ต(VQA) ์ฃผ์์ ์ํ ์ค์๊ฐ LLM ๋ณด์กฐ ๊ธฐ๋ฅ ํฌํจ/๋ฏธํฌํจ UI ๋น๊ต
MILO ํ๋ ์์ํฌ์ 3๊ฐ์ง ํต์ฌ ์ญํ :
- ์ฌ์ ์ฃผ์ ๋ณด์กฐ(Pre-annotation Assistant): ๋ฏธ์ธ์กฐ์ ๋ LLM์ ํ์ฉํ์ฌ ์ฃผ์ ์ ๋จ๊ณ์์ ์์ธก ๋ผ๋ฒจ๊ณผ ์ ๋ขฐ๋ ์ ์ ์ ๊ณต, ์ฃผ์์์ ์ ํ ๊ณต๊ฐ ์ฌ์ ์ถ์
- ์ค์๊ฐ ๋ณด์กฐ(Real-time Assistant): ์ฃผ์ ์์
์ค LLM์ด ์ปจํ
์คํธ ๊ธฐ๋ฐ ์ ์, ์ค๋ช
, ๊ด๋ จ ์ ๋ณด๋ฅผ ์ค์๊ฐ์ผ๋ก ์ ๊ณตํ์ฌ ๋ณต์กํ ๋ฉํฐ๋ชจ๋ฌ ์์
์ง์
- ๊ฒ์ฆ์(Judge): ์ฃผ์์์ ์๋ต์ ํ๊ฐํ๊ณ ๊ฐ๊ด์ ์ธ ํผ๋๋ฐฑ ์ ๊ณต, ํ์ง ๊ธฐ์ค ์ ์ฉ ๋ฐ ๋ถ์ผ์น ํ์ง
์์คํ
๊ตฌ์ฑ:
- ์ธ๊ฐ ํ์์: ์ฃผ์์(annotators), ๊ฐ์ฌ์(auditors), ์ฐ๊ตฌ์(researchers)
- ์
๋ ฅ ๋ฐ์ดํฐ: ๋น๋ผ๋ฒจ๋ ํ
์ด๋ธํ ๋ฐ์ดํฐ(์ด๋ฏธ์ง, ๋น๋์ค, ํ
์คํธ, ์ฑํ
๋ฑ)
- ์ถ๋ ฅ: ๋ผ๋ฒจ/์ฃผ์ ๋ฐ ๋ฉํ๋ฐ์ดํฐ
- ํ์ง ๋ฃจ๋ธ๋ฆญ: ์ฃผ๊ด์ ๊ธฐ์ค ํ๊ฐ ๋ฐ ๋ฏธ์ธ ์กฐ์ ์ ์ํ ํ๊ฐ ์งํ
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 5/5 Clarity: 4/5 Overall: 4.3/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ๋๊ท๋ชจ AI ๊ฐ๋ฐ์์ ์ค์ ์ ๊ฐ์น๊ฐ ํฐ ์ธ๊ฐ-LLM ํ๋ ฅ ์ฃผ์ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, ์ค์ ํ๋ก๋์
ํ๊ฒฝ์์์ ๊ฒ์ฆ์ ํตํด ์ฐ์
์ ๊ธฐ์ฌ๋๊ฐ ๋๋ค. ๋ค๋ง ๋ชจ๋ธ ํธํฅ ์ ํ, ๋น์ฉ-ํธ์ต ๋ถ์, ๋ค์ํ ๋งฅ๋ฝ์์์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ ๋ํ ๋ณด์์ด ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ๋ฐ์ดํฐ ๊ตฌ์ถ ๋ฐ ์ฃผ์์์ ์ธ๊ฐ๊ณผ AI ์์ด์ ํธ์ ํ์
ํ๋ ์์ํฌ์ ๊ดํ ๊ธฐ๋ณธ ๊ฐ๋
์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
228๋ฒ CoAuthor ๋
ผ๋ฌธ์ ๋
ผ๋ฌธ ์์ฑ ์ธก๋ฉด์์ ์ธ๊ฐ๊ณผ AI์ ํ์
๊ณผ์ ์ ์ฌ์ธต ๋ถ์ํ์ฌ, 553๋ฒ์ ๋ฉํฐ๋ชจ๋ฌ AI ๋ฐ์ดํฐ Annotation ์์
์์์ ์ธ๊ฐ-AI ํ์
์ ๋ค๋ฅธ ์ธก๋ฉด์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ์ ์ง์์๋ต ์์ฑ์ retrieval+generation ์์ด์ ํธ ๊ตฌ์กฐ๋ฅผ ์ ์ฉ, ๋ฐ์ดํฐ ์ฃผ์ ๊ฐ์ ๋ชฉ์ ์์์ ๋ค์ํ agentic ์ ๋ต์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ์๊ธฐ ๊ฐ์ ์ ์ํ ๋ค๋ฅธ ๊ฐํํ์ต ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ
์คํธ ๋ฐ์ดํฐ ์ฃผ์์์ ํฌ๋ผ์ฐ๋์์ฑ ๋์ LLM ์ฌ์ฉ์ด ๋ฐ์ดํฐ ํ์ง๊ณผ ํจ์จ์ฑ์ ๋ฏธ์น๋ ์ํฅ์ ์คํ์ ์ผ๋ก ๋ถ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
MILO๋ ์ ๋ฌธ ๋ฐ์ดํฐ ์ฃผ์์์ ์ธ๊ฐ-AI ํ๋ ฅ ํ๋ ์์ํฌ๋ฅผ ํ์ํ๋ฉฐ, MedAgents๋ ์์์ ์์ฌ๊ฒฐ์ ์ค์ฌ์ ํ๋ ฅ๋ฐฉ์์ ๋ค๋ฃน๋๋ค.
ํ์ ์ฐ๊ตฌ
553์ ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ ํ์
ํ๋ ์์ํฌ๋ PaperBanana๊ฐ ์ ์ํ ํ์ ์๊ฐํ ์๋ํ ํ๊ฒฝ ๊ตฌ์ถ์ ์ค์ง์ ์
๋ ฅ(๋ฐ์ดํฐ ๋ผ๋ฒจ๋ง ๋ฑ) ๊ด์ ์์ ๋ณด์์ฒด๊ฐ ๋ฉ๋๋ค.
์์ฉ ์ฌ๋ก
AI๊ฐ ๋ฌธํ ๋ฆฌ๋ทฐ ๋ฐ ํ๊ฐ์ ๋ฏธ์น๋ ๊ตฌ์ฒด์ ์ํฅ๊ณผ ํ๊ณ๋ฅผ ์ค์ ์ฌ๋ก๋ก ๋ถ์ํ๋ฉฐ, MILO์ ๊ฒ์ฆ์-ํ์
๋ชจ๋ธ ์์ฉ์ ๋ณด์ฌ์ค๋๋ค.
์์ฉ ์ฌ๋ก
์ค์ AI-๋ณด์กฐ ์ฒด๊ณ๊ฐ ์์คํ
๋ฆฌ๋ทฐ์ ์ด๋ป๊ฒ ํ์ฉ๋๋์ง ๊ฒฝํ์ ์ฌ๋ก๋ฅผ ์ ๊ณตํฉ๋๋ค.
์์ฉ ์ฌ๋ก
PaperBanana์ ์๋ ์๊ฐํ ์์คํ
์ MILO์์ ์์ฑยท์ฃผ์๋ ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ์
์ ์ค์ ํ์ ์ถํ ๋ค์ด์ด๊ทธ๋จ ์์ฑ ํ์ดํ๋ผ์ธ์ ์ ์ฉํด ๋ณผ ์ ์์ต๋๋ค.
๋ฐ๋ก /๋นํ
๊ณผํ์ ๋ฆฌ๋ทฐ, ์ฃผ์ ์์ฑ์ AI ์ ์ฉ์ ํ์ง ์ ํ, ๊ฒ์ฆ ์ด์ ๋ฑ ํ๊ณ์ ์ ์ค์ฆ์ ์ผ๋ก ๋ถ์ํฉ๋๋ค.