์ ์: Paimon Goulart, Jordan Steinhauser, Dawon Ahn, Kylene Shuler, Edward Korzus, Jia Chen, Evangelos E. Papalexakis | ๋ ์ง: 2026-02-19 | DOI: [๋ฏธ์ ๊ณต] 📄 PDF
Essence
์ ์๋ ํ์ดํ๋ผ์ธ ๊ฐ์: In-Context ๋ฐ์ดํฐ ์ค๋น, AI ๊ฐํ ํ
์ ๋ถ์, AI ๊ธฐ๋ฐ ํจํด ํด์์ ์ธ ๊ฐ์ง ์ฃผ์ ๋จ๊ณ
๋ณธ ๋
ผ๋ฌธ์ ํ๋์ ๊ฒฝ๊ณผํ ์ฐ๊ตฌ์์ ๋ฐ์ดํฐ ์ค๋น๋ถํฐ ํจํด ํด์๊น์ง ์๊ฐ ์๋น์ ์ด๊ณ ์ ๋ฌธ๊ฐ ์์กด์ ์ธ ๋จ๊ณ๋ค์ AI๋ก ์๋ํํ๋ ํตํฉ ํ์ดํ๋ผ์ธ์ ์ ์ํ๋ค. In-Context Learning(ICL)๊ณผ ํฅ์๋ ํ
์ ๋ถํด๋ฅผ ํ์ฉํ์ฌ ๋๋ฉ์ธ ์ ๋ฌธ๊ฐ๊ฐ ํ๋ก๊ทธ๋๋ฐ ์ง์ ์์ด๋ ๊ณตํฌ ๊ณผ์ผ๋ฐํ(fear generalization) ์ฐ๊ตฌ์์ ์ ๊ฒฝ ํจํด์ ๋ฐ๊ตดํ ์ ์๋ ์ฌ์ฉ์ ์นํ์ ์ธํฐํ์ด์ค๋ฅผ ๊ตฌํํ๋ค.
How
์๊ฐ์ ์ผ๊ด์ฑ์ ์ํ AR-ICL ํ๋กฌํํธ. ๊ณ ์ ๋ ICL ์์ ์ ์ถ๊ฐ๋ก ์ด์ ์๊ฐ ๋จ๊ณ์ ์์ธก๊ฐ ํฌํจ
ํ์ดํ๋ผ์ธ ๊ตฌ์ฑ ์์:
- In-Context Data Preparation (๋ฐ์ดํฐ ์ค๋น)
- Vision Language Model(VLM)์ ์์์ ๋ผ๋ฒจ ์์ ์ ๊ณต (k๊ฐ ์ํ)
- AR-ICL: ์ด์ ์์ธก๊ฐ์ ์ปจํ
์คํธ์ ํฌํจ์์ผ ์๊ฐ ์ผ๊ด์ฑ ํ๋ณด
- ๋๋ฉ์ธ ์ ๋ฌธ๊ฐ์ ํ์ต ๊ณก์ ์์ด ์๋ ๋ผ๋ฒจ๋ง ์ํ
- ๋ฏธ์ธ์กฐ์ ๋์ ํ๋กฌํํธ ์์ง๋์ด๋ง๋ง์ผ๋ก ์์
์ ํ ๊ฐ๋ฅ
- Neural Tensor Analysis (์ ๊ฒฝ ํ
์ ๋ถ์)
- ๊ณ ๊ธ ํ
์ ๋ถํด ๋ชจ๋ธ๋ก ๋ค์ค ๊ณต์ ์์ฑ(์๊ฐ, ํ๊ฒฝ, ๋ด๋ฐ)์ ๊ฐ์ง ๋ฐ์ดํฐ ๋ถ์
- ์ ์ฌ ์ ๊ฒฝ ์ปดํฌ๋ํธ ๋ฐ๊ตด ๋ฐ ๋ฐ์ดํฐ ์์ค๋ณ ๊ธฐ์ฌ๋ ์๋ณ
- ํด๋์ ํ
์ ๋ฐฉ๋ฒ์ ํด์ ๊ฐ๋ฅ์ฑ ์ ์งํ๋ฉด์ ์ฑ๋ฅ ๊ฐ์
๋ฐ๊ฒฌ๋ ์ ์ฌ ์ ๊ฒฝ ์ปดํฌ๋ํธ ํด์์ ์ํ Discovery ICL ํ๋กฌํํธ. ๊ฒ์ ๋ณด๊ฐ ์์ฑ(RAG) ์ ๋ณด ํฌํจ
- AI-driven Pattern Interpretation (ํจํด ํด์)
- Retrieval-Augmented Generation(RAG): ์ ๊ฒฝ๊ณผํ ๋ฌธํ/๋๋ฉ์ธ ์ง์ ๊ฒ์
- ICL์ ํตํ ๋ฐ๊ฒฌ ๊ธฐ๋ฐ ํด์: VLM์ด ๊ฒ์๋ ์ ๋ณด์ ํ
์ ์ปดํฌ๋ํธ๋ฅผ ์ฐ๊ฒฐ
- ๋๋ฉ์ธ ์ ๋ฌธ๊ฐ๊ฐ ํด์ ๊ฐ๋ฅํ ์๋ฌผํ์ ์๋ฏธ ๋ถ์ฌ
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ In-Context Learning์ด๋ผ๋ ์ ๊ทผ์ฑ ๋์ AI ํจ๋ฌ๋ค์์ ๋๋ฉ์ธ ์ ๋ฌธ๊ฐ ์ค์ฌ์ ์ ๊ฒฝ๊ณผํ ๋ถ์ ํ์ดํ๋ผ์ธ์ ์ฑ๊ณต์ ์ผ๋ก ๋์
ํ ์๋ฏธ ์๋ ์ฌ๋ก ์ฐ๊ตฌ์ด๋ค. ๊ธฐ์ ์ ์๋ฐ์ฑ ํฅ์๊ณผ ๋ค์ํ ๋๋ฉ์ธ์ผ๋ก์ ์ผ๋ฐํ ๊ฒ์ฆ์ด ํ์ํ์ง๋ง, ์ค์ ํ์
๊ฒฝํ์ ๊ธฐ๋ฐํ ์ค์ฉ์ ๊ธฐ์ฌ๊ฐ ๋๋ณด์ธ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
718์ AI ๊ธฐ๋ฐ ๊ณผํ์ ๋ฐ๊ฒฌ ํ์ดํ๋ผ์ธ์ ๊ฐ๋
๊ณผ ํ๊ณ๋ฅผ ์ง์ ์ ์ผ๋ก ๋ถ์ํด 839์ ํ๋์ ๊ฒฝ๊ณผํ ์๋ํ์ ์ด๋ก ์ ๋งฅ๋ฝ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ฌผ๋ฆฌ๋ฒ์น ๋ฐ๊ฒฌ์ ์ํ ๋ค์ค์์ด์ ํธ ํ๋ ์์ํฌ๋ก, ํ๋์ ๊ฒฝ๊ณผํ ํจํด ์๋ํด์์ ์ด๋ก ์ ๊ฐ๋
ํ์ฅ์ ๊ธฐ์ฌํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
566๋ฒ ๋
ผ๋ฌธ์ ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ์ ํ
์คํธ-์ฐจํธ ์ฐ๊ฒฐ ์ฐ๊ตฌ๋ฅผ ํตํด ํ๋์ ๊ฒฝ๊ณผํ ์๋ํ ํ์ดํ๋ผ์ธ ๊ฐ๋ฐ์ ๊ธฐ๋ณธ ์๋ฃ๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์๋ช
๊ณผํ ๋ถ์ผ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ๋ํด ์๋ฒ ์ดํ ๋
ผ๋ฌธ์ผ๋ก, ์ ๊ฒฝ๊ณผํ ์๋ํ ํ์ดํ๋ผ์ธ์ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ก ์ฐ๊ณํด ๋ณผ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฌผํ ๋ฐ ์ ๊ฒฝ๊ณผํ ์์ญ์์ ์๋ํ๋ ๊ณผํ์ ๋ฐ๊ฒฌ์ ์ถ๊ตฌํ๋ SciAgents ๋
ผ๋ฌธ๊ณผ ๋น๊ตํจ์ผ๋ก์จ ์ธ๋ถ ์ ๊ทผ๋ฒ ๋ฐ ๊ธฐ์ ์ ์ฐจ์ด๋ฅผ ๋
ผ์ํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ช
๊ณผํ ๋ถ์ผ์ ์คํ์ ๋ฐ์ดํฐ ๋ถ์ ์๋ํ์ LLM ์ ํ์ฉํ ๋๋ค๋ฅธ ์ ๋ชฉ ์ฌ๋ก๋ก, ํ๋์ ๊ฒฝ๊ณผํ ์ธ ๋ฐ์ด์ค ๋ถ์ผ๋ก ํ์ฅ ์ฌ๋ก๋ฅผ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
442๋ฒ ๋
ผ๋ฌธ์ ์์ด๋์ด ์์ฑ ์ง์ ์์คํ
์ผ๋ก์ LLM ๊ธฐ๋ฐ ๊ณผํ์ ์๊ฐ ์์ฑ๊ธฐ ๊ธฐ์ ์ ์๊ฐํ๋ฉฐ ์ ์ฌ ๋๊ตฌ ์๋ํ์ ๋ ๋ค๋ฅธ ์์๋ฅผ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Reinforcing clinical decision support ๋
ผ๋ฌธ์ ์๋ฃ ๋ถ์ผ์์ ๋ค์ค ์์ด์ ํธ ๋ฐ LLM ๊ธฐ๋ฐ ์๋ํ ์์คํ
์ ์คํํ์ฌ ์ ๊ฒฝ๊ณผํ ์ฐ๊ตฌ์์์ ํ์ฉ๊ณผ ๋น๊ต๊ฐ ๊ฐ๋ฅํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
Dolphin ๋
ผ๋ฌธ์ ๊ฐ๋ฐฉํ ๊ณผํ ์๋ ํ๊ตฌ ์์ด์ ํธ๋ฅผ ์ ์ํด, in-context learning์ ํ์ฉํ ์๋ ์ ๊ฒฝ ํจํด ๋ฐ๊ตด ์ ๊ทผ๊ณผ ์ ์ฌ ๋ฌธ์ ๋ฅผ ๋ค๋ฃฌ๋ค.
ํ์ ์ฐ๊ตฌ
์ธ์ฝคํ
์คํธ ํ์ต์ ํตํ ํ๋ ์ ๊ฒฝ๊ณผํ ์๋ํ์ zero-shot ๋ถ์์ ๊ตฌํ ๋
ผ๋ฆฌ๊ฐ BehaveAgent์ ๋ฒ์ฉ ํ๋ ๋ถ์๊ณผ ์ ์ฌํ ํ์ฅ ๋ฐฉํฅ์ ์ ์ํฉ๋๋ค.
์์ฉ ์ฌ๋ก
3108์ ์ธ์งยทํ๋ ๋ฐ์ดํฐ์ ์๋ํ ๋ถ์ ๋ฐ ํตํฉ์ ์ฐ๊ตฌ ์ํฌํ๋ก์ฐ ์ฌ๋ก๋ฅผ ์ ๊ณตํด, 839 ์ฐ๊ตฌ์ ์ค์ ์์ฉ์ ์ฐ๊ฒฐ์ด ๋ฉ๋๋ค.