์ ์: Elliot Xie, Lingxin Cheng, Jack M. Shireman, Yujia Cai, Jihua Liu | ๋ ์ง: 2025 | DOI: 10.1101/2024.12.04.626476 📄 PDF
CASSIA์ ๋ค์ค ์์ด์ ํธ LLM ์์คํ ๊ตฌ์กฐ. ์จ๋ณด๋ฉ ํ๋ซํผ์ ํตํด ์ฌ์ฉ์ ์ ๋ ฅ์ ๋ฐ๊ณ , Annotator, Validator, Formatter, Scorer, Reporter ์์ด์ ํธ๊ฐ ์์ฐจ์ ์ผ๋ก ์๋ํ๋ฉฐ, ์ ํ์ ์์ด์ ํธ๋ค(Subclustering, Uncertainty Quantification, RAG)๋ ํ์ฉ ๊ฐ๋ฅ
CASSIA๋ ๋จ์ผ์ธํฌ RNA-seq ๋ฐ์ดํฐ์ ์๋ํ๋ ์ธํฌ์ฃผ์(cell annotation)์ ์ํ ๋ค์ค ์์ด์ ํธ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM) ์์คํ ์ผ๋ก, ๊ธฐ์กด ๋ฐฉ๋ฒ๋ณด๋ค 12-41% ๋์ ์ ํ๋๋ฅผ ๋ฌ์ฑํ๋ฉด์ ํด์ ๊ฐ๋ฅํ ํ์ง ์ ์์ ๋ถํ์ค์ฑ ์ ๋ํ๋ฅผ ์ ๊ณตํ๋ค.
5๊ฐ ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์ ์์ ์์ ํ ์ ํํ ์ฃผ์(fully correct)์ 12-41% ๊ฐ์ , ๋ถ๋ถ์ ์ผ๋ก ์ ํํ ์ฃผ์๊น์ง ํฌํจํ ๊ฒฐ๊ณผ๋ 9-29% ๊ฐ์
๋ฉด์ญ์ธํฌ ๋ถ๋ฅ์์ 25% ์ด์์ ์ฑ๋ฅ ํฅ์(์ข์ธก), ์ข ์ ๋ฏธ์ธํ๊ฒฝ์์ ์ ์ธํฌ ๊ตฌ๋ถ(์ค์), ๋น๋ชจ๋ธ ์๋ฌผ์ข (์์ด, ์ง๊ณ ์์ด, ํธ๋์ด, ์ฒ์ฐ๊ฐ)์์ 14-77% ์ ํ๋ ๊ฐ์ (์ฐ์ธก)
์ดํ: CASSIA๋ ๋ค์ค ์์ด์ ํธ LLM ์์คํ ์ ํตํด ์ธํฌ์ฃผ์์ ์ ํ๋, ํด์ ๊ฐ๋ฅ์ฑ, ํ์ง ํ๊ฐ๋ฅผ ๋์์ ๋ฌ์ฑํ ํ์ ์ ๋ฐฉ๋ฒ์ผ๋ก, ํนํ ๋ณต์กํ ์ธํฌ ์ง๋จ๊ณผ ๋น๋ชจ๋ธ ์๋ฌผ์ข ๋ถ์์์ ์ค์ง์ ๊ฐ์น๋ฅผ ์ ์ฆํ์ผ๋, peer review ์ ์ํ์ด๊ณ ๊ณ์ฐ ํจ์จ์ฑ ๋ฐ ๊ธฐ์ ์ ์ธ๋ถ ์ฌํญ์ ๋ํ ์ถ๊ฐ ๊ฒ์ฆ์ด ํ์ํ๋ค.