์ ์: Jiaheng Liu, Dawei Zhu, Zhiqi Bai, Yancheng He, Huanxuan Liao, Haoran Que, Zekun Wang, Chenchen Zhang, Ge Zhang, Jiebin Zhang, Yuanxing Zhang, Zhuo Job Chen, Hangyu Guo, S. Li, Ziqiang Liu, Yong Shan, Yifan Song, Jiayi Tian, Wenhao Wu, Zongqing Zhou | ๋ ์ง: 2025 | URL: https://arxiv.org/abs/2503.17407 📄 PDF
Essence
์ฅ๋ฌธ๋งฅ ์ธ์ด๋ชจ๋ธ(LCLM) ๊ตฌ์ถ, ํ๋ จ, ๋ฐฐํฌ, ํ๊ฐ๋ฅผ ์ํ ํฌ๊ด์ ์กฐ์ฌ๋ก, ๋ฐ์ดํฐ ์ ๋ต๋ถํฐ ์ธํ๋ผ, ํ๊ฐ ํจ๋ฌ๋ค์, ์์ฉ ๋ถ์ผ๊น์ง ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ ๋๊ท๋ชจ ์๋ฒ ์ด ๋
ผ๋ฌธ.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ์ฅ๋ฌธ๋งฅ ์ธ์ด๋ชจ๋ธ์ ์ ์ฒด ์๋ช
์ฃผ๊ธฐ๋ฅผ ์ต์ด๋ก ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ ํ์ ์ฐธ๊ณ ์๋ฃ๋ก, ๋ฐ์ดํฐ๋ถํฐ ๋ฐฐํฌ๊น์ง ์ค๋ฌด์์๊ฒ ์ ์ฉํ๋ฉฐ, ํ๊ฐ ์ ๋ขฐ์ฑ ๋ฌธ์ ์ง์ ๋ฑ ๋นํ์ ํต์ฐฐ๋ ์ ๊ณตํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
452์ ์ฅ๋ฌธ๋งฅ๋ชจ๋ธ ๋ฒค์น๋งํฌ(L-CiteEval)๋ 005์ long context language modeling์ ๋ํ ํฌ๊ด์ ์ด๋ก ๋ฐ ๋ํฅ์กฐ์ฌ๋ฅผ ์ด๋ก ์ ๊ธฐ๋ฐ์ผ๋ก ์ผ๊ณ ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋กฑ์ปจํ
์คํธ LLM ํ์ฉ๋ฒ๊ณผ ์๋ถ์/๊ณ ๋ถ์ ์ค๊ณ์ ํ์ํ ์ ๋ณด ์ถ์ถยท์์ฝ ์ ๋ต์ ๊ธฐ์ด ์ด๋ก ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
005 ๋
ผ๋ฌธ์ ๋กฑ ์ปจํ
์คํธ LLM์ ์ธ์ด ๋ชจ๋ธ๋ง ๊ธฐ๋ฐ ์ ๋ณด๋ฅผ ์ฌ์ธต ๋ถ์ํ์ฌ KGValidator๊ฐ ํ์ฉํ๋ LLM์ ์ฅ๋จ์ ์ดํด์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ธ์ด ๋ชจ๋ธ ํ์ต ๋ฐ ํ๊ฐ๋ฅผ ์ํ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ ํ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ฅ๋ฌธ๋งฅ ์ธ์ด๋ชจ๋ธ์ ๊ธฐ๋ฐ์ด ๋๋ ํธ๋์คํฌ๋จธ ์ํคํ
์ฒ ๋ฐ ์ดํ
์
๋ฉ์ปค๋์ฆ์ ๋ค๋ฃจ๋ ๊ธฐ์ด ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ์ ์ ๋ฐ์ ์ธ ๋ฐ์ ์ ๋ค๋ฃจ๋ฉฐ ์ฅ๋ฌธ๋งฅ ๋ชจ๋ธ์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํ๋ ์๋ฒ ์ด์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
005์ ์ฅ๋ฌธ ์ปจํ
์คํธ LLM ์๋ฒ ์ด๋ 316์ฒ๋ผ ๋ฐ์/ํฉ์ฑ ์์ธก์ ๋์ฉ๋ ๋ฌธ๋งฅ ๋ชจ๋ธ์ ํ์ฉํ ๋์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ธด ๋ฌธ๋งฅ ์ฒ๋ฆฌ ๋ฐ ๋ด์ค/๊ณผํ๋ฌธ์ ์์ฑ์์ ๋ฑ์ฅํ๋ ๋ค์ํ ์ธ์ด๋ชจ๋ธ context handling ์ ๋ต๊ณผ ์ต์ ๋ฐฉํฅ์ ์ฐ๊ตฌํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ธธ์ด์ง ์ปจํ
์คํธ์ ๋ณต์กํ ์ค์๊ฐ ๋ฐ์ดํฐ ์ฒ๋ฆฌ๋ฅผ ์ํ ์์ฐ์ด๋ชจ๋ธ ์ค๊ณ์ ๊ดํ ์ต์ ์ด๋ก ์ด ๊ฒ์ถ๊ธฐ ์ ์ด ๋ฑ AI ์คํ ์๋ํ ์ ์ฉ์ ๋์๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
825์ ๋ค์ค์์ด์ ํธ ์์คํ
๊ตฌํ๊ณผ ํ๊ฐ์๋ 005์ ๋กฑ ์ปจํ
์คํธ LLM ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ด ์ค์ํ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋กฑ์ปจํ
์คํธ LLM์ ํ๊ณ์ ํ๊ฐ ๋ฒค์น๋งํฌ๋ฅผ ํญ๋๊ฒ ๋ค๋ฃจ์ด, ๊ฒ์ ๋ฌธ๋งฅ ๊ธธ์ด ์ต์ ํ ์ฐ๊ตฌ์ ์ด๋ก ๋ฐฐ๊ฒฝ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ธด ์ปจํ
์คํธ ์ธ์ด๋ชจ๋ธ ์ฐ๊ตฌ์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ์ฐ๊ณ๋ ํํ ๋ถ์ผ์์ LLM ์ฑ๋ฅ ํ๊ณ๋ฅผ ์ง๋จยทํด์ํ๋๋ฐ ๊ธฐ์ด ์๋ฃ๊ฐ ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
005 ๋
ผ๋ฌธ์ ์ฅ๋ฌธ ๋งฅ๋ฝ ๋ชจ๋ธ๋ง ์๋ฒ ์ด๋ก, 354 ๋
ผ๋ฌธ์ด ๋ถ์ํ GPU ๋ณ๋ ฌํ ๋ฑ์ด ๋๊ท๋ชจ ์ฅ๋ฌธ ์ฒ๋ฆฌ๋ฅผ ์ํ ํต์ฌ ๊ธฐ์ ์์ ์ด๋ก ์ ์ผ๋ก ๋ท๋ฐ์นจํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ฅ๋ฌธ๋งฅ ์ฒ๋ฆฌ๋ฅผ ์ํ ์ธ์ด๋ชจ๋ธ ์ ๊ทผ๋ฒ์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
821 'Towards a client-centered assessment of llm therapists' ๋
ผ๋ฌธ์ ์ฅ๋ฌธ๋งฅ ๋ํ/ํ๊ฐ ํ๊ฒฝ์์ ์ค์ ์ธ๊ฐ-์์ด์ ํธ ์ํธ์์ฉ ๊ธฐ๋ฐ ํ๊ฐ์ ํ๊ณ๋ฅผ ๋ค๋ฃจ์ด, 005์ ์ฅ๋ฌธ๋งฅ ํ๊ฐ ํจ๋ฌ๋ค์๊ณผ ์ค์ ์ ์ฉ์ ๊ดด๋ฆฌ๋ฅผ ์ง์ด์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ค์ฉ์ ๊ท๋ชจ์ ์คํ ์ธ์ด๋ชจ๋ธ ๊ฐ๋ฐ์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ฅ๋ฌธ๋งฅ ์ธ์ด๋ชจ๋ธ๋ง์ ํน์ ์ธก๋ฉด์ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
005๋ ์ฅ๋ฌธ ์ปจํ
์คํธ ์ธ์ด๋ชจ๋ธ์ ๊ด๋ฒ์ํ๊ฒ ์๋ฒ ์ดํ๋ฉฐ, 036๊ณผ ์ฃผ์ ๊ฐ ์ ์ฌํ๋ ๋ถ๋ฅ ๋ฐ ๊ฐ์กฐ์ ์ด ๋ค๋ฅด๋ค.
ํ์ ์ฐ๊ตฌ
005์์ ์ ๋ฆฌํ ๋กฑ์ปจํ
์คํธ LLM์ 625์์ LLM์ ๊ณํ์ํ ๋ฅ๋ ฅ(PlanGen)์ ์ฐ๊ตฌํ ๋ ๊ธฐ์ ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
018์ด ๋ค๋ฃฌ Retrieval-Augmented Generation์ ํตํ ๋ฌธ์๊ฐ ์ถ๋ก ์ 005์ long-context LLM์ ํ์ฉํ ๊ณผํ QA ์ต์ ์ฑ๋ฅ ๋ถ์๊ณผ ์ฐ๊ฒฐ๋ฉ๋๋ค.
์์ฉ ์ฌ๋ก
ํจ๊ณผ์ ์ธ ์ฅ๋ฌธ๋งฅ ๋ชจ๋ธ ์ค๊ณ์ ๊ณ ๋ คํด์ผ ํ๋ ํต์ฌ ์์๋ฅผ ๊ฒฝํ์ ์ผ๋ก ๋ถ์ํ์ฌ ์ค์ LCLM ๊ตฌ์ถ ํ์ฅ์์ ์์ฌ์ ์ ์ ๊ณตํจ.
์์ฉ ์ฌ๋ก
005์ ์ฅ๋ฌธ๋งฅ LLM ๊ตฌ์ถ ๋ฐ ํ๊ฐ ์๋ฒ ์ด๋ 366์์ ๋ฏธ๋ ์ฐ๊ตฌ ์๋์์ฑ์ ๋กฑ์ปจํ
์คํธ LLM ํ์ฉ ์ฌ๋ก๋ก ์ ์ฉ๋ฉ๋๋ค.