์ ์: | ๋ ์ง: 2026-02-18 | URL: https://arxiv.org/abs/2602.16703 📄 PDF
์ด ๋ ผ๋ฌธ์ 2025๋ ์ค๋ฐ์ frontier LLM์ด ์ด์ฌ์์ ๋ฐ์ด๋ฌ์ค ์ญ์ ์ ํ ์คํ ์ํ ๋ฅ๋ ฅ์ ํฅ์์ํค๋์ง ํ๊ฐํ๊ธฐ ์ํด 153๋ช ์ ์ฐธ๊ฐ์๋ฅผ ๋์์ผ๋ก ํ ์ฌ์ ๋ฑ๋ก ๋ฌด์์ ๋์กฐ ์ํ์ ๋ณด๊ณ ํ๋ค. LLM ์ง์์ด ์ฃผ์ ๊ฒฐ๊ณผ์ธ ์ ์ฒด ์ํฌํ๋ก์ฐ ์๋ฃ์จ์์ ์ ์๋ฏธํ ๊ฐ์ ์ ๊ฐ์ ธ์ค์ง ๋ชปํ์ผ๋(5.2% vs 6.6%, P=0.759), ํน์ ์์ ์์๋ ์์น์ ์ผ๋ก ๋ ๋์ ์ฑ๊ณต๋ฅ ์ ๋ณด์๋ค.
์ฃผ์ ๊ฒฐ๊ณผ: 1) ์ฃผ์ ๊ฒฐ๊ณผ์ธ ์ ์ฒด ์ํฌํ๋ก์ฐ ์๋ฃ์จ์ LLM๊ตฐ๊ณผ Internet๊ตฐ ๊ฐ์ ์ ์๋ฏธํ ์ฐจ์ด ์์(5.2% vs 6.6%, P=0.759); 2) ๊ฐ๋ณ ์์ ์ฑ๊ณต๋ฅ ์์๋ ์ ์ฒด์ ์ผ๋ก ์ ์๋ฏธํ ์ฐจ์ด ์์; 3) ์ฌํ ๋ฒ ์ด์ง์ ๋ชจ๋ธ๋ง์์ LLM ์ง์ ํ์ ์ผ๋ฐ์ ์ธ ์ญ์ ์ ํ ์์ ์ ์ฑ๊ณต์ด ์ฝ 1.4๋ฐฐ ์ฆ๊ฐ(95% CrI 0.74-2.62); 4) ์์ ํ๊ท ๋ชจ๋ธ๋ง์์ LLM๊ตฐ์ด ๋ชจ๋ ์์ ์์ ์ค๊ฐ ๋จ๊ณ๋ฅผ ์งํํ ํ๋ฅ ์ด ๋ ๋์(์ฌํํ๋ฅ 81-96%); 5) ์ธํฌ๋ฐฐ์ ์์ ์์ ์์น์ ์ผ๋ก ๋ ๋์ ์ฑ๊ณต๋ฅ (68.8% vs 55.3%, P=0.059).
Figure 1: Trial Design. Schematic of the 8-week in-person study. Participants (n = 153) completed safety
์ดํ: ์ด ๋ ผ๋ฌธ์ LLM ๋ฐ์ด์ค๋ณด์ ์ํ ํ๊ฐ์์ ์ค์ํ ๊ฒฝํ์ ๊ณต๋ฐฑ์ ์ฑ์ฐ๋ ์ ์ค๊ณ๋ RCT๋ฅผ ์ ์ํ๋ค. ์ฃผ์ ๊ฒฐ๊ณผ(์ ์๋ฏธํ ์ํฌํ๋ก์ฐ ์๋ฃ์จ ๊ฐ์ ๋ถ์ฌ)๊ฐ ์ง๊ด์ ๋ฐํ๊ณ , ๊ฐ๋ ฅํ ์ฐ๊ตฌ ์ค๊ณ(์ฌ์ ๋ฑ๋ก, ์กฐ์ฌ์ ๋งน๊ฒ, ๋ ๋ฆฝ์ ๊ฒ์ฆ)์ ํฌ๋ช ํ ๋ถ์์ด ์ ๋ขฐ์ฑ์ ๋์ธ๋ค. ๋ค๋ง ๊ทน๋๋ก ๋ฎ์ ์ ์ฒด ์๋ฃ์จ๊ณผ ํน์ ํ์๊ตฐ์์ ์์น์ ๊ฐ์ ์ ๋ ํฐ ํ๋ณธ์ด๋ ์์ ๋ ์์ ๋์ด๋๋ก ํ์ ์ฐ๊ตฌ๊ฐ ํ์ํจ์ ์์ฌํ๋ค. ์ ๋ฐ์ ์ผ๋ก AI ์์ ๋ฐ ๋ฐ์ด์ค ๋ณด์ ์ ์ฑ ์ ์์ ์ค์ํ ๊ธฐ์ฌ๋ฅผ ํ๋ค.