์ ์: Jing-Cheng Pang, Heng-Bo Fan, Pengyuan Wang, Jiahao Xiao, Nan Tang, Si-Hang Yang, Chengxing Jia, Sheng-Jun Huang, Yang Yu | ๋ ์ง: 2024 | DOI: N/A 📄 PDF
Essence
Figure 1: ๋ฅ๋์ ๋ฌธ์๋ฅผ ํตํ ์ธ์ด๋ชจ๋ธ์ ์ง์ ์๋ต ๊ณผ์ . (A) ๋ฌธ์ ์์ด ์ง์ ๋ต๋ณ, (B) ์ฌ์ฉ์์๊ฒ ๋ช
ํํ ์ง๋ฌธ์ ํตํด ๋ฅ๋์ ์ผ๋ก ์ ๋ณด ์์ง
๋ณธ ๋
ผ๋ฌธ์ ๋ํ ์ธ์ด๋ชจ๋ธ(LLM)์ด ์ฌ์ฉ์์ ๋ชจํธํ ์ง์๋ฅผ ๋ช
ํํ ํ๊ธฐ ์ํด ๋ฅ๋์ ์ผ๋ก ์ง๋ฌธ์ ์ ๊ธฐํ๋ LaMAI(Language Model with Active Inquiry) ๋ฐฉ๋ฒ์ ์ ์ํ๋ค. ๋ฅ๋ํ์ต(active learning) ๊ธฐ๋ฒ์ ํ์ฉํ์ฌ ๊ฐ์ฅ ์ ๋ณด๋์ด ๋ง์ ์ง๋ฌธ์ ์ ํํจ์ผ๋ก์จ LLM์ ์๋ต ์ ํ๋๋ฅผ ํฌ๊ฒ ํฅ์์ํจ๋ค.
Evaluation
Novelty: 4.5/5 Technical Soundness: 4.0/5 Significance: 4.5/5 Clarity: 4.0/5 Overall: 4.25/5
์ดํ: LaMAI๋ LLM์ด ๋ชจํธํ ์ฌ์ฉ์ ์ง์๋ฅผ ์ฒ๋ฆฌํ๊ธฐ ์ํด ๋ฅ๋์ ์ผ๋ก ๋ช
ํํ ์ง๋ฌธ์ ์ ๊ธฐํ๋๋ก ํ๋ ์ฐฝ์์ ์ธ ์ ๊ทผ์ผ๋ก, ๋ถํ์ค์ฑ ์ถ์ ๊ณผ ๋ฅ๋ํ์ต์ ์ฒด๊ณ์ ์ผ๋ก ๊ฒฐํฉํ์ฌ ์๋นํ ์ฑ๋ฅ ํฅ์์ ๋ฌ์ฑํ๋ค. ๋ค๋ง ํ์ค ํ๊ฒฝ์์์ ํผ๋๋ฐฑ ํ์ง ๊ด๋ฆฌ์ ์ฌ์ฉ์ ๊ฒฝํ ์ต์ ํ ๊ด๋ จ ๋ ๊น์ด ์๋ ๋
ผ์๊ฐ ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
312๋ฒ ๋
ผ๋ฌธ์ ์กํฐ๋ธ ์ธ์ฟผ๋ฆฌ ๊ธฐ๋ฐ LLM์ ์ฌ์ธต ํ๊ตฌ ์ ๋ต์ด ๊ฐ์ ์คํ์ค ๋ด ์ฐ๊ตฌ์ ์์ด์ ํธ์ ์ง๋จ์ ๋ฌธ์ ํด๊ฒฐ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ฅ๋ํ์ต ๊ธฐ๋ฐ ์ง๋ฌธ ์์ฑ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ฅ๋ ์ง์ ๋ฐ ์ ์์ ํ์ต ๊ธฐ๋ฐ์ ์ฐ์์ task ์ ์์์ LLM ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ก ์ ๊ฐ๋ฅ์ฑ์ ์ด๋ก ์ ์ผ๋ก ๊ฒํ ํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ง๋ฌธ์๋ต ๊ธฐ๋ฐ ๋ฅ๋ ์ง์ ํ๋ ์์ํฌ๋ก ํฌ์ ์ ๋ณด ์ํฉ์์์ ํต์ฐฐ๋ ฅ ๊ทน๋ํ ๋ฐฉ๋ฒ๋ก ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ด ์ฌ์ฉ์ ์๋๋ฅผ ํ์
ํ๊ธฐ ์ํ ๋์์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
223์ ๋ช
ํํ ์ง๋ฌธ ์์ฑ์ LLM์ ๋ถํ์ค์ฑ ์ถ์ ์ ํ์ฉํ๋ ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ํ ์์คํ
์์ ๋ช
ํํ ์ง๋ฌธ์ ์์ฑํ๋ ๋ค๋ฅธ ์ ๊ทผ๋ฒ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ๋ถํ์ค์ฑ ์ฒ๋ฆฌ๋ฅผ ์ํ ๋์์ ๋ฅ๋ ํ์ต ํ๋ ์์ํฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
312๋ ๋ฅ๋์ ์ง์ ์ ํ ๋ฐฉ์์ ์ถ๊ฐ ์ ์ฉํด, ๋ช
ํํ ์ง๋ฌธ ์๋ ์์ฑ ํ๋ ์์ํฌ๋ฅผ 223์์ ํ ๋จ๊ณ ๋ฐ์ ์ํต๋๋ค.
ํ์ ์ฐ๊ตฌ
312๋ LLM์ ์กํฐ๋ธ ์ธ์ฟผ๋ฆฌ(active inquiry)๋ฅผ ํตํด ๊น์ด ์๋ ์ดํด๋ก ์ ๋ํ๋ ์ ๋ต์ ๋ค๋ฃจ์ด, 222์ ๋ช
ํํ ์ง๋ฌธ ์์ฑ ๋ฉ์ปค๋์ฆ ๋ฐ์ ์ ์ง์ ์ ์ผ๋ก ์์ฉํ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
LLM์ ๋ฅ๋์ ํ์ยท์ง๋ฌธ ๋ฅ๋ ฅ์ ์คํํ๊ฒฝ์์ ํ๊ฐํ๋ ํ๋ ์์ํฌ์ ์ฌ๋ก๋ก, ๋ณธ ๋
ผ๋ฌธ์ ํ๊ฐํ๊ฒฝ ํ๋ยทํ์ฅ ๊ฐ๋ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Trust, But Verify ๋
ผ๋ฌธ์ ์๊ธฐ ํ์ธ(self-verification)์ผ๋ก ์ ๋ต๋ฅ ์ ๋์ด๋ ๋ฐฉ๋ฒ์ ์ ์ํ์ฌ LaMAI์ ์๋ต ํ์ง ๊ฐ์ ์ ํ์ฅ ์ฐ๊ตฌ๋ก ๋ณผ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ์ ์ ๊ทน์ ํ๊ตฌ(active inquiry)๋ฅผ ํตํด ๋จ์ผ์ธํฌ ๋ฐ์ดํฐ ํด์ ์ฑ๋ฅ ํฅ์ ๋ฐ ์๋ํ ๊ฐ๋ฅ์ฑ์ ํ๊ตฌํ ๋
ผ๋ฌธ์
๋๋ค.
ํ์ ์ฐ๊ตฌ
์ธ์ด๋ชจ๋ธ์ ๋ฅ๋์ ํ๊ตฌ ๋ฐ ์ฌ์ธต์ ์๋ฏธ์ดํด ๊ฐํ ๋ฐฉ๋ฒ์ ๋น์ง๋ ์ ์ ๋ฉด์ญ ์์ฉ์ฒด ๋ถ์ ์ํฌํ๋ก ๊ฐ์ ์๋ ์ ์ฉ๋ ์ ์์ต๋๋ค.
์์ฉ ์ฌ๋ก
Large Language Models ๋
ผ๋ฌธ์ LLM์ด ์ค์ ์ฌ์ฉ์์ ์ํธ์์ฉํ๋ฉฐ ์ง๋ฌธ ์ ์ ํ์ต์ ์ํํ๋ ๋ค์ํ ์คํ์ ํตํด LaMAI ๋ฐฉ๋ฒ๋ก ์ ์ค์ฉ์ฑ ๊ฒ์ฆ์ ์ ํฉํฉ๋๋ค.
์์ฉ ์ฌ๋ก
434๋ ์ง์ ๊ทธ๋ํ๋ฅผ ์ด์ฉํ ๊ณผํ ์์ด๋์ด ์์ฑ์์ ๋ฅ๋์ ์ง๋ฌธ ์ ํ ๋ฐฉ์์ ์ค์ ์ฐฝ์์ ์์ด๋์ด ์์ฑ์ ์ ์ฉํฉ๋๋ค.