Essence
๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ด ๊ณผํ ์ฐ๊ตฌ๋ฅผ ์์ฝํ ๋ ์๋ฌธ๋ณด๋ค ๊ณผ๋ํ๊ฒ ๊ด๋ฒ์ํ ๊ฒฐ๋ก ์ ๋์ถํ๋ ์ฒด๊ณ์ ์ธ ํธํฅ์ ๊ฐ์ง๊ณ ์์ผ๋ฉฐ, ์ด๋ ๋๊ท๋ชจ ๊ณผํ ์ค๋
์ ์ํ์ ์ด๋ํ๋ค. 10๊ฐ์ ์ฃผ์ LLM์ ๋์์ผ๋ก 4,900๊ฐ์ ์์ฝ์ ๋ถ์ํ ๊ฒฐ๊ณผ, LLM ์์ฝ์ด ์ธ๊ฐ ์์ฑ ์์ฝ๋ณด๋ค ์ฝ 5๋ฐฐ ๋ ๋์ ํ๋ฅ ๋ก ๊ณผ๋ํ ์ผ๋ฐํ๋ฅผ ํฌํจํ๋ค.
Evaluation
์ดํ: ์ด ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ณผํ ์์ฝ์ ๊ณผ๋ ์ผ๋ฐํ ํธํฅ์ ์ฒ์์ผ๋ก ๋๊ท๋ชจ ์ค์ฆ์ ์ผ๋ก ์
์ฆํ ์ค์ํ ์ฐ๊ตฌ์ด๋ฉฐ, ํนํ ์๋ฃยท๊ณต์ค๋ณด๊ฑด ์์ญ์์์ LLM ์ ๋ขฐ์ฑ์ ๋ํ ์ค๋ํ ์ฐ๋ ค๋ฅผ ์ ๊ธฐํ๋ค. ๋ค๋ง ์ผ๋ฐํ ํ๋น์ฑ์ ๊ท๋ฒ์ ๊ธฐ์ค ๋ถ์ฌ, ์ํ ์ ๋ต์ ํจ๊ณผ ๊ฒ์ฆ ๋ฏธํก, ์ธ์ฝ๋ฉ ์ ๋ขฐ๋ ๋ณด๊ณ ๋ถ์กฑ ๋ฑ์ด ๊ธฐ์ ์ ๊ฐ๊ฑด์ฑ์ ๋ค์ ์ ์ฝํ๋ฉฐ, ์ถ๊ฐ ์ฐ๊ตฌ๋ฅผ ํตํ ๋ณด์์ด ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
812 ๋
ผ๋ฌธ์ ๊ณผํ ๋ฌธ์ ์์ฝ(Extreme Summarization)์ LLM ํ๊ณ์ ์ค๋ฅ ์์์ ๋ถ์ํด, 373์ ์ง์ ๋ ๊ณผ๋ํ ์ผ๋ฐํ ํธํฅ์ ์์ธ์ ๊ท๋ช
ํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ค์ค ๋
ผ๋ฌธ ์์ฝ์ ์ํ LLM ๊ธฐ๋ฐ ํ๋ ์์ํฌ์ ์ค์ ์ง์ ๊ตฌ์กฐํ, ํ๊ฐ ๋ฐฉ์์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ์ฃผ์ฅ ๊ฒ์ฆ ๋ฐ์ดํฐ ๊ตฌ์ถ ๋ฐ ํธํฅ ๋ถ์์ ์ค์ฆ ์ฐ๊ตฌ๊ฐ LLM ์์ฝ ์ผ๋ฐํ ํธํฅ ๋
ผ๋ฌธ์ ํ๊ฐ ์ฒด๊ณ๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ฌผ๋ฆฌํ LLM ํ๊ฐ(697)์ ๊ท์น ๊ธฐ๋ฐ ํ๋ ์์ํฌ ๋
ผ์๊ฐ ๊ณผํ ์์ฝ ์ผ๋ฐํ ํธํฅ(373)๊ณผ LLM ํ๊ฐ๋ฐฉ์ ๋๋น์ ์ด๋ก ์ ํ ๋๊ฐ ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Generalization Bias in Large Language Model Summarization ๋
ผ๋ฌธ์ LLM์ ์๋์์ฑ ํ
์คํธ์ ์ง์ ํ๊ณ์ ์ผ๋ฐํ ํธํฅ์ ์ค์ฆ์ ์ผ๋ก ์ธก์ ํ์ฌ, ๋ฐ์ดํฐ ์์ฑ ๊ธฐ๋ฒ์ ์ค์ ์ ์ฉ๊ณผ ํ๊ณ๋ฅผ ๋ณด์์ ์ผ๋ก ๋ถ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Generating a structured summary of numerous academic papers ๋
ผ๋ฌธ์ ๊ณผํ๋ฌธํ ์๋ ์์ฝ์ ๋์ฒด์ ์ธ ์ ๊ทผ๋ฒ ๋ฐ ํ๊ฐ ์งํ๋ฅผ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ ๋
ผ๋ฌธ ์๋ ์์ฝ์ ์ ํ๋์ ํธํฅ์ ํ๊ฐํ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ์ ๋
ผ๋ฌธ ์์ฝ ์๋ํ์ ํ์ง๊ณผ ํ๊ณ๋ฅผ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ๊ธฐ๋ฐ ๊ณผํ ์์ฝ์ด ๊ณผ๋ํ๊ฒ ์ผ๋ฐํ๋๊ฑฐ๋ ๋ด์ฉ ๋ค์์ฑ์ด ๊ฐ์ํจ์ ๊ฐ๊ฐ ์ค์ฆ์ ์ผ๋ก ๋ฐํ, ๊ฒฐ๊ณผ ํด์๊ณผ ๋ณด์ ๋์ฑ
๋
ผ์๊ฐ ์ํธ ๋ณด์์ ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ๊ณผํ ๋ฌธํ ์์ฝ์์ ๋ฐ์ํ๋ ๋ค๋ฅธ ์ ํ์ ํธํฅ์ ๋ถ์ํ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ์์ฑ ์์ฝ์ ๊ณผ๋ํ ์ผ๋ฐํ ๋ฐ ์ค๋ฅ๋ฅผ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ๊ณผํ์ ์ฃผ์ฅ ์์ฑ์์์ ํธํฅ๊ณผ ์ ํ์ฑ์ ๋ถ์ํ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋๊ท๋ชจ ํ์ ๋ฐ์ดํฐ ์์ฝยท์ ๋ ฌ๊ณผ LLM์ ์ธ์ฉยท์ง์ ๋ด๋ถํ ๋ฉ์ปค๋์ฆ์ ์ํธ์์ฉ์ ๋น๊ต ๋ถ์ํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ์ ๋ฐ๊ฒฌ ๋ฐ ์์ฝ ๊ณผ์ ์์ LLM์ ์ถ๋ก ํธํฅ, ์ผ๋ฐํ, ํ๊ฐ ๋ฌธ์ ๋ฅผ ๊ฐ๊ฐ ๋ค๋ฅธ ๊ด์ ์ผ๋ก ๋ถ์ํ๋ฉฐ ์ํธ๋ณด์์ ์๊ฐ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์ด์ ํธ ๊ธฐ๋ฐ ์ฐ๊ตฌ ์๋ํ ํ๋ ์์ํฌ์์ ์ ์ฌํ ํ์
๊ตฌ์กฐ๋ฅผ ํ๊ตฌํ๋ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
AI ๊ธฐ๋ฐ ๋
ผ๋ฌธ ์์ฝ ๋ฑ ์ง๋จ์ง์ฑ ํ๋ ฅ์์ ๋ํ๋๋ ์ผ๋ฐํ ํธํฅ ํ์๊น์ง ์ฐ๊ตฌ๋ฅผ ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
414 ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ธ์ฐ๊ธฐยท์์ฝ ํ์ฉ์ด ์ธ๊ฐ ์์ฑ๊ณผ ๋น๊ตํด ๊ตฌ์กฐ์ ยท๋ด์ฉ์ ์๊ณก์ ์ ๋ฐํจ์ ์ค์ฆ, 373์ ๊ฒฐ๋ก (์ค๋
์ํ์ฑ)์ ์ฌํ์ ์ฐจ์์์ ํ์ฅ ๋ถ์ํ๋ค.
์์ฉ ์ฌ๋ก
LLM์ ์๊ธฐ๊ฐ์ ๋ฐ ๊ฒ์ฆ ๋ฅ๋ ฅ ์ฐ๊ตฌ๊ฐ ์ค์ ๊ณผํ ์์ฝ์ ์ผ๋ฐํ ํธํฅ ์ค์ฌ๋ก(Generalization Bias)์ ์ฐ๊ฒฐ๋๋ค.
๋ฐ๋ก /๋นํ
Shallow synthesis of knowledge in gpt-generated texts ๋
ผ๋ฌธ์ LLM์ ๊ณผ๋ํ ์ผ๋ฐํ ๋ฐ ์์ ์ง์ ๊ฒฐํฉ ๊ฒฝํฅ์ ์ค์ฆ์ ์ผ๋ก ๋ถ์ํด Generalization Bias ๋
ผ๋ฌธ์ ๊ฒฐ๋ก ์ ํ์ฅํ๊ณ ๋
ผ์์ ๊น์ด๋ฅผ ๋ํ๋ค.
๋ฐ๋ก /๋นํ
๋ํ ์ธ์ด๋ชจ๋ธ์ ๋ค๋จ๊ณ/ํ์
๊ธฐ๋ฐ ์ ๋ฐ ์์ฝ ํ๋ ์์ํฌ๋ฅผ ํตํด, 373๋ฒ ๋
ผ๋ฌธ์ ๊ณผ๋์ผ๋ฐํ ๋ฌธ์ ์ ๋ํ ์์คํ
์ ๊ฐ์ ๋ฐฉํฅ์ ์ ์ํฉ๋๋ค.
๋ฐ๋ก /๋นํ
OARelatedWork๊ฐ ์ ์ฒด ๋
ผ๋ฌธ ๋ณธ๋ฌธ์ผ๋ก ์์ฝ์ ์๋ํ๋๋ฐ ๋ฐํด, 373์ LLM ์์ฝ์ ์ผ๋ฐํ ํธํฅ ๋ฌธ์ ๋ฑ ํ๊ณ๋ฅผ ๋นํ์ ์ผ๋ก ๋ค๋ฃน๋๋ค.