Step-back profiling: Distilling user history for personalized scientific writing
์ ์: Xiangru Tang, Xingyao Zhang, Yanjun Shao, Jie Wu, Yilun Zhao, Arman Cohan, Ming Gong, Dongmei Zhang, Mark Gerstein | ๋ ์ง: 2024 | DOI: arXiv:2406.14275 📄 PDF
Essence
๊ทธ๋ฆผ 1: STEP-BACK PROFILING ๊ฐ์. ๊ฐ ์ฌ์ฉ์์ ๊ณผ๊ฑฐ ๋
ผ๋ฌธ์ ์์ถํ์ฌ ํ๋กํ ํํ์ ์์ฑํ๊ณ , ์ด๋ฅผ LLM ์์ฑ ๊ณผ์ ์ ์ฆ๊ฐํ๋ ๋ฐฉ์
๋ณธ ๋
ผ๋ฌธ์ ์ฌ์ฉ์ ์ด๋ ฅ(user history)์ ๊ฐ๊ฒฐํ ํ๋กํ๋ก ์ฆ๋ฅ(distill)ํ์ฌ LLM์ ๊ฐ์ธํํ๋ STEP-BACK PROFILING ๊ธฐ๋ฒ์ ์ ์ํ๋ค. ํนํ ๋ค์ค ์ ์ ๊ณผํ ๋
ผ๋ฌธ ์์ฑ์ด๋ผ๋ ํ์ค์ ์๋๋ฆฌ์ค์์ ํ์
๊ธ์ฐ๊ธฐ๋ฅผ ์ง์ํ๊ธฐ ์ํด ๊ฐ๋ฐ๋์๋ค.
Motivation
- Known:
- ๊ธฐ์กด LLM ๊ฐ์ธํ ์ฐ๊ตฌ๋ ๋จ์ผ ์ฌ์ฉ์ ๋งฅ๋ฝ์ ์ด์ ์ ๋ง์ถค
- ๊ฒ์ ์ฆ๊ฐ(retrieval-augmented) ๋ฐฉ์์ ์๋ณธ ์ฌ์ฉ์ ๋ฐ์ดํฐ์ ๋น์์ถ ํํ๋ฅผ ์ฌ์ฉ
- ์ปจํ
์คํธ ๊ธธ์ด ์ ํ์ผ๋ก ์ธํด ๊ด๋ํ ์ฌ์ฉ์ ์ด๋ ฅ ํ์ฉ์ด ๋นํ์ค์
- Gap:
- ํ๋ ๊ณผํ ์ถํ์ ์์ญ~์๋ฐฑ ๋ช
์ ์ ์๊ฐ ํ์
ํ๋ ๊ฒฝ์ฐ๊ฐ ์ฆ๊ฐ ์ค
- ๋ค์ค ์ ์ ํ์
์๋๋ฆฌ์ค์์ ๋ชจ๋ธ์ ์ฑ๋ฅ ํ๊ฐ ๋ฒค์น๋งํฌ ๋ถ์ฌ
- ๊ฐ๋ณ ์ ์์ ์ ๋ฌธ์ฑ๊ณผ ๋ค์ํ ๊ธ์ฐ๊ธฐ ์คํ์ผ์ ๋์์ ๋ชจ๋ธ๋งํ๋ ๋ฐฉ๋ฒ ๋ถ์กฑ
- Why:
- ๋ฉ๋ชจ๋ฆฌ ์ ์ฝ์ ๊ณ ๋ คํ๋ฉด์๋ ํต์ฌ ์ฌ์ฉ์ ํน์ฑ๋ง ์ถ์ถ ํ์
- ํ ๊ณผํ(team science) ์๋์ ํ์
์ฐ๊ตฌ ํจ์จํ ์๊ตฌ
- LLM ๊ธฐ๋ฐ ๊ฐ์ธํ ์์คํ
์ ์ค์ง์ ์ ์ฉ์ฑ ํฅ์
- Approach:
- ์ฌ์ฉ์ ์ด๋ ฅ์ ๊ณ ์์ค ๊ฐ๋
๊ณผ ์ธ์ด ํน์ฑ์ผ๋ก ์์ถํ๋ ํ๋กํ ์์ฑ
- ๋ค์ค ์ฌ์ฉ์ ํ๋กํ์ ์์ฐจ์ ์ฐ๊ฒฐ(concatenation)
- ์๋ก์ด Personalized Scientific Writing (PSW) ๋ฒค์น๋งํฌ ๊ตฌ์ถ
Achievement
๊ทธ๋ฆผ 2: LaMP ๋ฒค์น๋งํฌ์์ STEP-BACK PROFILING์ ์ฑ๋ฅ. ๋๋ถ๋ถ์ LaMP ์์
์์ ์ฐ์ํ ์ฑ๋ฅ ๋ฌ์ฑ
- LaMP ๋ฒค์น๋งํฌ ๊ฐ์ : ๊ธฐ์กด ๋ฐฉ๋ฒ ๋๋น ์ต๋ 3.6์ ์ฑ๋ฅ ํฅ์ ๋ฌ์ฑ (7๊ฐ ๊ฐ์ธํ ์์
)
- ๋ค์ค ์ ์ ํ์
๊ธ์ฐ๊ธฐ ๊ฒ์ฆ: PSW ๋ฐ์ดํฐ์
์ ํตํด ํ์
๋
ผ๋ฌธ ์์ฑ์์ ์ฌ์ฉ์ ํน์ฑ ํฌ์ฐฉ์ ํจ๊ณผ์ฑ ์
์ฆ
- ํ๋กํ ๊ธฐ๋ฐ ์์ฑ์ ์ฐ์์ฑ: ์๋ณธ ์ด๋ ฅ ์ง์ ์ฌ์ฉ๋ณด๋ค ์ถ์ํ๋ ํ๋กํ ์ฌ์ฉ์ด ๋ ํจ์จ์ ์์ ์ค์ฆ
- ํ์ฅ์ฑ ํ๋ณด: ์ ํ๋ ์ปจํ
์คํธ ๊ธธ์ด ๋ด์์ ๋ ๋ง์ ์ฌ์ฉ์ ์ ๋ณด ํ์ฉ ๊ฐ๋ฅ
How
STEP-BACK PROFILING์ 4๋จ๊ณ ์ ์ฐจ
์ ์ฐจ ๊ตฌ์ฑ:
- User Profile Gisting: LLM์ ์ด์ฉํ์ฌ ๊ฐ ์ฌ์ฉ์์ ์ด๋ ฅ Hi๋ฅผ ์งง์ "gist" ํํ์ผ๋ก ์์ถ (Gist(ยท) ํจ์)
- ์ฌ์ฉ์์ ๊ณ ์์ค ํน์ฑ(traits)๊ณผ ๊ด์ฌ์ฌ(interests) ์บก์ฒ
- Multi-User Profile Concatenation: ๊ฐ๋ณ ํ๋กํ Pu1, Pu2, ..., Pun์ ์์ ๋ฏผ๊ฐ์ ์ผ๋ก ๊ฒฐํฉํ์ฌ ํตํฉ ํํ PU ์์ฑ
- Retrieval-Augmented Generation (์ ํ์ฌํญ): ์
๋ ฅ x์ ๋ํด ๊ฐ ์ ์์ ์ด๋ ฅ์์ ๊ด๋ จ ์ค๋ํซ ์์-k๊ฐ ๊ฒ์
- ์ฆ๊ฐ๋ ์
๋ ฅ: xฬ = [x; R1,k; R2,k; ...; Rn,k]
- Personalized Output Generation: LLM์ด ์ฆ๊ฐ ์
๋ ฅ(๋๋ ์๋ณธ ์
๋ ฅ)๊ณผ ์ฐ๊ฒฐ๋ ํ๋กํ PU๋ก ์กฐ๊ฑด์ง์ด ๊ฐ์ธํ๋ ์ถ๋ ฅ ์์ฑ
PSW ๋ฒค์น๋งํฌ ์ค๊ณ:
- UP-0: Research Interest Generation (์ ์ ํ๋กํ ๊ตฌ์ถ)
- PSW-1: Research Topic Generation (๊ณต๋ ์ฐ๊ตฌ ์ฃผ์ )
- PSW-2: Research Question Generation (์ฐ๊ตฌ ์ง๋ฌธ)
- PSW-3: Paper Abstract Generation (๋
ผ๋ฌธ ์์ฝ)
- PSW-4: Paper Title Generation (๋
ผ๋ฌธ ์ ๋ชฉ)
ํ๊ฐ ๋ฐฉ์: GPT-4-turbo ๊ธฐ๋ฐ ์ฒด์ธ-์ค๋ธ-์ฝํฌ(chain-of-thought) ํ๋กฌํํ
์ผ๋ก ์ผ๊ด์ฑ, ์ ์ฐฝ์ฑ, ๊ด๋ จ์ฑ, ์ฐธ์ ์ฑ ํ๊ฐ
Originality
- ๋ค์ค ์ ์ ๊ฐ์ธํ์ ์ฒด๊ณ์ ์ ์: ๋จ์ผ ์ฌ์ฉ์ ์ค์ฌ ๊ธฐ์กด ์ฐ๊ตฌ์์ ๋ฒ์ด๋ ํ์
์๋๋ฆฌ์ค๋ก ํ์ฅ
- ํ๋กํ ์ฆ๋ฅ ๊ฐ๋
์ ์ ๊ท์ฑ: ์๋ณธ ์ด๋ ฅ์ ๋นํจ์จ์ ์ง์ ์ฌ์ฉ ๋์ LLM ๊ธฐ๋ฐ ์ถ์ํ ๋ฐฉ์ ๋์
- PSW ๋ฒค์น๋งํฌ์ ํ์ค์ฑ: ์ค์ ๊ณผํ ๋
ผ๋ฌธ ์ ์ ๊ตฌ์ฑ๊ณผ ์ด๋ ฅ์ ๊ธฐ๋ฐ์ผ๋ก ํ ํ์ค์ ํ๊ฐ ๋ฐ์ดํฐ์
- ํ๋ จ ์๋ ๊ฐ์ธํ(training-free) ์ ๊ทผ: ์ฌ์ ํ์ต๋ LLM๋ง์ผ๋ก ๊ตฌํ ๊ฐ๋ฅํ ์ค์ฉ์ฑ
- ๋ค์ค ์ ์ ์์ ๋ฏผ๊ฐ์ฑ ๋ถ์: ์ ์ ์์๊ฐ ๋ชจ๋ธ ์ฑ๋ฅ์ ๋ฏธ์น๋ ์ํฅ ์ค์ฆ์ ๊ฒ์ฆ
Limitation & Further Study
- ํ๋กํ ์์ฑ์ ํ์ง ์์กด์ฑ: Gist(ยท) ํจ์์ ์ฑ๋ฅ์ ์ ์ฒด ์์คํ
์ด ์์กดํ๋ฉฐ, ์ ํ์ง ํ๋กํ ์์ฑ ์ ํ๋ฅ ์์
์
ํ ๊ฐ๋ฅ
- ๋ค์ค ์ ์ ์ํธ์์ฉ ๋ชจ๋ธ๋ง ๋ถ์กฑ: ํ์ฌ ๋ฐฉ์์ ํ๋กํ์ ๋จ์ ์ฐ๊ฒฐ๋ก, ์ ์ ๊ฐ ํ์
์ญํ๊ด๊ณ(dynamics)๋ฅผ ๋ช
์์ ์ผ๋ก ๋ชจ๋ธ๋งํ์ง ์์
- ํ๊ฐ ๋ฐฉ์์ ํ๊ณ: GPT-4 ๊ธฐ๋ฐ ์๋ ํ๊ฐ๊ฐ ์ฌ์ฉ๋์์ผ๋, ์ค์ ์ธ๊ฐ ํ๊ฐ์์ ์ผ๊ด์ฑ ๊ฒ์ฆ ํ์
- ์ ์ ์ด๋ ฅ์ ๊ธธ์ด ์ ์ฝ: ์์ญ ๋
๊ฒฝ๋ ฅ์ ์ ์๋ ๋ฐฉ๋ํ ๋
ผ๋ฌธ ์ด๋ ฅ์ ๊ฐ์ง๋ฏ๋ก, ์ค์ ํ๋กํ ์์ฑ ์ ์ ๋ณด ์์ค ๊ฐ๋ฅ
- ํ์ ์ฐ๊ตฌ ๋ฐฉํฅ:
- ์ ์ ๊ฐ ํ์
ํจํด์ ๋ช
์์ ์ผ๋ก ๋ชจ๋ธ๋งํ๋ ๊ตฌ์กฐ์ ํ๋กํ ํํ ๊ฐ๋ฐ
- ์ธ๊ฐ ํ๊ฐ ๊ธฐ๋ฐ ๊ฒ์ฆ ๋ฐ ๋๋ฉ์ธ ์ ๋ฌธ๊ฐ ํ๊ฐ ์ถ๊ฐ
- ์ฅ๊ธฐ ์ ์ ์ด๋ ฅ ์ฒ๋ฆฌ๋ฅผ ์ํ ๊ณ์ธต์ ํ๋กํ ์ถ์ํ ์ฐ๊ตฌ
- ๋ค๊ตญ์ด ๊ณผํ ๋
ผ๋ฌธ์ผ๋ก ํ์ฅ๋ ํ๊ฐ
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ํ์
๊ณผํ ๊ธ์ฐ๊ธฐ๋ผ๋ ํ์ค์ ๋ฌธ์ ๋ฅผ ์ ์ํ๊ณ , ์ฌ์ฉ์ ์ด๋ ฅ์ ํจ์จ์ ์์ถ์ ํตํ LLM ๊ฐ์ธํ ๋ฐฉ๋ฒ์ ์ ์ํ ์ ์์ ๊ธฐ์ฌ๋๊ฐ ๋๋ค. ๋ค๋ง ์ ์ ๊ฐ ์ํธ์์ฉ์ ๋ช
์์ ๋ชจ๋ธ๋ง๊ณผ ์ธ๊ฐ ํ๊ฐ ๊ธฐ๋ฐ ๊ฒ์ฆ์ด ๊ฐํ๋๋ฉด ๋์ฑ ์ค๋๋ ฅ ์๋ ์ฐ๊ตฌ๊ฐ ๋ ์ ์๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
641 ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ณผํ ํ์
์์ ์ธ๊ฐ-์์ด์ ํธ ์ํธ์์ฉ ๋ฐ ํ๋ ํ๋กํ์ผ๋ง ์์์ ๋ถ์ํด, 775์ ์ฌ์ฉ์ ์ด๋ ฅ ๊ธฐ๋ฐ ํ๋กํ๋ง ์ฐ๊ตฌ ์ดํด์ ๋์์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Criteria-first, semantics-later ๋
ผ๋ฌธ์ ์ฌ์ฉ์ ํ๋กํ์ผ๋ง ๊ธฐ๋ฐ ๊ฐ๋ณํ/๋ง์ถค LLM ๋๋ ์์ด์ ํธ ์ค๊ณ์ ์ค์ํ ๊ธฐ๋ฐ์ด ๋ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
CoAuthor ๋ฐ์ดํฐ์
(228)์ ์ค์ AI-human ๊ณต๋ ์ ์ ํ์์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ๋ถ์์ด๋ฉฐ, 775๋ฒ ๋
ผ๋ฌธ์ ํ๋กํ ์์ถ ๊ธฐ๋ฐ ํ์
๊ธ์ฐ๊ธฐ์
๋๋ค.
ํ์ ์ฐ๊ตฌ
414 ๋
ผ๋ฌธ์ ํ์ ๊ธ์ฐ๊ธฐ์์ ์ธ๊ฐ-LLM ๊ณต๋ ์งํ ์์์ ์ค์ฆ์ ์ผ๋ก ๋ถ์ํด, 775์ ๊ฐ์ธํ๋ LLM ํ์ฉ ์๋๋ฆฌ์ค์ ์ค์ ์ ํ์ฅ์
๋๋ค.
ํ์ ์ฐ๊ตฌ
Step-back profiling ์ฐ๊ตฌ๋ ์ฌ์ฉ์์ ํ์คํ ๋ฆฌ ๊ธฐ๋ฐ ๊ฒ์ ๊ฐ์ธํ ๊ด๋ จ ๋ฌธ์ ๋ฅผ ๋
ผํ๊ณ ํธํ์ฑ์ ๋ด๋ณดํ๋ค.
์์ฉ ์ฌ๋ก
Human-ai teaming ๋
ผ๋ฌธ์ LLM ํ์
์ ๊ธ์ฐ๊ธฐ/๋ฌธ์์์ฑ์์ ํ๋กํ ๊ธฐ๋ฐ ๊ฐ์ธํ์ ์ค์ ์ ์ฉ ์ผ์ด์ค๋ฅผ ๋ณด์ฌ์ค๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์