Essence
๊ทธ๋ฆผ 1: ์ต๊ทผ ๋
๋๋ณ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ์ ๋ฐ์ timeline. ์คํ์์ค LLM์ ๋
ธ๋์์ผ๋ก ํ์
ChatGPT๋ก ์ด๋ฐ๋ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ํ์ ์ ์ฌ๋ฃ๊ณผํ ๋ถ์ผ์ ์ฒด๊ณ์ ์ผ๋ก ์ ์ฉํ๊ธฐ ์ํ ์ง์-์๋ด์ ๋๋ฉ์ธ ํนํ ๋ชจ๋ธ ๊ฐ๋ฐ ๋ฐ ํ์ฉ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ ์ข
ํฉ ๋ฆฌ๋ทฐ ๋
ผ๋ฌธ์ด๋ค. ๋ณธ ๋
ผ๋ฌธ์ LLM ๊ตฌ์ถ๋ถํฐ ์ฌ๋ฃ ๋ฐ๊ฒฌ์์ ์ค์ ์์ฉ๊น์ง ์ ์ฃผ๊ธฐ์ ๊ฐ์ด๋๋ผ์ธ์ ์ ๊ณตํ๋ค.
How
๊ทธ๋ฆผ 3: LLM ํ์ธํ๋์ ์ํ ํ๋ ์์ํฌ. (a) ๋งค๊ฐ๋ณ์ ํจ์จ์ ํ์ธํ๋์ 3๊ฐ์ง ๋จ๊ณ
๊ทธ๋ฆผ 4: ๊ฒ์-์ฆ๊ฐ ์์ฑ(RAG)์ ๊ฐ์
๊ทธ๋ฆผ 5: (a) ๋น์์ด์ ํธ, (b) ์์ด์ ํธ, (c) ๋ค์ค ์์ด์ ํธ ์ํฌํ๋ก์ฐ
์ฌ๋ฃ๊ณผํ LLM ๊ตฌ์ถ ๋ฐ ์ ์ฉ ๋ฐฉ๋ฒ๋ก :
- ์ํคํ
์ฒ ์ค๊ณ: Transformer ๊ธฐ๋ฐ ๊ตฌ์กฐ ์ฑํ โ ์๊ธฐ-์ฃผ์(Self-Attention) ๋ฉ์ปค๋์ฆ์ผ๋ก ์ฌ๋ฃ ๋ฐ์ดํฐ ๊ฐ ๊ด๊ณ์ฑ ํฌ์ฐฉ โ ๋ค์ค-ํค๋ ์ฃผ์(Multi-Head Attention)๋ก ๋ค์ํ ์ฌ๋ฃ ์ ๋ณด ํํ โ ์์น ์ธ์ฝ๋ฉ์ผ๋ก ์์ ๋ฐฐ์ด์ด๋ ํฉ์ฑ ๊ฒฝ๋ก ๋ฑ ์ํ์
์ ๋ณด ์ฒ๋ฆฌ
- ๋ฐ์ดํฐ ํ๋ ์ด์
: ์คํ ์ธก์ ๊ฐ, ๊ณ ์ฒ๋ฆฌ๋ ์๋ฎฌ๋ ์ด์
, ๋ฌธํ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๋ฑ ๋ค์ํ ์ถ์ฒ์์ ๊ณ ํ์ง ๋๋ฉ์ธ-๊ด๋ จ ๋ฐ์ดํฐ ์์ง ๋ฐ ์ ์ โ ์ฌ๋ฃ ํน์ฑ๋ณ(๊ตฌ์ฑ, ๊ตฌ์กฐ, ์ฑ์ง)๋ก ๋ฐ์ดํฐ ๋ถ๋ฅ
- ํ์ธํ๋ ์ ๋ต: ์ ์ฒด ๋ชจ๋ธ ํ์ธํ๋(Full Fine-tuning) vs ๋งค๊ฐ๋ณ์ ํจ์จ์ ํ์ธํ๋(LoRA, Prefix Tuning ๋ฑ) ์ ํ โ ๊ณ์ฐ ์์๊ณผ ์ ํ๋ ํธ๋ ์ด๋์คํ ๊ณ ๋ ค
- ๊ฒ์-์ฆ๊ฐ ์์ฑ(RAG): ์ธ๋ถ ์ฌ๋ฃ ๋ฐ์ดํฐ๋ฒ ์ด์ค(Materials Project, ICSD ๋ฑ)๋ฅผ ์ง์ ์์ค๋ก ์ฐ๊ฒฐ โ ๊ฒ์ ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ฑ โ ํ ๋ฃจ์๋ค์ด์
์ํ ๋ฐ ์ต์ ์ ๋ณด ๋ฐ์
- ํ๋กฌํํธ ์์ง๋์ด๋ง: ์ฌ๋ฃ ํน์ฑ ์์ธก ์ ํํ์, ๊ฒฐ์ ๊ตฌ์กฐ, ๊ณต์ ์กฐ๊ฑด ๋ฑ์ ์ฒด๊ณ์ ์ผ๋ก ์
๋ ฅ โ Few-shot ์์ ์ ๊ณต์ผ๋ก ๋ชจ๋ธ ์ฑ๋ฅ ํฅ์
- AI ์์ด์ ํธ: ๋๊ตฌ(๊ณ์ฐ ์ํํธ์จ์ด, ๋ฐ์ดํฐ๋ฒ ์ด์ค) ํ์ฉ ๋ฅ๋ ฅ โ ์์จ์ ์ถ๋ก โ ๋ค์ค ์์ด์ ํธ ํ๋ ฅ์ผ๋ก ๋ณต์กํ ์ฌ๋ฃ ๋ฐ๊ฒฌ ๊ณผ์ ์๋ํ
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ChatGPT ์๋์ ์ฌ๋ฃ๊ณผํ ์ฐ๊ตฌ ํ์ ์ ์ํด LLM์ ์ค์ ๋ก ๊ตฌ์ถํ๊ณ ํ์ฉํ๋ ๋ฐฉ๋ฒ์ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ ์ค์ํ ์ข
ํฉ ๋ฆฌ๋ทฐ์ด๋ฉฐ, ๋๋ฉ์ธ-ํนํ LLM ๊ฐ๋ฐ์ ์ค์ฉ์ ๋ก๋๋งต์ ์ ๊ณตํ๋ค๋ ์ ์์ ํ์ ์ ยท์ค๋ฌด์ ๊ฐ์น๊ฐ ๋์ผ๋, ์ฌ๋ฃ๊ณผํ ํน์ ๋ฐ์ดํฐ์
๊ณผ ํ ๋ฃจ์๋ค์ด์
๋ฐฉ์ง ๊ธฐ์ ์ ๊ณ ๋ํ ๊ฐ์ ํ์ ์ฐ๊ตฌ๊ฐ ์ ์คํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Word2vec์ ๊ธฐ๋ณธ ๋ฐฉ๋ฒ๋ก ๊ณผ ์ด๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
451์ ๋๋ฉ์ธ ํนํ LLM ๊ตฌ์ถ, ์ ๋ณด ์ถ์ถ ๋ฆฌ๋ทฐ๋ 480์ OFET ๋ฐ์ดํฐ ์ถ์ถ ๋ฐ ์ฑ๋ฅ ํฅ์ ์ฌ๋ก์ ๋ฐฉ๋ฒ๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
004๋ ๊ณผํ LLM์ ์ ๋ฐ์ ๋ํฅ๊ณผ ์์ฉ์ฌ๋ก๋ฅผ ๋ค๋ฃจ์ด, 451์ ์ฌ๋ฃ ๊ณผํ ํนํ LLM ํ์ฉ ๋ฆฌ๋ทฐ ๋
ผ๋ฌธ์ ์ด๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ง์์ถ๋ก ๊ธฐ๋ฐ์ LLM์ ์ฌ๋ฃ๊ณผํ์ ํนํ์ํค๋ ๋ฐฉ์์ ํตํด LLaMP์ ๊ณ ์ ๋ขฐ๋ ๋ฉํฐ๋ชจ๋ฌ ์์
์ฑ๋ฅ์ด ๋ท๋ฐ์นจ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ฌ๋ฃ ๊ณผํ ๋ด LLM์ ์ญํ , ํ๊ณ, ์ง์ ๊ธฐ๋ฐ ๊ฒฐํฉ์ ํ์์ฑ์ ๋ค๋ค, L2M3 ์์คํ
์ ๋ฐ์ดํฐ ์ถ์ถ ํจ๊ณผ์ ๊ฒฐํฉ์ ์๋์ง๋ฅผ ์ค๋ช
ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
25๋ฒ ๋
ผ๋ฌธ์ ์ฌ๋ฃ๊ณผํ์ฉ LLM ๋ฐ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ํํฉยท๋์ ๊ณผ์ ์ ๋ํ ์ด๋ก ์ ์ ๋ฆฌ๋ฅผ ์ ๊ณตํ์ฌ 451์ ๋ฆฌ๋ทฐ ์ฑ๊ฒฉ์ ๊ธฐ๋ฐ์ ํ์ฑํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ ์ ์ ๋ถ์ ๋ฑ ์๋ช
๊ณผํ ์ค์ฌ์ AI ์์ด์ ํธ ์ํฌํ๋ก์ฐ ์ฌ๋ก์ ์ฌ๋ฃ๊ณผํ ๋ด LLM ํ์ฉ๋ฒ์ ๋น๊ตํด ์ฐธ๊ณ ํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Knowledge-guided large language model for material science ๋
ผ๋ฌธ์ ์ฌ๋ฃ๊ณผํ ๋ถ์ผ์ ํนํ๋ ์ง์ ์ฆ๊ฐ ๊ธฐ๋ฐ LLM ์์คํ
์ ์ ์ํ์ฌ, HoneyComb์ ๋๊ตฌ ํ๋ธ ๋ฐ ์ ๋ขฐ์ฑ ๊ตฌ์กฐ์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ฌ๋ฃ๊ณผํ์์ LLM ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ๊ณผ knowledge-guided agent์ ํน์ฅ์ ์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ฌ๋ฃ๊ณผํ ๋ถ์ผ์์ LLM ๊ธฐ๋ฐ ์๋ํ๋ฅผ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ ๋ฌธํ์์ ์๋์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ถ์ถํ๋ ์ ์ฌํ ์ ๊ทผ๋ฒ์ ์ฌ์ฉํ๋ ๋์ ์์คํ
์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
RAG ๋ฐฉ์์ด ์๋ ๋๋ฉ์ธ ์ง์ ์ฃผ์
ํ LLM ๊ธฐ๋ฐ ์์ฌ ์ค๊ณ๋ผ๋ ๋๋ค๋ฅธ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
Knowledge-guided large language model for material science ๋
ผ๋ฌธ๋ ์ฌ๋ฃ๊ณตํ์์ ์ง์ ๊ธฐ๋ฐ LLM ์์ฉยท์ถ์ถ์ ๋ค๋ฃจ์ด, ๊ตฌ์ฑ ๋ชจ๋ธ ์๋ ์ถ์ถ๊ณผ ์ฑ๋ฅ์ธก๋ฉด์์ ์๋ฏธ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
Material science์์ LLM๊ณผ ๋๋ฉ์ธ ์ง์ ์ตํฉ์ ํตํ ์ต์ ๋ํํธ ๋ฐ ์์ฌ ํ๋ณด ๋ฐ๊ฒฌ์ ๋ ๋ค๋ฅธ ์ ๊ทผ๋ฒ์ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
์ฌ๋ฃ๊ณผํ์์ LLM ๋ฐ ML์ ์ค์ OFET ์์ ๊ฐ๋ฐ์ ํ์ฉํ๋ ๋ฐฉ๋ฒ๋ก ์ ๊ตฌ์ฒด์ ์ผ๋ก ๋์
ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
451์์ ๋
ผ์ํ๋ ์ฌ๋ฃ๊ณผํ ์ ์ฉ LLM์ 439์ ๊ฒฐ์ ์ฌ๋ฃ ํ ํฐํ์ ๊ฐ์ ์
๋ ฅ ์ ์ฒ๋ฆฌ ๋ฐ ํํ๋ ฅ ๊ฐํ ์ฐ๊ตฌ์ ์ฐ์ฅ์ ์์
๋๋ค.
ํ์ ์ฐ๊ตฌ
465๋ LLM์ด ์ฌ๋ฃ ๊ณผํ ๋ถ์ผ์์ ์ํํ ์ ์๋ ์ญํ ๊ณผ ๊ทธ ํ๊ณ, ๋์ ๊ณผ์ ๋ฅผ ๋
ผ์ํ์ฌ 451์ ์ค์ฉ์ ๊ฐ์ด๋๋ผ์ธ์ ์ฌํยทํ์ฅํ๋ค.
์์ฉ ์ฌ๋ก
LLM ์๊ธฐ๊ฐ์ ๋ฉ์ปค๋์ฆ ๋ฐ ํ๊ณ ๋
ผ์๊ฐ, ์ฌ๋ฃ๊ณผํ ๋ถ์ผ ์ง์-์๋ด LLM์ ์ ๋ขฐ์ฑยท์ค์ฌ์ฉ ๊ฐ๋ฅ์ฑ ํ๊ฐ์ ์ ์ฉ๋ ์ ์๋ค.
์์ฉ ์ฌ๋ก
๋ถ์ ๋ฐ ์์ฌ ํ๋ฉด ์์ธก์ LLM ๊ธฐ๋ฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์กฐํฉ์ด ์ค์ ์คํ์์ ์ด๋ป๊ฒ ์์ฉ๋๋์ง ์ ๋ณด์ฌ์ค๋๋ค.
๋ฐ๋ก /๋นํ
451์์ LLM ๊ธฐ๋ฐ ์ฌ๋ฃ๊ณผํ ํ์ ์ ๊ฐ์กฐํ์ง๋ง, 024๋ ์ค์ ๋ก LLM์ด ์ฌ๋ฃ๋ฐ๊ฒฌ์ ์ผ๋ง๋ ํจ๊ณผ์ ์ธ์ง์ ๋ํ ๋นํ์ ๊ฒํ ๋ฅผ ์ ์ํฉ๋๋ค.
๋ฐ๋ก /๋นํ
์ฌ๋ฃ๊ณผํ ํนํ LLM์ ์๊ธฐ๊ฐ์ ๋ฐ ์ ๋ขฐ์ฑ์ ๋ํ ๋
ผ์๊ฐ, LLM ์ ๋ฐ์ ์๊ธฐ๊ฒ์ฆ ๋ฅ๋ ฅ ํ๊ณ์ ์ค์ ์ ์ฉ์ ์ด๋ ค์์ ๋ณด์์ ์ผ๋ก ์ค๋ช
ํ๋ค.