์ ์: Nikita A. Krotkov, Dmitrii A. Sbytov, Anna A. Chakhoyan, Polina I. Kornienko, Anna A. Starikova, Maxim G. Stepanov, Anastasiia O. Piven, Timur A. Aliev, Tetiana Orlova, Mushegh S. Rafayelyan, Ekaterina V. Skorb | ๋ ์ง: 2025-10-27 | DOI: 10.1021/acs.jcim.5c01897 📄 PDF
Essence
Figure 2. A schematic of a Retrieval-Augmented Generation (RAG) system processing user queries and categorizing them int
์ด ์ฐ๊ตฌ๋ Retrieval-Augmented Generation (RAG) ์์คํ
๊ณผ LLM์ ํตํฉํ์ฌ ๋๋
ธ๊ตฌ์กฐ ์ฌ๋ฃ(ํนํ two-photon polymerization์ผ๋ก ์ ์กฐ๋)์ ์ค๊ณ๋ฅผ ์๋ํํ๊ณ , ๊ด๋ํ ๊ณผํ ๋ฌธํ ๋ฐ์ดํฐ๋ฒ ์ด์ค์์ ์ ๋ณด๋ฅผ ์ถ์ถยท๋ถ์ํ๋ ์์ด์ ํธ ๊ธฐ๋ฐ ํ๋ซํผ์ ์ ์ํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ์ด ์ฐ๊ตฌ๋ RAG์ LLM์ ํ์ฉํ์ฌ ๋๋
ธ์ฌ๋ฃ ์ค๊ณ ๋ถ์ผ์ ๋ฌธํ ๋ถ์์ ํจ๊ณผ์ ์ผ๋ก ์๋ํํ๋ ํ์ ์ ํ๋ซํผ์ ์ ์ํ๋ฉฐ, ๋์ ์ ํ๋(0.82 cosine similarity, 0.81 precision)์ ์ง๊ด์ ์ธํฐํ์ด์ค๋ก ์ฐ๊ตฌ ์์ฐ์ฑ์ ํฌ๊ฒ ํฅ์์ํจ๋ค. ๋ค๋ง domain-specific ์ฉ์ด ์ปค๋ฒ๋ฆฌ์ง์ ์ผ๋ฐํ ๋ฅ๋ ฅ ๊ฐ์ ์ด ํ์ํ๊ณ , ํฅํ MatSci-LLM ๊ฐ๋ฐ๊ณผ ์คํ์ค ์๋ํ ํตํฉ์ด ์ค์ํ ๊ณผ์ ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ๋ฒ์น ๋ฐ ์์ฌ ๊ฐ์ค ๋ฐ๊ฒฌ ์๋ํ๋ฅผ ์ํด ๋ฉํฐ์์ด์ ํธ ํ๋ ์์ํฌ์ ์ญํ ๊ณผ ๊ตฌํ ๊ฐ๋ฅ์ฑ์ ์ด๋ก ์ ์ผ๋ก ํ๊ตฌํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
589๋ฒ(OpenFOAMGPT)์ retrieval-augmented LLM์ด ํ์ฉ๋ ํน์ ์์ฉ์ฌ๋ก๋ก, 569๋ฒ์ด ์ ์ํ RAG ์์คํ
์ ๊ตฌ์ฒด์ ์ ์ฉ ์์๋ก ์ฐธ๊ณ ํ ์ ์๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
MOF ๋
ผ๋ฌธ ๋ฐ์ดํฐ๋ง์ด๋ยท์กฐ๊ฑด ์ถ์ฒ์ ๋ฐํ์ผ๋ก retrieval-augmented generation ๊ธฐ๋ฐ ์ฌ๋ฃ ์ค๊ณ๋ฅผ ์ค์ ์ํํ ์ฌ๋ก์
๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
A Survey of AI for Materials Science ๋
ผ๋ฌธ์ ์ฌ๋ฃ๊ณผํ ๋ถ์ผ LLM/RAG ํ์ฉ ํธ๋ ๋์ ํ๊ณ๋ฅผ ๋ถ์ํ์ฌ ๋ณธ ๋
ผ๋ฌธ์ ๊ธฐ์ ์ , ์ฌํ์ ๋งฅ๋ฝ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
569 ๋
ผ๋ฌธ์ ํ์ ๋ฐ ์ ์ธต/์ด์ข
์์ฌ ์ค๊ณ์ ๋ํ RAG ๋ฐ ์์ฑํ ๋ชจ๋ธ ์ ๊ทผ๋ฒ์ ๋ค๋ฃจ์ด, 3039์ ์ฐจ์ธ๋ ์ฐจํ ์์ฌ ์ค๊ณ ๋
ผ์์ ๊น์ด๋ฅผ ๋ํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณ ์ํธ๋กํผ ์ด๋งค์ ๋ํ RAG ๊ธฐ๋ฐ ์์ฌ์ค๊ณ์ ์๋ฆฌ๋ฅผ ์ ๋ฆฌํ ๋ฆฌ๋ทฐ๋ก, ๋ฐ์ดํฐ-์ฃผ๋ ์ด๋งค ์ค๊ณ์ ๋ฐฉ๋ฒ๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
602๋ฒ ๋
ผ๋ฌธ์ ๊ณผํ ๋ฌธํ์ ๊ฒ์ ๋ฐ RAG ๋ฐฉ์์ ํ์ฉํด, 569๋ฒ์ ๋๋
ธ์ฌ๋ฃ ์ค๊ณ RAG ์์คํ
๊ณผ ๋น๊ต๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ์ฌ๋ฃ ๋ฐ๊ฒฌ ์์คํ
์ ๋์์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
Frame-wise LLM ๊ธฐ๋ฐ ์ฌ๋ฃ ๊ณผํ ์๋ํ ์์ด์ ํธ(MATPilot)๋ก, RAG ๊ธฐ๋ฐ ์ค๊ณ ์ธ ๋ฒค์น๋งํฌ์ฉ ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
RAG-LLM ๊ธฐ๋ฐ ๋๋
ธ์์ฌ ์ค๊ณ ์๋ํ๋ผ๋ ์ ์ฌ ๋ชฉ์ ์ด์ง๋ง, ์๋ก ๋ค๋ฅธ ๋๋ฉ์ธ(์ฌ๋ฃ vs. ๋๋
ธ๊ตฌ์กฐ)๊ณผ ์ ๊ทผ์ ์ทจํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
RAG ๋ฐฉ์์ด ์๋ ๋๋ฉ์ธ ์ง์ ์ฃผ์
ํ LLM ๊ธฐ๋ฐ ์์ฌ ์ค๊ณ๋ผ๋ ๋๋ค๋ฅธ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
588๋ฒ์ CFD ์๋ฎฌ๋ ์ด์
์์ ์๋ํ๋ฅผ ๋ค๋ฃฌ multi-agent LLM ์์คํ
์ผ๋ก, 569๋ฒ์ ์์ด์ ํธ ๊ธฐ๋ฐ ์๋์ค๊ณ ์ฐ๊ตฌ์ ์ ์ฌํ ๋ฐฉํฅ์ฑ์ ๋ณด์ธ๋ค.
๋ค๋ฅธ ์ ๊ทผ
569(Nanostructured Material Design)๋ ๋ฉํฐ๋ชจ๋ฌ LLM๊ณผ RAG๋ฅผ ๊ฒฐํฉํ์ฌ ๋๋
ธ๋ฌผ์ง ์ค๊ณ ๋ฌธ์ ๋ฅผ ํธ๋ ๋์กฐ์ ์ ๊ทผ์ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
569๋ RAG ๊ธฐ๋ฐ์ผ๋ก ๋๋
ธ ์์ฌ ๋ฑ ๊ตฌ์กฐ ์์ธก/๋์์ธ์ ๋ค๋ฃจ๋ฉฐ, 1104์ topological materials rule discovery์ ๋ค๋ฅธ ๋ฐฉ์์ ์ธ๊ณต์ง๋ฅ ํ์ฉ ์ฌ๋ก์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
retrieval-augmented generative AI๋ก ์์ฌ ํฉ์ฑ ๊ฒฝ๋ก๋ ์๋ก์ด ์กฐ์ฑ์ ์์ฑํ๋ ๋์๋ ๋ฐฉ๋ฒ๋ก ์ ๋น๊ตํจ.
๋ค๋ฅธ ์ ๊ทผ
SMILES/SMARTS ํจํด ํ์ฉ, ์์ฑ์ ๋ถ์ ํฉ์ฑ ์ค๊ณ ๋ฑ์์ ์๋ก ๋ค๋ฅธ ์ ๊ฒฝ-๊ธฐํธ ๊ฒฐํฉ ๋ฐฉ๋ฒ๋ก ์ ํ์ํจ.
๋ค๋ฅธ ์ ๊ทผ
๊ฒ์ ๊ธฐ๋ฐ ์์ฑ AI๋ก ๋๋
ธ์์ฌ์ ์ค๊ณ๋ฅผ ์๋ํ๋ ๋์์ ์ ๋ต์ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
retrieval ๊ธฐ๋ฐ ์์ฑ AI๋ฅผ ํ์ฉํ ์ค์ ๋ฌด๊ธฐ ๊ตฌ์กฐ ์ค๊ณ ์ ๊ทผ๋ฒ์ ์ค์ฆ์ ์ผ๋ก ๋น๊ต ๊ฐ๋ฅํจ.
๋ค๋ฅธ ์ ๊ทผ
์์ฌ ๋ฐ๊ฒฌ์์ ์ ์กฐ์ฑ ๋ฐ ์ค์ฉ์ ์ ์ฝ์ ํตํฉํ๋ ๋์์ ์ ๊ทผ๋ฒ์ ๋ค๋ฃจ๋ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
651๋ฒ ๋
ผ๋ฌธ ์ญ์ RAG ๊ธฐ๋ฐ LLM ํ์
์์ด์ ํธ๋ฅผ ์ฝ๋ฌผ ๊ฐ๋ฐ์ ์ ์ฉํด, 569๋ฒ์ด ์ ์ํ ์์คํ
๊ตฌ์กฐ์ ํ์ฅ์ ์ฌ๋ก์
๋๋ค.
ํ์ ์ฐ๊ตฌ
MOF ์คํ ๋ฐ์ดํฐ ์ถ์ถ ๋ฐ ํ์ฉ์์ ํ๊ฑธ์ ๋ ๋์๊ฐ retrieval-augmented generation ๊ธฐ๋ฐ ์ฌ๋ฃ ์ค๊ณ์ ์ ์ฉํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
RAG์ ์์ฑ๋ชจ๋ธ์ ๊ฒฐํฉํด ์๋ ๋ฌผ์ง ํฉ์ฑ๊ณผ ์ด๋งค์ ๋ฐ๊ตด์ ํ์ฅ ์ ์ฉํ ์ฌ๋ก์.
ํ์ ์ฐ๊ตฌ
Retrieval-augmented generation(RAG)๊ณผ ์์ฌ ์ค๊ณ ํตํฉ์ ๋ณด๋ค ๊ตฌ์กฐ์ ์ผ๋ก ํ์ฅํ ์ ๊ทผ์ด๋ค.
ํ์ ์ฐ๊ตฌ
Nanostructured Material Design via a Retrieval-Augmented Generative Model์ ์์ฑํ ๋ชจ๋ธ๊ณผ ์งํ์ ๊ฒ์, ์คํํธ๋ผ ์ตํฉ ๊ธฐ๋ฐ ๋๋
ธ์์ฌ ์์ฑ์์ 3113์ ํ๋ ์์ํฌ๋ฅผ ์์ฌ ํ์์ผ๋ก ํ์ฅ ์ ์ฉํ๋ค.
์์ฉ ์ฌ๋ก
์ฌ๋ฃ๊ณผํ ์์ด์ ํธ๊ฐ ์ค์ ์์ฌ ์ค๊ณ ๋ฐ ์ ๋ณด ์ถ์ถ์ ํ์ฉ๋๋ ๊ตฌ์ฒด์ ํ๋ซํผ ๊ฐ๋ฐ ์ฌ๋ก๋ค.
์์ฉ ์ฌ๋ก
569๋ฒ์์ ์ ์๋ RAG ๊ธฐ๋ฐ ๋๋
ธ์ฌ๋ฃ ์ค๊ณ ์๋ํ๋ 614๋ฒ์์ ์งํฅํ๋ ์คํ์ค ์๋ํ์ ์ค์ ์ฌ๋ก๋ก ํ์ฉ๋ ์ ์๋ค.
์์ฉ ์ฌ๋ก
569๋ฒ์ RAG+LLM์ ํ์ฉํ ๋๋
ธ๊ตฌ์กฐ ์ฌ๋ฃ ์๋ ์ค๊ณ ํ๋ซํผ์ ๊ฐ๋ฐํด, 594๋ฒ์ ๊ณผํ ์์ด์ ํธ ๊ตฌ์กฐ๋ฅผ ์ ํ์ ์ผ๋ก ์ ์ฉยทํ์ฅ ๊ฐ๋ฅํ๋ค.