FunctionalAgent: Towards end-to-end on-top functional design
์ ์: Yuhao Chen, Donald G. Truhlar, Xiao He | ๋ ์ง: 2026-05-07 | URL: https://arxiv.org/abs/2605.06215 📄 PDF
Essence
FunctionalAgent๋ LLM ๊ธฐ๋ฐ ์์ด์ ํธ ์์คํ
์ผ๋ก MC-PDFT์ on-top functional ์๋ ๊ฐ๋ฐ์ ๊ฐ๋ฅํ๊ฒ ํ๋ค. ๋ฐ์ดํฐ์
๊ตฌ์ถ, active-space ์์ฑ, MCSCF ๊ณ์ฐ, descriptor ์์ฑ, loss-function ๊ตฌ์ฑ, functional fitting ๋ฐ ํ๊ฐ๋ฅผ ํตํฉํ๋ end-to-end ์๋ํ ์ํฌํ๋ก์ฐ๋ฅผ ์ ์ํ๋ค.
Motivation
- Known: MC-PDFT๋ strongly correlated ๋ถ์๊ณ์ electronic energy ๊ณ์ฐ์ ์ํด multiconfigurational reference wave function์ on-top pair-density functional๊ณผ ๊ฒฐํฉํ์ฌ ์ ํ์ฑ๊ณผ ๊ณ์ฐ ํจ์จ์ ๊ท ํ์ ์ ๊ณตํ๋ ๋ฐฉ๋ฒ์ผ๋ก ์๋ ค์ ธ ์๋ค. ๊ธฐ์กด ์ฐ๊ตฌ์์ translated, hybrid, meta functional๋ค์ ๊ฐ์ ์ด ์ ํ๋ ํฅ์์ ๋ณด์์ผ๋, functional ๊ฐ๋ฐ์ ๋ฐ์ดํฐ ์ ๋ณ๋ถํฐ ๊ฒ์ฆ๊น์ง ์ฌ๋ฌ ๋จ๊ณ๋ฅผ ์์ฐ๋ฅด๋ ๋ณต์กํ ๊ณผํ์ ์ํฌํ๋ก์ฐ์๋ค.
- Gap: ๊ธฐ์กด on-top functional ๊ฐ๋ฐ ์ฐ๊ตฌ๋ parameter fitting์๋ง ์ด์ ์ ๋ง์ถ์์ผ๋, ์ค์ ๋ก๋ dataset ๊ตฌ์ฑ, multiconfigurational reference ๊ณ์ฐ, descriptor ์์ฑ, loss-function ์ค๊ณ, parameter ์ต์ ํ, ๊ฒ์ฆ ๋ฑ ์ฌ๋ฌ ๋จ๊ณ๊ฐ ์๋ก ์ฐ๊ฒฐ๋ tightly coupled workflow์ด๋ค. ์ด๋ฌํ ํ์ดํ๋ผ์ธ์ ๊ฐ ๋จ๊ณ์์์ ์ ํ์ด ์ ์ฒด ๊ฒฐ๊ณผ์ ์ํฅ์ ๋ฏธ์น๋๋ฐ๋, ์๋ํ๋ end-to-end ํตํฉ ์ ๊ทผ๋ฒ์ด ๋ถ์ฌํ๋ค.
- Why: Functional ๊ฐ๋ฐ์ ๋๋ฉ์ธ ์ ๋ฌธ ์ง์๊ณผ ๋ณต์กํ computational workflow๋ฅผ ์๊ตฌํ๋ ๊ณ ๋น์ฉ ์์
์ด๋ค. LLM ๊ธฐ๋ฐ ์์ด์ ํธ ์์คํ
์ผ๋ก ์ด๋ฅผ ์๋ํํ๋ฉด, ์ธ์ ์ค๋ฅ๋ฅผ ๊ฐ์์ํค๊ณ , ๋ฐ๋ณต์ ์ธ ๊ณผ์ ์ ๊ฐ์ํํ๋ฉฐ, ๋ ๋์ functional ์ค๊ณ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ํ์ํ ์ ์๋ค. ๋ํ reproducibleํ๊ณ auditableํ functional ๊ฐ๋ฐ ๊ฒฝ๋ก๋ฅผ ์ ๊ณตํ์ฌ transferability์ interpretability๋ฅผ ํฅ์์ํฌ ์ ์๋ค.
- Approach: FunctionalAgent๋ 3๋จ๊ณ ๊ณ์ธต ์ํคํ
์ฒ๋ฅผ ๊ตฌ์ฑํ๋ค: (1) ์์ ๋ ๋ฒจ์์ ์ธ๊ฐ ์ฐ๊ตฌ์๊ฐ dataset objectives, functional form, evaluation criteria๋ฅผ ์ง์ ; (2) ์ค๊ฐ ๋ ๋ฒจ์ master agent๊ฐ optimization workflow๋ฅผ ์กฐ์จํ๊ณ specialized sub-agents๋ฅผ ๊ด๋ฆฌ; (3) ํ์ ๋ ๋ฒจ์ 4๊ฐ scientific sub-agents (Dataset Discovery Agent, Active-Space Input Agent, MCSCF computational agent, Functional Optimization Agent)๊ฐ constrained tool๊ณผ data space ๋ด์์ datasets ๊ตฌ์ฑ, computational workflows ์คํ, functional ์ต์ ํ๋ฅผ ์ํํ๋ค. Master agent๋ plan mode์์ ์์ธํ execution workflow์ ์ ์ํ๊ณ ์ธ๊ฐ ์ ๋ฌธ๊ฐ์ ๊ฒํ ยท์น์ธ์ ๊ฑฐ์น ํ ์คํํ๋ค.
Achievement
Figure 2. LLM-assisted workflow for constructing and refining quantum-chemical benchmark datasets. a,
- MC26 functional: MCDDB26 dataset์ ๊ธฐ๋ฐํ MC25์ ๋์ผํ analytical form์ on-top functional๋ก, training set์์ mean unsigned error๋ฅผ ๊ฐ์์ํค๊ณ test set์์ generalization ๊ฐ์ ๋ฌ์ฑ
- COF26 functional: ์๋ก์ด analytical form์ ๊ฐ์ถ functional๋ก, training set๊ณผ test set ๋ชจ๋์์ ์ต๊ณ ์ ์ฑ๋ฅ ๋ฌ์ฑํ๋ฉฐ chemically challenging systems์ ๋ํด diagnostic metrics ์ ๋ฐ์ ๊ฑธ์น ๊ท ํ์กํ ์ฑ๋ฅ ์คํ
- MCDDB26 dataset: Bond dissociation energies, reaction barriers, electron affinities, ionization potentials, tautomerization energies ๋ฑ์ ํฌํจํ๋ ๋ค์ํ๊ณ ๋ํ์ฑ ์๋ multireference wave functions์ descriptors์ dataset ๊ตฌ์ฑ
How
Figure 2. LLM-assisted workflow for constructing and refining quantum-chemical benchmark datasets. a,
- Dataset Discovery Agent๊ฐ ์๋์ผ๋ก ๋ฌธํ, supplementary information, ๊ธฐ์กด ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์
์์ ๋ฐ์ดํฐ ๊ฒ์, ์ถ์ถ, ์ ๋ฆฌํ์ฌ filtering, cleaning, standardization ์ํ
- Active-Space Input Agent๊ฐ standardized data entries๋ก๋ถํฐ active-space definition ์์ฑ ๋ฐ quantum-chemical input files ๊ตฌ์ฑ
- Sub-agents ๊ฐ ํ์ผ ๋ฒ์ค๋ฅผ ํตํ detailed computational files ์กฐ์จ๋ก intermediate artifacts ๋ช
์์ ์ ๋ฌ
- Functional Optimization Agent๊ฐ supervised, performance-triggered iterative optimization ์คํํ์ฌ loss-function๊ณผ functional form ์ต์ ํ
- Master agent์ plan mode๋ฅผ ํตํ ์ธ๊ฐ ์ ๋ฌธ๊ฐ ๊ฒํ ยท์น์ธ ๋จ๊ณ ํฌํจ์ผ๋ก execution accuracy์ reliability ๊ทน๋ํ
Originality
- LLM ๊ธฐ๋ฐ ์์ด์ ํธ ์์คํ
์ quantum chemistry์ functional ๊ฐ๋ฐ์ ์ฒ์ ์ ์ฉํ์ฌ ์๋ํ๋ end-to-end workflow ๊ตฌํ
- Dataset ๊ตฌ์ฑ๋ถํฐ functional ํ๊ฐ๊น์ง์ ๋ชจ๋ ๋จ๊ณ๋ฅผ ํตํฉํ๋ closed-loop framework ์ ์
- Harness-based constrained agent design์ผ๋ก ๊ฐ sub-agent์ operational scope๋ฅผ ์ ํํ์ฌ controllability์ precision ํฅ์
- ์๋ก์ด COF26 functional form์ ์ค๊ณ๋ก ๋ค์ค ๋ชฉ์ ์ต์ ํ๋ฅผ ํตํ ์ฑ๋ฅ ๊ท ํ ๋ฌ์ฑ
Limitation & Further Study
- ๋
ผ๋ฌธ ๋ฐ์ท ๋ถ๋ถ์์ computational cost ์ ๊ฐ ํจ๊ณผ๋ ์ ๋์ ์ธ efficiency gain์ ๋ํ ๊ตฌ์ฒด์ ๋ฐ์ดํฐ ๋ถ์ฌ
- Functional generalization ์ฑ๋ฅ์ด test set์์ ์ด๋ ์ ๋ ํฅ์๋์๋์ง์ ๋ํ ์์ธ ์์น๊ฐ ์ ์๋์ง ์์
- LLM agent์ ์ค๋ฅ ๊ฐ๋ฅ์ฑ์ด๋ hallucination์ ๋ํ ์์ ์ฅ์น์ ๋ํ ๋
ผ์ ๋ถ์กฑ
- MC26๊ณผ COF26์ด ๋ค๋ฅธ strongly correlated ์์คํ
์ด๋ broader chemical problem์ ๋ํด ์ด๋ป๊ฒ ์ผ๋ฐํ๋๋์ง์ ๋ํ ํ๊ฐ ๋ฏธํก
ํ์์ฐ๊ตฌ: (1) Larger scale์ ํํ ์๋์ง ๋ฐ์ดํฐ์
์์์ ์ฑ๋ฅ ๊ฒ์ฆ; (2) Functional generalization๊ณผ transferability์ ๋ ๊น์ ๋ถ์; (3) LLM agent์ decision-making process ํด์์ฑ ํฅ์; (4) ๋ค๋ฅธ quantum chemistry methods (์: Post-Hartree-Fock, DFT)์์ ์ ์ฉ ํ๋
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์์ด์ ํธ ์์คํ
์ ์์ํํ์ functional ๊ฐ๋ฐ ์๋ํ์ ํ์ ์ ์ผ๋ก ์ ์ฉํ์ฌ, end-to-end closed-loop workflow๋ฅผ ํตํด MC26๊ณผ COF26์ด๋ผ๋ ๊ฐ์ ๋ on-top functionals์ ์ฑ๊ณต์ ์ผ๋ก ๊ฐ๋ฐํ๋ค. ๊ณ์ธต์ ์ํคํ
์ฒ์ constrained agent design์ผ๋ก controllability๋ฅผ ํ๋ณดํ๋ฉด์๋ ๋ณต์กํ scientific workflow๋ฅผ ์๋ํํ ์ ์ด ๋์ด ํ๊ฐ๋๋, ์ ๋์ ํจ์จ ์ฑ๊ณผ์ ๊ด๋ฒ์ํ ์ผ๋ฐํ ์ฑ๋ฅ์ ๋ํ ๋ ์์ธํ ๊ฒ์ฆ์ด ์๊ตฌ๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
308๋ฒ ๋
ผ๋ฌธ์ ์์ํํ ์คํ ์๋ํ๋ฅผ ์ํ LLM ๊ธฐ๋ฐ ์์ด์ ํธ ํ๋ ์์ํฌ๋ฅผ ๋ค๋ฃจ์ด, 3110์ on-top ํจ์ ์ค๊ณ ์๋ํ์ ๊ทผ๊ฑฐ ๋ฐ ์คํ ๊ฐ๋ฅ์ฑ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
PhyNiKCE๋ ๋ด๋ก์ฌ๋ณผ๋ฆญ AI๋ฅผ ํตํ ๊ณผํ์ ํจ์ ์ค๊ณ ์์ด์ ํธ ํ๋ ์์ํฌ๋ก, 3110์ LLM ๊ธฐ๋ฐ ์๋ ์ค๊ณ์ ๋ฌธ์ ์ค์ ์ด ์ ์ฌํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
Density Functional์ ์๋ ์ค๊ณ ์ ๋ต์ LLM ๊ธฐ๋ฐ ์์คํ
์ผ๋ก ๊ตฌํํ๋ ๋น์ทํ but slightly different agentic ์ ๊ทผ ์ฌ๋ก์
๋๋ค.
ํ์ ์ฐ๊ตฌ
2199๋ฒ ๋
ผ๋ฌธ์ ๊ณผํ์ AI agent์ ์ด๋ก ๊ณผ ์ค์ ๊ตฌํ ์ฌ๋ก๋ฅผ ๊ฐ๊ดํ์ฌ, 3110์ end-to-end ์๋ํ ์ํฌํ๋ก์ฐ์ ์ ํต์ ๊ฐ์น์ ํฅํ ๋ฐ์ ๋ฐฉํฅ์ ๋
ผ์ํ ์ ์์ต๋๋ค.
์์ฉ ์ฌ๋ก
๋จธ์ ๋ฌ๋ ์ํธ์์ฉ ํผํ
์
์ ํ๋ผ๋ฏธํฐ ํจ์จ์ ๋ฏธ์ธ์กฐ์ ์ฐ๊ตฌ๋ก, FunctionalAgent์ ์ํฌํ๋ก์ฐ๊ฐ ML ํผํ
์
์ ๋ขฐ์ฑ ๊ฐ์ ์ ์ค์ ์ ์ฉ๋ ์ ์์์ ๋ณด์ฌ์ค๋๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์