Automl in the age of large language models: Current challenges, future opportunities and risks

Motivation

Known: AutoML은 ML 파이프라인 자동화를 통해 민주화를 달성했으며, LLM은 NLP 분야에서 획기적 성과를 이뤘다. 각 분야는 독립적으로 remarkable 진전을 이루었다.
Gap: 현재 AutoML 방법론은 LLM의 전체 생명주기(사전학습, 미세조정, 추론)를 holistic하게 최적화하기 위해 설계되지 않았으며, 반대로 LLM의 강력한 NLP 능력이 AutoML 도구 자체를 개선하는 데 충분히 활용되지 않고 있다.
Why: LLM의 사전학습은 극도로 비용이 높고, 다단계 훈련 프로세스는 서로 다른 학습 패러다임(자기지도학습, 지도학습, 강화학습)을 필요로 하며, 각 단계가 다른 평가 지표를 사용한다. 동시에 LLM의 자연언어 처리 및 meta-learning 능력은 AutoML 도구의 인터페이스와 내부 컴포넌트를 혁신할 수 있다.
Approach: AutoML for LLM(제2장), LLM for AutoML(제3장), 그리고 위험 평가(제4장)라는 세 가지 관점에서 상생 관계를 체계적으로 조사한다.

LLM 생명주기 전체에 걸친 AutoML 적용의 도전과제와 최적화 대상

AutoML for LLM의 주요 도전과제 규정:
- 사전학습의 극도의 계산 비용으로 인한 제한된 학습 실행
- 다단계 훈련 프로세스에서 joint optimization의 불가능성
- Neural Architecture Search(NAS) 성숙도 부족
- 단계별 다른 평가 지표의 노이즈와 편향 문제
- 다양한 학습 패러다임 동시 고려의 어려움
LLM for AutoML의 기회 제시:
- 자연언어를 통한 Human-Machine Interaction (HMI) 개선
- AutoML 시스템 설정의 자동화 및 설명 가능성 강화
- Meta-learning을 통한 AutoML 컴포넌트 개선
- 비정형 텍스트 데이터로부터의 AutoML 지식 추출
통합의 잠재적 위험 분류:
- LLM hallucination으로 인한 catastrophic failures
- AutoML 결과에 대한 과도한 신뢰
- 평가 방법론 부족
- 계산 자원 수요의 지수적 증가

각 LLM 생명주기 단계별 AutoML 적용 방식

사전학습 최적화: Transfer learning 활용, 데이터 선택(data selection), 토크나이제이션(tokenization) 최적화, 네트워크 아키텍처 설계
미세조정 최적화: Hyperparameter Optimization (HPO)를 통한 학습률, 배치 크기, 옵티마이저 선택; Adapter 기반 파라미터 효율적 미세조정(Parameter-Efficient Fine-Tuning, PEFT)
Alignment 최적화: Reinforcement Learning from Human Feedback (RLHF)의 Reward Model(RM)과 Policy 최적화
추론 최적화: 온도(temperature), Top-K 샘플링, 가지치기(pruning), 혼합정밀도(mixed precision) 등의 설정 자동화

Human-Machine Interaction 강화: 자연언어 프롬프트를 통한 직관적 시스템 상호작용, 결과 설명의 자동 생성
Configuration Assistance: 사용자의 도메인 지식 없이도 AutoML 도구의 복잡한 설정을 자동으로 수행
Meta-learning Component: 웹의 비정형 텍스트에 포함된 AutoML 관련 지식을 추출하여 모델 선택 및 하이퍼파라미터 추천에 활용
AutoML Components 대체: 특정 AutoML 서브컴포넌트를 LLM 기반 솔루션으로 대체

현재 한계:
- 제시된 많은 기회(opportunities)는 개념적 수준이며, 실제 구현과 평가 사례가 제한적
- AutoML for LLM의 실행 가능성이 현재 기술로는 낮은 이유에 대한 깊이 있는 분석 부족
- LLM hallucination 방지 메커니즘의 구체적 기술 솔루션 제시 부족
- Multi-modal LLM으로의 확장 논의가 제한적
후속 연구 방향:
- AutoML for LLM의 실제 프로토타입 구현 및 벤치마킹 연구 필요
- LLM 기반 AutoML 컴포넌트의 신뢰성 및 안정성 평가 체계 개발
- 사전학습 비용 문제를 해결하기 위한 경량 surrogate 모델 연구
- AutoML과 LLM 통합의 환경 영향(computational footprint) 평가