Hugging Face BlogNeMo AutoModel 도입으로 MoE 학습 처리량 3.7배 향상 및 메모리 32% 절감Accelerating Transformers Fine-Tuning with NVIDIA NeMo AutoModelAI/MLadvanced28 분 소요2026년 6월 24일
Dev.toMoE 구조를 통한 70B급 성능의 14B급 연산 비용 달성Mixture of Experts (MoE): what it actually does under the hood, and when it pays offAI/MLadvanced27 분 소요2026년 6월 13일