Hugging Face BlogServiceNow가 15B 추론 모델을 Mamba 하이브리드로 변환해 2.1배 처리량 증가 달성Apriel-H1: The Surprising Key to Distilling Efficient Reasoning ModelsAI/MLadvanced23 분 소요2025년 11월 19일