Hugging Face BlogServiceNow가 15B 추론 모델을 Mamba 하이브리드로 변환해 2.1배 처리량 증가 달성Apriel-H1: The Surprising Key to Distilling Efficient Reasoning ModelsAI/MLadvanced23 분 소요2025년 11월 19일
Hugging Face BlogHugging Face가 Latent Consistency LoRA를 도입해 SDXL 이미지 생성 단계를 4단계로 축소하고 추론 시간을 M1 Mac에서 60초에서 6초로, 4090에서 7초에서 1초 미만으로 단축SDXL in 4 steps with Latent Consistency LoRAsAI/MLintermediate23 분 소요2023년 11월 9일