Hugging Face BlogHuggingFace가 SmolLM3 3B 모델의 아키텍처와 11.2T 토큰 학습 레시피를 공개해 Llama-3.2-3B, Qwen2.5-3B 대비 성능 우위 달성SmolLM3: smol, multilingual, long-context reasonerAI/MLintermediate44 분 소요2025년 7월 8일
Hugging Face BlogHugging Face가 Lower Precision, Flash Attention, 아키텍처 혁신(Alibi, Rotary embeddings, MQA, GQA)을 조합해 LLM 프로덕션 배포 시 VRAM 요구량 및 추론 지연 감소Optimizing your LLM in productionBackendintermediate94 분 소요2023년 9월 15일