Hugging Face Blogllama.cpp가 라우터 모드를 추가해 재시작 없이 여러 모델을 동적으로 로드·언로드·전환 가능New in llama.cpp: Model ManagementBackendintermediate6 분 소요2025년 12월 11일
Hugging Face BlogHugging Face TGI가 Multi-LoRA 서빙 기능으로 단일 배포에서 30개 모델을 동시 제공 가능하게 함TGI Multi-LoRA: Deploy Once, Serve 30 ModelsAI/MLintermediate30 분 소요2024년 7월 18일