GeekNewsGemma 4를 Codex CLI에서 로컬 모델로 실행하기H100 2장 기반 Gemma4-31B 도입을 통한 추론 효율 최적화AI/MLintermediate1 분 소요2026년 4월 14일
Dev.to70B 모델 1M 토큰 컨텍스트, 단일 H100 GPU 구현 전략Running 1M-token context on a single GPU (the math)AI/MLadvanced5 분 소요2026년 4월 7일
Hugging Face BlogHugging Face가 FriendliAI의 추론 인프라를 Hub에 통합해 모델 배포 시 NVIDIA H100 GPU에서 1-클릭 배포 지원Hugging Face and FriendliAI partner to supercharge model deployment on the HubBackendintermediate9 분 소요2025년 1월 22일