Dev.to70B 모델 1M 토큰 컨텍스트, 단일 H100 GPU 구현 전략Running 1M-token context on a single GPU (the math)AI/MLadvanced5 분 소요1일 전
Hugging Face BlogHugging Face가 FriendliAI의 추론 인프라를 Hub에 통합해 모델 배포 시 NVIDIA H100 GPU에서 1-클릭 배포 지원Hugging Face and FriendliAI partner to supercharge model deployment on the HubBackendintermediate9 분 소요2025년 1월 22일