Dev.toGemma 4 MoE + N-Gram 도입으로 TTFT 2.5배 개선 및 47.5만 TPS 달성Gemma4 Speculative Decoding with n-gramAI/MLadvanced6 분 소요6시간 전
Dev.tobfloat16 도입을 통한 64K Context 처리 및 0.5M TPS 달성Is Brain Float (bf16) Worth it?AI/MLadvanced23 분 소요2일 전
Dev.toTPU v6e 기반 Gemma-4-26B 최대 처리량 457k TPS 달성 및 임계점 분석Gemma-4-26B on v6e-4 TPU BenchmarksAI/MLadvanced14 분 소요6일 전