Dev.toH100 기준 1,100 TPS 달성한 Diffusion 기반 텍스트 생성 아키텍처DiffusionGemma: How Google's New Open LLM Hits 1,000 Tokens/sec and Changes Inference EconomicsAI/MLadvanced12 분 소요2026년 6월 12일
GeekNewsDiffusionGemma: 4배 빠른 텍스트 생성256토큰 병렬 생성 기반 DiffusionGemma로 추론 속도 4배 향상AI/MLadvanced20 분 소요2026년 6월 11일