Dev.toH100 기준 1,100 TPS 달성한 Diffusion 기반 텍스트 생성 아키텍처DiffusionGemma: How Google's New Open LLM Hits 1,000 Tokens/sec and Changes Inference EconomicsAI/MLadvanced12 분 소요2026년 6월 12일