Dev.toGPU 활용 및 Prefill 최적화로 Gemma 4 추론 속도 최대 26배 개선Gemma 4 on Android: Tricks for Faster On-Device InferenceAI/MLintermediate25 분 소요2026년 5월 23일