InfoQMTP 기반 Speculative Decoding으로 추론 속도 최대 3배 향상Gemma 4 Multi-Token Prediction Delivers Up to ~3x Faster Token GenerationAI/MLadvanced6 분 소요1일 전