Hugging Face BlogIntel과 Qwen이 Depth-Pruned Draft Model과 Speculative Decoding을 결합해 Qwen3-8B 에이전트 추론 속도를 1.4배 향상Accelerating Qwen3-8B Agent on Intel® Core™ Ultra with Depth-Pruned Draft ModelsAI/MLintermediate13 분 소요2025년 9월 29일