Hugging Face BlogHugging Face Diffusers 팀이 Flash Attention 3, torch.compile, FP8 양자화를 조합해 Flux.1-Dev 모델의 LoRA 추론 속도를 2.23배 향상Fast LoRA inference for Flux with Diffusers and PEFTAI/MLintermediate24 분 소요2025년 7월 23일