The RegisterFP4 양자화 및 하이브리드 Attention 기반 추론 비용 극대화DeepSeek's new models are so efficient they'll run on a toaster ... by which we mean Huawei's NPUsAI/MLadvanced13 분 소요3일 전