Hacker News128GB Unified Memory 기반 로컬 AI 에이전트 최적화 하드웨어 설계Nvidia RTX SparkAI/MLintermediate5 분 소요2026년 6월 1일
The RegisterFP4 양자화 및 하이브리드 Attention 기반 추론 비용 극대화DeepSeek's new models are so efficient they'll run on a toaster ... by which we mean Huawei's NPUsAI/MLadvanced13 분 소요2026년 4월 24일