The RegisterKV 캐시 6배 압축, Google TurboQuant의 고효율 추론 전략Google's TurboQuant saves memory, but won't save us from DRAM-pricing hellAI/MLadvanced10 분 소요2026년 4월 1일
Hacker NewsApple Silicon 최적화로 122B MoE 모델을 MacBook에서 구현한 SwiftLMTurboQuant KV Compression and SSD Expert Streaming for M5 Pro and IOSAI/MLadvanced15 분 소요2026년 4월 1일