Dev.toKV Cache 압축을 통한 70B 모델의 8GB RAM 구동 실현KVQuant: Run 70B LLMs on 8GB RAM with Real-Time KV Cache CompressionAI/MLadvanced2 분 소요2026년 4월 30일
Dev.to100KB 미만 MCU 대상 AHC 기반 Adaptive Compression 구현From Smart Chips to AI Teaching Grants—EU Act Risk, MCU Compression, and Brain Tumor EquityAI/MLadvanced6 분 소요2026년 4월 14일