Dev.toPure CPU 환경에서 io_uring 기반으로 Mixtral 8x7B 21.38 TPS 달성Running Mixtral 8x7B at 21+ TPS on Pure CPU via io_uring and Predictive CachingAI/MLadvanced7 분 소요2026년 6월 4일
Dev.to모델 압축과 Predictive Caching을 통한 오프라인 AI 튜터 구현 및 학습 세션 275% 증대Building an AI Tutor That Works Without Internet: Lessons from Rural EthiopiaAI/MLintermediate10 분 소요2026년 4월 21일