전체 피드 소스 목록

카테고리

Frontend Backend DevOps AI/ML Mobile Database Security Career Infrastructure

© 2026 DevPick

#smoothquant

피드 검색 북마크 설정

Hugging Face Blog

Intel과 Hugging Face가 SmoothQuant 양자화 기법으로 LLM을 INT8로 압축해 Xeon CPU에서 실시간 텍스트 생성 달성

Smaller is better: Q8-Chat, an efficient generative AI experience on Xeon

AI/MLintermediate15 분 소요2023년 5월 16일