#hadamard-transform 아티클 모음

InfoQ

KV Cache 3.5-bit 압축을 통한 VRAM 6배 절감 및 추론 효율화

Google’s TurboQuant Compression May Support Faster Inference, Same Accuracy on Less Capable Hardware

AI/MLadvanced10 분 소요2026년 4월 15일