Hacker NewsFP16 수준 정밀도 유지 및 KV-cache 용량 3~5배 확장 달성KVarN: Native vLLM KV-cache quantization back end by HuaweiAI/MLadvanced9 분 소요2026년 6월 4일