Hugging Face BlogNVIDIA가 KVPress 툴킷으로 KV Cache 압축 기법을 제공해 1M 토큰 처리 시 메모리 사용량 327.6GB에서 유의미한 수준으로 감소Mastering Long Contexts in LLMs with KVPressAI/MLintermediate18 분 소요2025년 1월 23일