GeekNews기존 KV 압축 기법 대비 최대 25% 추가 절감, 성능은 오히려 개선 — CASKRole-based KV Cache 구조 설계를 통한 메모리 25% 추가 절감 및 추론 성능 향상AI/MLadvanced2 분 소요2일 전