GeekNewsGLM-5 대규모 서비스 중 발견한 레이스 컨디션 버그 수정기 — Coding Agent 추론 인프라의 Scaling PainKV Cache 레이스 컨디션 해결 및 LayerSplit 통한 처리량 최대 132% 개선AI/MLadvanced6 분 소요2026년 4월 30일