피드로 돌아가기
Dev.toInfrastructure
원문 읽기
K8s 1.32: API 요청 처리량 42% 향상 및 Watch Cache 최적화
Architecture Teardown: Kubernetes 1.32 Control Plane Internals and Performance Optimizations
AI 요약
Context
기존 Kubernetes Control Plane은 Admission Webhook의 지연이 전체 API 트래픽의 Throttling으로 이어지는 구조적 결함 존재. 특히 고규모 클러스터에서 Pod 및 Event와 같은 High-churn 리소스의 Lock Contention으로 인한 p99 Latency 증가 문제 발생.
Technical Solution
- Webhook Call 전용 Priority Queue 도입을 통한 일반 API 요청 흐름과 Webhook 처리 경로의 완전한 Decoupling 설계
- Resource Type별 Sharded Watch Cache 적용으로 Namespace 단위 격리를 통한 Lock Contention 제거
- Aggregated Discovery Endpoint 도입으로 Kubelet Startup 시 발생하는 API Server 부하 감소 및 구동 시간 단축
- etcd v3.5.9 클라이언트를 1.32 전용 gRPC Proxy로 교체하여 Storage Cost 및 통신 효율 최적화
- Kubelet 버전 간 Feature Negotiation 메커니즘을 통한 1.30+ 버전과의 하위 호환성 유지 및 무중단 업그레이드 구현
실천 포인트
1. Webhook 지연으로 인한 API Server 성능 저하 여부 확인 후 v
1.32 전용 Priority Queue 검토
2. 고빈도 변경 리소스가 많은 환경에서 Watch Cache Sharding 설정 적용 및 p99 Latency 측정
3. Kubelet v
1.31 이상 업그레이드를 통한 Aggregated Discovery Endpoint 활성화 여부 체크