피드로 돌아가기
Architecture Teardown: Kubernetes 1.32 Control Plane Internals and Performance Optimizations
Dev.toDev.to
Infrastructure

K8s 1.32: API 요청 처리량 42% 향상 및 Watch Cache 최적화

Architecture Teardown: Kubernetes 1.32 Control Plane Internals and Performance Optimizations

ANKUSH CHOUDHARY JOHAL2026년 4월 28일18advanced

Context

기존 Kubernetes Control Plane은 Admission Webhook의 지연이 전체 API 트래픽의 Throttling으로 이어지는 구조적 결함 존재. 특히 고규모 클러스터에서 Pod 및 Event와 같은 High-churn 리소스의 Lock Contention으로 인한 p99 Latency 증가 문제 발생.

Technical Solution

  • Webhook Call 전용 Priority Queue 도입을 통한 일반 API 요청 흐름과 Webhook 처리 경로의 완전한 Decoupling 설계
  • Resource Type별 Sharded Watch Cache 적용으로 Namespace 단위 격리를 통한 Lock Contention 제거
  • Aggregated Discovery Endpoint 도입으로 Kubelet Startup 시 발생하는 API Server 부하 감소 및 구동 시간 단축
  • etcd v3.5.9 클라이언트를 1.32 전용 gRPC Proxy로 교체하여 Storage Cost 및 통신 효율 최적화
  • Kubelet 버전 간 Feature Negotiation 메커니즘을 통한 1.30+ 버전과의 하위 호환성 유지 및 무중단 업그레이드 구현

1. Webhook 지연으로 인한 API Server 성능 저하 여부 확인 후 v

1.32 전용 Priority Queue 검토

2. 고빈도 변경 리소스가 많은 환경에서 Watch Cache Sharding 설정 적용 및 p99 Latency 측정

3. Kubelet v

1.31 이상 업그레이드를 통한 Aggregated Discovery Endpoint 활성화 여부 체크

원문 읽기