K8s 1.32: API 요청 처리량 42% 향상 및 Watch Cache 최적화

Architecture Teardown: Kubernetes 1.32 Control Plane Internals and Performance Optimizations

ANKUSH CHOUDHARY JOHAL2026년 4월 28일18분advanced

AI 요약

Context

기존 Kubernetes Control Plane은 Admission Webhook의 지연이 전체 API 트래픽의 Throttling으로 이어지는 구조적 결함 존재. 특히 고규모 클러스터에서 Pod 및 Event와 같은 High-churn 리소스의 Lock Contention으로 인한 p99 Latency 증가 문제 발생.

Technical Solution

Webhook Call 전용 Priority Queue 도입을 통한 일반 API 요청 흐름과 Webhook 처리 경로의 완전한 Decoupling 설계
Resource Type별 Sharded Watch Cache 적용으로 Namespace 단위 격리를 통한 Lock Contention 제거
Aggregated Discovery Endpoint 도입으로 Kubelet Startup 시 발생하는 API Server 부하 감소 및 구동 시간 단축
etcd v3.5.9 클라이언트를 1.32 전용 gRPC Proxy로 교체하여 Storage Cost 및 통신 효율 최적화
Kubelet 버전 간 Feature Negotiation 메커니즘을 통한 1.30+ 버전과의 하위 호환성 유지 및 무중단 업그레이드 구현

실천 포인트

1. Webhook 지연으로 인한 API Server 성능 저하 여부 확인 후 v

1.32 전용 Priority Queue 검토

2. 고빈도 변경 리소스가 많은 환경에서 Watch Cache Sharding 설정 적용 및 p99 Latency 측정

3. Kubelet v

1.31 이상 업그레이드를 통한 Aggregated Discovery Endpoint 활성화 여부 체크

태그

#Admission Webhook #Watch Cache #gRPC #Kubernetes #Control Plane

원문 읽기