Container 중심에서 Pod 단위로 전환된 K8s 1.36 리소스 최적화 모델

Kubernetes 1.36 Pod-Level Resource Managers: Advanced Resource Optimization in Production

Matthias Bruns2026년 5월 20일6분advanced

AI 요약

Context

개별 Container 단위의 Resource Request/Limit 설정으로 인한 복잡한 리소스 분배 구조 및 오버프로비저닝 문제 발생. 특히 Sidecar 패턴 적용 시 메인 앱과 보조 컨테이너 간의 동적 리소스 공유가 불가능한 아키텍처적 한계 노출.

Technical Solution

Kubelet의 Topology, CPU, Memory Manager를 Pod-level specification(.spec.resources)으로 확장하여 Pod 중심 할당 모델 구현
Container별 개별 설정 없이 Pod 전체의 CPU, Memory, Hugepages 통합 관리를 통한 구성 복잡도 제거
Pod-level limit를 우선 적용하는 우선순위 제어 로직을 통한 유연한 리소스 경계 설정
In-place Vertical Scaling Beta 도입으로 Pod 재시작 없는 실시간 리소스 조정 메커니즘 적용
Topology Manager 통합을 통한 NUMA-aware 워크로드의 Node Affinity 최적화 및 메모리 접근 지연 시간 단축

실천 포인트

- Sidecar 컨테이너가 많은 마이크로서비스 구조에서 Pod-level resource 관리 도입 검토 - NUMA 최적화가 필요한 고성능 워크로드의 경우 Topology Manager 설정과 Pod-level 사양 결합 확인 - Alpha 단계 기능을 Non-production 환경에서 먼저 검증하여 API 변경 사항에 따른 영향도 평가 - In-place Vertical Scaling을 통한 서비스 무중단 리소스 최적화 파이프라인 설계

태그

#ResourceManagement #VerticalScaling #Kubernetes #NUMA #Kubelet

원문 읽기