피드로 돌아가기
Dev.toInfrastructure
원문 읽기
Cloud SKU와 K8s 리소스 간 불일치 해소를 통한 비용 최적화 전략
Reading a Kubernetes bill: what each line item actually means
AI 요약
Context
Cloud Provider의 비용 청구 단위인 SKU와 Kubernetes의 논리적 리소스 단위 간의 심각한 괴리로 인한 가시성 결여. 단순한 Right-sizing만으로는 해결 불가능한 구조적 비용 누수 지점 존재.
Technical Solution
- Compute 비용 최적화를 위한 Requests 기반의 실제 사용량 분석 및 Fragmented Node Pool의 유휴 자원 제거
- PersistentVolume의 Retain 정책 변경 및 Snapshot 보존 주기 설정을 통한 Storage Accretion 방지
- Cross-AZ 통신 최소화를 통한 Network Egress 비용 절감 및 Ingress Controller 통합으로 LoadBalancer 개수 최적화
- NAT Gateway를 통한 데이터 전송 비용 중복 발생 지점 식별 및 아키텍처 개선
- Cloud SKU 데이터를 Namespace, Workload, Team 단위로 매핑하는 Attribution 체계 구축
- 전체 비용의 60%를 차지하는 상위 15% 고비용 워크로드 식별을 통한 타겟팅 최적화
실천 포인트
- [ ] Pod의 Requests가 실제 사용량 대비 과도하게 설정되어 Node 유휴 자원을 유발하는지 검토 - [ ] PV Reclaim Policy가 Retain으로 설정되어 삭제되지 않은 Orphaned Volume이 존재하는지 확인 - [ ] 서비스 간 통신 시 Cross-AZ Hop 발생 빈도를 분석하여 Topology Aware Routing 검토 - [ ] 개별 LoadBalancer 서비스 대신 Ingress Controller를 통한 트래픽 통합 관리 적용 - [ ] NAT Gateway 통과 트래픽의 양과 비용을 분석하여 VPC Endpoint 도입 검토