피드로 돌아가기
Kubernetes BlogKubernetes Blog
DevOps

Kubernetes 운영자들이 리소스 요청/제한, 헬스 프로브, 중앙화된 로깅, 네트워크 정책, 이미지 버전 고정 등 7가지 설정 누락으로 인한 장애를 피하는 실천 가이드

7 Common Kubernetes Pitfalls (and How I Learned to Avoid Them)

2025년 10월 20일12intermediate

Context

Kubernetes는 리소스 요청/제한, 헬스 프로브, 보안 정책 등의 명시적 설정을 강제하지 않아, 개발 단계에서는 문제가 드러나지 않으나 프로덕션 환경에서 Pod 스케줄링 실패, 컨테이너 강제 종료, 보안 침해 등 치명적 장애가 발생한다. kubectl logs는 노드 로컬 디스크에만 저장되어 컨테이너 삭제 시 로그가 영구적으로 손실되며, 명시적 네트워크 정책이 없으면 의도하지 않은 Pod 간 통신이 허용된다.


Kubernetes 프로덕션 클러스터를 운영하는 팀은 Pod 스펙에 CPU/메모리 요청·제한을 필수로 설정하고, livenessProbe와 readinessProbe를 포함하며, Fluentd/Fluent Bit으로 중앙화된 로깅을 구성하고, NetworkPolicy로 기본 트래픽 차단 정책을 적용하고, 이미지를 버전으로 고정하면 스케줄링 실패, 행(hang) 상태 미감지, 로그 손실, 의도하지 않은 통신 및 보안 침해 등 7가지 주요 장애 유형을 사전에 차단할 수 있다.

원문 읽기