피드로 돌아가기
Dev.toInfrastructure
원문 읽기
연간 비용 40% 절감, Bare Metal Kubernetes 전환으로 달성한 예측 가능한 인프라
We Moved a Production System from Azure VMs to Bare Metal Kubernetes in 3 Months
AI 요약
Context
수동 설정 기반의 Azure VM 환경으로 인한 구성 관리 부재. 부하 발생 시 DB Locking 및 특정 서버 자원 쏠림 현상 발생. 예측 불가능한 응답 지연과 시스템 중단이 반복되는 구조.
Technical Solution
- Bare Metal 서버 4대에 Kubernetes를 구축하여 하이퍼바이저 오버헤드 제거 및 하드웨어 성능 극대화
- Terraform과 Ansible을 통한 Infrastructure as Code 도입으로 환경 설정의 일관성 확보 및 수동 작업 배제
- Longhorn(Storage), Calico(Network), Traefik(Ingress) 기반의 표준화된 클라우드 네이티브 스택 구성
- 신규 MySQL 구축 후 기존 DB와 실시간 복제(Replication)를 설정하여 데이터 정합성 검증
- 읽기 트래픽부터 순차적으로 이전하는 카나리 방식의 데이터베이스 마이그레이션 전략 채택
- 쓰기 트래픽 전환 후 기존 DB를 일정 기간 유지하는 롤백 안전장치 마련
Impact
- 연간 인프라 유지 비용 약 40% 절감
Key Takeaway
워크로드의 패턴이 예측 가능하고 일관된 고성능이 필수적인 경우, 클라우드 추상화 계층을 제거한 Bare Metal 전환이 비용과 성능 면에서 효율적인 선택지임.
실천 포인트
트래픽 패턴이 일정하고 클라우드 오버헤드 비용이 인프라 직접 관리 비용보다 높을 때 Bare Metal 전환을 검토할 것