피드로 돌아가기
How to right-size RDS instances without downtime
Dev.toDev.to
Database

Blue/Green Deployment를 통한 RDS 가용성 확보 및 60초 이내 Cutover 달성

How to right-size RDS instances without downtime

Muskan2026년 7월 1일3intermediate

Context

RDS Instance Class 변경 시 EBS Volume 마이그레이션과 프로세스 재시작으로 인한 5~15분간의 서비스 중단 발생. 사용자 대면 서비스에서 허용 불가능한 다운타임을 제거하기 위한 무중단 Right-sizing 전략 분석.

Technical Solution

  • Logical Replication 기반의 Green Instance를 생성하여 데이터 동기화 및 상태 검증 수행
  • Switchover 메커니즘을 통한 Endpoint 유지 및 60초 미만의 빠른 Cutover 구현
  • Legacy 엔진 및 Cross-region 환경 대응을 위한 Read-replica Promotion 전략 채택
  • Endpoint 변경 불가능한 제약 사항 해결을 위한 Multi-AZ Failover 기반의 Standby Resize 설계
  • CPU Utilization 및 FreeableMemory 기반 CloudWatch Anomaly Detection을 통한 선제적 리소스 최적화

1. 엔진 버전 및 KMS 암호화 지원 여부에 따른 Blue/Green 사용 가능성 검토

2. DB Load vCPU 80% 초과 시 Underprovisioned, 20% 미만 시 Overprovisioned 판단

3. Graviton 기반 인스턴스(m7g, r7g) 전환을 통한 비용 효율성 검증

4. Application 레벨의 Transient Connection Error 처리 로직 구현 확인

원문 읽기