피드로 돌아가기
AWS News Blog
Infrastructure

20초 고해상도 메트릭 도입으로 Scale-out 속도 4.2배 개선

Amazon ECS introduces new high-resolution metrics for faster service auto scaling

Channy Yun (윤석찬)2026년 6월 18일3intermediate

Context

기존 ECS Auto Scaling은 60초 단위의 표준 해상도 메트릭에 의존하여 급격한 트래픽 서지에 대응하는 속도가 느린 한계 존재. 이로 인해 서비스 가용성 확보를 위해 불필요한 Baseline Task를 상시 유지하는 Capacity Padding 비용 발생.

Technical Solution

  • 메트릭 수집 주기를 60초에서 20초로 단축한 High-resolution Metrics 도입
  • Target Tracking 정책에 고해상도 메트릭을 결합하여 평가 주기 최적화
  • Custom Step-scaling 설정 없이도 공격적인 스케일링 동작을 구현하는 구조 설계
  • Fargate 및 EC2 등 모든 ECS 컴퓨트 옵션에 범용적으로 적용 가능한 인터페이스 제공
  • CloudWatch 메트릭 발행 최적화를 통한 데이터 업데이트 지연 시간 최소화

Impact

  • Scale-out 트리거 소요 시간: 363초에서 86초로 단축 (76% 개선, 4.2x)
  • 신규 Task 프로비저닝 포함 총 소요 시간: 386초에서 109초로 단축 (72% 개선, 3.5x)

Key Takeaway

시스템의 반응 속도는 단순히 프로비저닝 성능이 아닌, 상태를 감지하는 관측 지표의 해상도(Resolution)에 의해 결정됨을 입증한 사례.


1. 급격한 트래픽 변동이 잦은 서비스에서 Target Tracking 정책의 메트릭 해상도 검토

2. 과도한 Capacity Padding으로 인한 비용 낭비 여부 확인 및 고해상도 메트릭 전환 고려

3. High-resolution Metrics 도입 시 발생하는 추가 CloudWatch 비용과 인프라 비용 절감액 간의 Trade-off 분석

원문 읽기