피드로 돌아가기
EBS gp2 burst credits ran dry and our builds slowed to a crawl
Dev.toDev.to
Infrastructure

gp3 전환을 통한 EBS Burst Credit 고갈 해결 및 p95 빌드 시간 55% 단축

EBS gp2 burst credits ran dry and our builds slowed to a crawl

claire nguyen2026년 6월 23일4intermediate

Context

EC2 기반 Build Agent 환경에서 특정 시점마다 빌드 속도가 급격히 저하되는 현상 발생. 100GB gp2 볼륨의 Baseline IOPS(300) 초과 사용으로 인한 Burst Credit 고갈이 성능 저하의 핵심 원인으로 판명.

Technical Solution

  • Burst Credit 기반의 gp2에서 고정 성능을 제공하는 gp3 볼륨으로 전환하여 I/O 성능의 예측 가능성 확보
  • 볼륨 크기와 무관하게 기본 제공되는 3,000 IOPS Baseline을 활용해 npm 등 작은 파일의 빈번한 Write 작업 병목 해결
  • AWS CLI의 modify-volume 명령어를 통한 무중단 볼륨 타입 변경으로 인프라 가용성 유지
  • Launch Template 수정을 통해 신규 프로비저닝되는 모든 Agent에 gp3 설정을 강제하여 재발 방지
  • CloudWatch를 통해 BurstBalance 메트릭 모니터링 및 알람 체계를 구축하여 잠재적 I/O Cliff 사전 감지

Impact

  • 영향을 받은 코호트의 p95 빌드 소요 시간 9.2분에서 4.1분으로 단축
  • gp2 대비 스토리지 비용 약 20% 절감 및 성능 안정성 동시 달성

- EBS gp2 사용 시 BurstBalance 메트릭에 대한 CloudWatch 알람 설정 여부 검토 - I/O 집약적 워크로드의 경우 용량 기반 IOPS의 gp2보다 성능 분리가 가능한 gp3 우선 채택 - gp3 도입 시 IOPS 외에 Throughput(기본 125MB/s) 제한이 워크로드의 Sequential Read/Write 성능에 미치는 영향 분석

원문 읽기