피드로 돌아가기
InfoQInfoQ
Infrastructure

Serverless 기반 Multi-region 전환으로 배포 시간 90분에서 수 분대로 단축

Presentation: Evolution of a Backend for a Streaming Application

Daniele Frasca2026년 5월 11일29intermediate

Context

단일 노드 DB와 표준 없는 6개 서비스로 구성된 레거시 구조로 인한 잦은 시스템 크래시 발생. Kafka 토픽의 중복 구독과 서로 다른 검증 로직으로 인해 데이터 불일치 및 서비스 가용성 저하 문제 직면.

Technical Solution

  • 운영 공수 제거 및 코드 집중을 위한 Serverless 아키텍처 전면 도입
  • 서비스 중요도에 따른 Multi-regional Active-Active 및 Active-Passive 전략 차등 적용
  • 내부 상태 노출 방지 및 명확한 서비스 경계 설정을 위한 Hub and Spoke 패턴 도입
  • AWS Managed Services를 활용하여 가용성과 복원력을 인프라 계층에서 자동 처리
  • 트래픽 급증 대응을 위한 Lambda-first 기반의 ALB 가중치 기반 트래픽 시프팅 전략 수립
  • Fargate Task의 임계치(CPU/Memory 60-70%) 도달 전 Lambda로 Overflow 트래픽 처리

Impact

  • 배포 소요 시간: 1.5시간에서 수 분 단위로 획기적 단축
  • Fargate Task 처리 능력: 2 vCPU/4GB 메모리 기준 동시 요청 3,000~4,000건 처리 확인

Key Takeaway

인프라 관리 비용을 최소화하는 Serverless 전환과 트래픽 특성에 따른 Lambda-Fargate 하이브리드 스케일링 전략을 통해 고가용성과 비용 효율성을 동시에 달성함.


- 트래픽 스파이크 대응 시 Pre-warming 대신 Lambda를 이용한 Overflow 처리 구조 검토 - 마이크로서비스 간 데이터 정합성 해결을 위해 Hub and Spoke 패턴을 통한 이벤트 흐름 제어 적용 - 인프라 가용성 확보를 위해 서비스 중요도별 Multi-region 복제 전략 수립

원문 읽기