피드로 돌아가기
InfoQInfoQ
Infrastructure

500개 서비스의 AWS ECS에서 EKS로의 전략적 전환 기록

Presentation: Duolingo's Kubernetes Leap

Franka Passing2026년 4월 6일30intermediate

Context

AWS ECS 기반의 관리형 인프라로 운영 중인 500개 이상의 Backend 서비스 구조. 서비스 규모 확장에 따른 더 풍부한 기능 생태계 필요성 증대. ECS 환경에서 발생하는 배포 관련 기술적 한계 직면.

Technical Solution

  • AWS EKS 도입을 통한 Kubernetes 표준 생태계 확보 및 멀티 클라우드 확장 가능성 설계
  • Karpenter 도입을 통한 AWS Spot Instance 활용 최적화 및 효율적인 노드 프로비저닝 구현
  • Argo CD 기반의 커스텀 배포 전략을 구축하여 ECS의 배포 제약 사항 해결
  • OTel Collector를 ECS와 EKS 양측에 배치하여 Prometheus와 Honeycomb로 이어지는 통합 Observability 파이프라인 구축
  • 소수 정예 Taskforce 구성 및 초기 도입자(Early Adopters) 서비스를 통한 점진적 마이그레이션 전략 채택
  • 보안 및 관측성 기초 설계를 우선 완료한 후 제품 팀에 제공하는 플랫폼 서비스형 구조 설계

Key Takeaway

인프라 전환 시 단순 도구 교체가 아닌 사용자(제품 팀)의 실질적 페인 포인트 해결을 최우선 목표로 설정해야 함. 기초 인프라의 관측성과 보안이 확보된 상태에서 점진적으로 확산하는 것이 리스크를 최소화하는 방식.


Spot Instance 비중이 높고 복잡한 배포 전략이 필요한 대규모 마이크로서비스 환경이라면 ECS보다 EKS와 Karpenter, Argo CD 조합을 검토할 것

원문 읽기