피드로 돌아가기
운영 비용을 95% 절감한 서버리스 온콜 시스템 구축기
올리브영 테크블로그올리브영 테크블로그
Infrastructure

운영 비용을 95% 절감한 서버리스 온콜 시스템 구축기

올리브영이 외부 온콜 솔루션을 Amazon SES + Amazon Connect 기반 서버리스 시스템으로 전환해 월 운영비 95% 절감 및 발신 안정성 100% 달성

2025년 12월 24일12intermediate

Context

기존 외부 온콜 솔루션은 해외 번호 발신으로 인한 국내 통신사 스팸 차단, 간헐적 발신 실패, 월 200만 원 이상의 고정 비용이라는 세 가지 구조적 한계를 가지고 있었습니다.

Technical Solution

  • 온콜 트리거를 이메일(Amazon SES)로 통합: Slack, Datadog 등 모니터링 도구의 표준 이메일 인터페이스를 활용해 별도 API 연동 없이 모든 장애 신호를 단일 파이프라인으로 수렴
  • SES → SNS → SQS → Lambda 메시지 릴레이 구조 도입: 대량 메일 유입 시 메시지 손실을 방지하고 Lambda가 초당 4건 속도로 발신량을 제어
  • Google Groups와 RFC 5233 플러스 어드레싱 조합으로 온콜 대상자 관리: 별도 DB 없이 'call+821012345678@oliveyoung.co.kr' 형식의 이메일 주소에서 전화번호를 정규식으로 추출하고 Google Groups 멤버 변경만으로 온콜 그룹 자동 관리
  • Amazon Connect API 호출로 국내 번호 발신: TTS(Amazon Polly)를 통해 이메일 제목을 음성 안내 메시지로 변환해 전달
  • 이메일 화이트리스트 필터링 도입: 지정된 도메인(Datadog, Slack, 사내메일)에서만 발신한 메일을 온콜 트리거로 허용해 스팸메일 오발신 차단

Impact

  • 월 운영 비용: 약 2,000,000원에서 약 100,000원 미만으로 감소(약 95% 절감)
  • 발신 실패율: 0%(기존 솔루션의 간헐적 발신 실패 해결)
  • 발신 안정성: 해외 번호 발신에서 국내 번호 발신으로 변경해 통신사 스팸 차단 위험 제거

Key Takeaway

온콜처럼 높은 신뢰성이 요구되는 시스템에서는 복잡한 맞춤형 아키텍처보다 이메일처럼 검증된 표준 프로토콜을 활용한 단순한 구조가 더 안정적일 수 있으며, Google Groups 같은 기존 조직 관리 체계와 RFC 5233 플러스 어드레싱을 조합하면 상태 관리 없이도 동적 대상자 식별이 가능합니다.


온콜이나 긴급 알림 시스템을 운영하는 팀에서 기존 외부 서비스에 의존할 때는, 해당 서비스가 지원하는 표준 출력 채널(이메일, 웹훅 등)을 먼저 점검하고 클라우드 기본 서비스(AWS SES, Lambda, SNS, SQS)로 조합하면 고정 비용을 90% 이상 절감하면서도 발신 신뢰성을 높일 수 있습니다.

원문 읽기