피드로 돌아가기
스마트 승급 시스템, 회원 승급 자동화의 혁신 스토리
올리브영 테크블로그올리브영 테크블로그
Backend

스마트 승급 시스템, 회원 승급 자동화의 혁신 스토리

올리브영이 회원 승급 프로세스를 PL-SQL 수작업에서 AWS Batch 자동화 및 Oracle GoldenGate에서 Apache Kafka로 전환해 데이터 동기화 시간을 9시간 41분에서 58분으로 단축

2024년 12월 22일8intermediate

Context

올리브영은 1,400만 명 이상의 회원을 대상으로 매년 1월, 7월에 2회 승급 작업을 수행하면서 PL-SQL 기반 수작업, 수동 검증, 그리고 Oracle GoldenGate의 분당 3만 건 처리량으로 인한 9시간 41분의 데이터 동기화 지연 문제를 겪고 있었다. 특히 새벽 승급 작업 후 매장 오픈 전까지 쿠폰 데이터가 마케팅 시스템에 연동되지 않아 고객 서비스 장애가 발생했다.

Technical Solution

  • PL-SQL 기반 수작업을 AWS Batch로 자동화: 온라인/오프라인 스토어 DB의 사전 데이터 검증, DML 작업, 결과 검증을 단일 배치 작업으로 통합 실행
  • Slack Webhook 연동 모니터링: 배치 수행 상황을 실시간으로 추적 가능하도록 알림 메커니즘 구성
  • Oracle GoldenGate를 Apache Kafka로 대체: 분당 처리량을 3만 건에서 10만 건 이상으로 확대하여 대용량 데이터 동기화 성능 개선
  • 배치 작업 자동 스케줄링: 담당자의 수동 트리거 제거하여 승급 주기 단축 가능
  • Apache Kafka의 수평 확장성 활용: 추가 서비스 연결 시 처리 성능 영향 최소화

Impact

  • 데이터 동기화 시간: 9시간 41분 → 58분 (약 90% 이상 감소)
  • 데이터 처리 속도: Oracle GoldenGate 대비 Apache Kafka 성능 약 3배 이상 향상
  • 인적 리소스: 새벽 대기 인원 7개 부서 담당자 제거, 반복적인 수작업 최소화
  • 휴먼 에러: 자동화된 검증 로직으로 검증 누락 및 수작업 오류 방지

Key Takeaway

대용량 데이터 배치 처리에서 실시간 복제 도구(Oracle GoldenGate)는 정합성 보장이 우수하나 분당 처리량 한계가 있으므로, 처리 속도가 우선인 경우 Apache Kafka 같은 메시지 플랫폼으로 전환하여 3배 이상의 성능 개선을 달성할 수 있다. 수작업 기반 워크플로우를 완전 자동화하는 것이 휴먼 에러 제거와 리소스 절감의 핵심이다.


주기적인 대용량 회원 데이터 처리를 수행하는 회원관리 또는 멤버십 시스템에서 PL-SQL 스크립트 기반 수작업을 AWS Batch와 같은 스케줄링 배치 도구로 대체하고, 데이터 동기화 병목이 있다면 실시간 복제 도구 대신 Apache Kafka 같은 고처리량 메시지 플랫폼을 도입하면 운영 리소스 50% 이상 절감과 동기화 지연을 90% 이상 단축할 수 있다.

원문 읽기