피드로 돌아가기
Dev.toBackend
원문 읽기
P99 40ms 지연시간과 99.97% 가용성을 달성한 FinTech 리스크 분석 플랫폼
Building a Loan Defaulter Risk Assessment Platform at Scale
AI 요약
Context
금융 규제 준수와 데이터 손실 제로라는 엄격한 제약 조건 하에 대규모 대출 심사 시스템 구축 필요성 대두. 기존 동기식 처리 구조로는 sub-50ms의 스코어링 지연시간 요구사항 충족 및 서비스 간 연쇄 장애 방지에 한계 존재.
Technical Solution
- Domain-Driven Design 기반의 서비스 분리 및 데이터 소유권 독립을 통한 Shared Database 제거
- Kafka 중심의 Event-Driven Architecture 채택으로 상태 변경 워크플로우의 비동기 처리 및 서비스 간 결합도 최소화
- customerId 기반의 Kafka Partitioning 전략을 통한 단일 차입자 이벤트의 순서 보장 및 상태 머신 일관성 유지
- Confluent Schema Registry 도입으로 Avro 기반 하위 호환성 강제 및 스키마 변경으로 인한 소비자 장애 원천 차단
- Amazon QLDB의 Append-only Ledger 활용을 통한 금융 규제(RBI/Basel III) 대응용 불변 감사 로그 구축
- API Gateway(Kong)와 Consul 연동을 통한 Rate Limiting 및 Circuit Breaking 적용으로 시스템 안정성 확보
실천 포인트
- Kafka 도입 시 customerId 등 비즈니스 키 기반의 Partitioning 전략 수립 여부 검토 - 스키마 변경으로 인한 하위 서비스 장애 방지를 위해 Schema Registry 우선 도입 - ML 모델 업데이트 시 전체 트래픽 적용 전 Feature Flag를 이용한 Canary Release 프로세스 구축 - 시스템 설계 단계에서 SLO 정의 및 Error Budget 관리 체계 마련