피드로 돌아가기
InfoQInfrastructure
원문 읽기
Fintech 수익 극대화를 위한 Low Latency 및 Predictable Latency 설계 전략
Presentation: Latency: The Race to Zero...Are We There Yet?
AI 요약
Context
하드웨어 성능 향상만으로 Latency 개선이 불가능한 현대 CPU 구조와 Cloud 환경의 추상화 레이어 증가로 인한 병목 현상 발생. 특히 분산 시스템 내 Communication 비용 증가가 시스템 전체 성능의 결정적 제약 사항으로 작용하는 상황.
Technical Solution
- Business Logic과 Communication 계층의 완전한 Decoupling을 통한 Asynchronous 처리 구조 설계
- Message Queue 기반의 비동기 워크플로우 도입을 통한 Request-Response 대기 시간 제거
- Predictable Latency 확보를 위해 평균치(Average)가 아닌 개별 Order의 처리 지연 시간 최적화에 집중
- LMAX Disruptor 및 Aeron Sequencer와 같은 고성능 메시징 프로토콜을 활용한 데이터 전송 효율 극대화
- Cloud 환경의 가상화 레이어 오버헤드를 최소화하기 위한 Reliable Messaging 프로토콜 적용 검토
실천 포인트
- 시스템 설계 시 Average Latency보다 P99 등 Tail Latency의 예측 가능성(Predictability)을 우선 검토했는가 - 동기식 호출(Synchronous Call)로 인한 불필요한 의존성이 Business Logic 외적인 영역에 존재하는지 확인하고 비동기 구조로 전환 가능한지 분석 - Cloud 추상화 레이어로 인한 성능 저하가 심각한 경우 전용 하드웨어 도입 또는 Low-level 메시징 프로토콜 최적화 고려