피드로 돌아가기
Dev.toInfrastructure
원문 읽기
Horizontal Scaling 실현을 위한 L4/L7 Load Balancing 아키텍처 설계
O uso de Load Balancing para sistemas distribuídos: Escalabilidade e Resiliência
AI 요약
Context
Vertical Scaling의 물리적·비용적 한계로 인한 시스템 병목 현상 발생. 단일 서버 구조의 가용성 결여와 트래픽 급증 시 서비스 중단 위험을 해결하기 위한 분산 구조로의 전환 필요.
Technical Solution
- Reverse Proxy 기반의 Load Balancer 도입을 통한 클라이언트와 백엔드 인프라의 Decoupling 구현
- 저지연 및 고처리량 달성을 위해 IP/Port 기반으로 트래픽을 제어하는 Layer 4 로직 적용
- HTTP 헤더 및 URI 분석을 통한 서비스별 정밀 라우팅을 위해 Layer 7 로직 설계
- 노드 성능 균등 시 Round Robin을, 연결 유지 시간이 긴 WebSocket 환경에서는 Least Connections 알고리즘 채택
- Health Checks 메커니즘을 통한 장애 노드의 자동 격리 및 가용 상태 노드로의 트래픽 재배정
- Stateless 아키텍처 지향을 통한 서버 확장성 확보 및 필요 시 Redis 기반의 상태 관리 전략 수립
실천 포인트
- 트래픽 특성에 따른 L4(속도 중심) vs L7(라우팅 중심) 선택 기준 검토 - 서버 사양 및 요청 처리 시간이 불균등할 경우 Least Connections 알고리즘 적용 여부 확인 - 서비스 가용성 확보를 위한 Health Check 주기 및 임계값 설정 최적화 - 세션 유지 필요 시 Sticky Sessions 도입보다 분산 캐시 기반의 Stateless 설계 우선 고려