피드로 돌아가기
Dev.toInfrastructure
원문 읽기
BGP Route Flap Damping을 통한 라우팅 안정성 확보 및 가용성 Trade-off 분석
BGP Route Flap Damping: A Solution or a New Problem?
AI 요약
Context
네트워크 내 Route Flapping 발생 시 라우팅 테이블의 지속적인 업데이트로 인한 CPU 부하 급증 및 Packet Loss 발생. 특히 대규모 복잡한 네트워크 구조에서 짧은 주기의 경로 변동이 전체 시스템의 불안정성을 초래하는 연쇄 반응 유발.
Technical Solution
- Penalty 및 Suppress Score 기반의 경로 상태 모니터링 체계 구축
- Route 변경 횟수에 따른 Penalty 누적 및 Threshold 초과 시 해당 경로를 일시적으로 Unreachable 처리하는 Damping 로직 적용
- Half-life 개념을 도입하여 시간이 경과함에 따라 Penalty 점수를 감쇄시켜 경로의 자동 복구를 유도하는 구조 설계
- Reuse Threshold 도달 시 Suppressed 상태를 해제하여 경로를 다시 Active 상태로 전환하는 상태 머신 구현
- 네트워크 중요도에 따른 Penalty 값 차등 설정을 통해 핵심 서버 경로의 가용성 저해 방지
실천 포인트
1. 핵심 서비스 경로에 대해 과도하게 공격적인 Damping 설정 여부 검토
2. 벤더별(Cisco, Juniper 등) Damping 구현 방식 및 기본 파라미터 차이 분석
3. Segment Routing 등 최신 기술 도입을 통한 전통적 Damping 의존도 감소 가능성 평가
4. Damping 적용 후 실제 트래픽 드롭 발생 시 복구 시간(Convergence Time)의 비즈니스 허용 범위 확인