피드로 돌아가기
RTO vs RPO vs MTTR vs MTBF: the Security+ metrics people mix up, and how to keep them straight
Dev.toDev.to
Security

RTO/RPO 및 신뢰성 지표를 통한 시스템 복구 전략 및 정량적 리스크 분석

RTO vs RPO vs MTTR vs MTBF: the Security+ metrics people mix up, and how to keep them straight

TiltedLunar1232026년 6월 14일4beginner

Context

시스템 장애 발생 시 데이터 손실 허용 범위와 서비스 복구 시간의 명확한 정의 부족으로 인한 대응 체계 혼선 발생. 복구 목표와 하드웨어 신뢰성 지표 간의 개념적 혼용으로 인해 효율적인 인프라 투자 및 재해 복구 계획 수립에 병목 발생.

Technical Solution

  • 데이터 손실 허용치인 RPO 설정을 통한 Backup 및 Replication 주기 결정
  • 서비스 가동 중단 허용 시간인 RTO 정의를 통한 Hot/Warm/Cold Site 복구 전략 수립
  • 하드웨어 평균 고장 간격인 MTBF 분석을 통한 부품 교체 주기 및 신뢰성 예측
  • 장애 발생 후 복구까지의 시간인 MTTR 최적화를 통한 서비스 가용성 향상
  • AV, EF를 이용한 SLE 산출 후 ARO를 곱해 연간 예상 손실액인 ALE를 도출하는 정량적 리스크 분석 체계 구축
  • ALE 기반의 비용 편익 분석을 통한 보안 컨트롤 도입의 경제적 타당성 검증

- 데이터 백업 주기가 현재 설정된 RPO 기준을 충족하는지 검증 - 재해 복구 시나리오별 실제 복구 시간이 RTO 목표치 이내인지 모의 훈련 수행 - 하드웨어 교체 주기 결정 시 MTBF 지표를 반영한 예방적 유지보수 계획 수립 - 보안 솔루션 도입 전 ALE 산출을 통해 투자 대비 리스크 감소 비용을 정량적으로 비교

원문 읽기