GitHub BlogGitHub가 2월 6개 사건 분석을 통해 캐싱 메커니즘 과부하, 정책 적용 오류, 알림 임계값 부정확으로 인한 다중 서비스 중단의 근본 원인 규명GitHub availability report: February 2026Infrastructureintermediate14 분 소요2026년 3월 12일
Slack EngineeringSlack이 Deploy Safety 프로그램으로 변경 유발 장애로 인한 고객 영향 시간을 18개월에 걸쳐 90% 감소Deploy Safety: Reducing customer impact from changeDevOpsintermediate26 분 소요2025년 10월 7일