피드로 돌아가기
Dev.toDevOps
원문 읽기
Cloudflare Pages 기반 SSG 배포 후 3단계 검증을 통한 런타임 장애 최소화
Three post-deploy checks I run after every Cloudflare Pages build
AI 요약
Context
Astro 5 SSG와 Cloudflare Pages 기반의 정적 사이트 운영 중 _redirects 설정 오류로 인한 sitemap 접근 불가 및 배포 지연으로 인한 데이터 불일치 발생. 전체 E2E 테스트 도입 대신 실제 장애 발생 지점에 집중한 가벼운 Post-deploy 검증 체계 필요성 대두.
Technical Solution
- curl의 -o /dev/null -w "%{http_code}" 옵션을 활용해 Redirect를 무시하고 sitemap-index.xml의 HTTP 200 응답을 직접 확인하는 가용성 체크 수행
- sitemap-0.xml 내 URL 개수를 정량적으로 검증하여 ETL 파이프라인의 Silent Failure를 감지하는 임계값 기반 모니터링 적용
- 배포 완료 후 Live URL 상태에서 IndexNow API에 배치 제출하는 분리된 workflow_dispatch 트리거를 설계하여 색인 지연 시간 최소화
- Lighthouse CI를 활용해 성능(Performance < 80), CLS(> 0.1), 접근성 점수를 매주 월요일 04:30 UTC에 추적하는 Trend Monitoring 구조 구축
- SSG 특성에 맞춰 런타임 API 체크를 배제하고 빌드 타임 데이터 정합성에 집중한 Lean한 검증 범위 설정
실천 포인트
- Redirect 룰이 실제 크롤러에게 영향을 주는지 확인하기 위해 Redirect를 따르지 않는 HTTP 상태 코드 체크 수행 - 데이터 파이프라인 장애 감지를 위해 Sitemap 내 최소 URL 개수 임계값 설정 및 검증 - 인프라 배포 완료 시점과 실제 Live 반영 시점의 차이를 고려해 외부 API 알림(IndexNow 등)을 별도 트리거로 분리 - 트래픽 규모와 비즈니스 단계에 맞춰 배포 차단(Gate)과 추세 모니터링(Trend)의 기준을 차등 적용