피드로 돌아가기
Dev.toDevOps
원문 읽기
Cloudflare Pages 배포 후 실질적 장애 표면을 타격하는 3단계 검증 체계 구축
Three post-deploy checks I run after every Cloudflare Pages build
AI 요약
Context
Cloudflare Pages와 Astro 5 SSG 기반의 정적 사이트 운영 중 _redirects 규칙 설정 오류 및 배포 지연으로 인한 Production 장애 경험. 전체 E2E 테스트 도입 대신 실제 발생한 실패 모드에 집중한 고효율 Post-deploy 검증 프로세스 필요성 대두.
Technical Solution
- Curl의 -o /dev_null -w %{http_code} 옵션을 활용하여 Redirect를 제외한 순수 200 OK 응답 확인을 통한 sitemap-index.xml 도달 가능성 검증
- sitemap-0.xml 내 URL 카운트 임계치(예: 1,000개) 설정을 통한 ETL 데이터 파이프라인의 무중단 작동 여부 간접 확인
- 배포 완료 후 실제 Live URL을 기반으로 IndexNow API에 Batch Submission을 수행하는 별도 workflow_dispatch 트리거 설계로 인덱싱 지연 최소화
- Lighthouse-ci-action을 활용한 주간 단위의 성능 Trend 모니터링 체계 구축으로 Tailwind v4 설정 및 컴포넌트 변경에 따른 Layout Paint 회귀 분석
- SSG 특성을 고려하여 Runtime API 체크와 Uptime 모니터링을 배제하고 정적 자산의 유효성 검증에만 집중한 Lean한 검증 범위 설정
실천 포인트
- Redirect 규칙이 실제 크롤러의 접근을 차단하는지 확인하기 위해 Redirect를 무시하는 HTTP 상태 코드 검증 수행 - 데이터 파이프라인 장애를 빠르게 감지하기 위해 핵심 정적 파일의 최소 데이터 규모(Threshold) 검증 단계 추가 - 인덱싱 API 호출 시 배포 완료 시점과 실제 Live 반영 시점의 시차를 고려하여 별도 트리거로 분리 운영 - 정적 사이트의 경우 매 배포 시 성능 측정보다는 주기적인 Spot-check를 통해 성능 추세를 관리하는 전략 채택