피드로 돌아가기
Dev.toSecurity
원문 읽기
JavaScript 기반 분석 맹점으로 누락된 68,000건의 Bot Traffic 식별 및 차단
Why Your WordPress Site Is Slow (And Google Analytics Has No Idea)
AI 요약
Context
브라우저 JavaScript 실행 기반의 Google Analytics 아키텍처로 인한 비브라우저 트래픽 식별 불능 상태 분석. PHP Worker Pool의 한정된 자원 내에서 대규모 스크래핑 트래픽이 정당한 사용자의 요청을 밀어내는 Resource Contention 발생.
Technical Solution
- Browser-independent 분석을 위한 Server-side Traffic Analysis 아키텍처 도입
- HTTP Request 레벨에서 User Agent를 정밀 분석하여 Go-http-client 등 라이브러리 기반 트래픽 분리
- /wp-json/wp/v2/users 등 REST API 엔드포인트 타겟팅 패턴 분석을 통한 Reconnaissance 탐지
- UA 문자열 내 WebKit 버전 및 플랫폼 식별자 불일치 검증을 통한 Spoofed UA 필터링
- 탐지된 악성 패턴을 네트워크 전체로 전파하는 Collective Intelligence 기반의 자동 차단 메커니즘 적용
Impact
- 분석 기간 내 GA에서 누락된 약 68,000건의 Unknown Request 식별
- 전체 미식별 트래픽의 99%를 차지한 Go-http-client/1.1 단일 소스 탐지
실천 포인트
- Client-side Analytics 외에 Server-level Log 분석 체계 구축 여부 확인 - PHP-FPM Worker Pool의 Concurrent Request 수치와 실제 Traffic Peak 간의 상관관계 분석 - REST API 엔드포인트에 대한 비정상적인 접근 패턴 및 User Agent 일관성 검증 로직 검토 - 단순한 IP 차단을 넘어 User Agent 패턴 기반의 Dynamic Blocking 전략 수립