피드로 돌아가기
Building an SEO crawler in TypeScript: what I learned
Dev.toDev.to
Backend

TypeScript 기반 SEO Crawler의 정적 분석 및 Playwright 렌더링 구조 설계

Building an SEO crawler in TypeScript: what I learned

Alfon2026년 5월 28일6intermediate

Context

단순 페이지 수집을 넘어 기술적 SEO 분석이 가능한 개발자 중심의 CLI 도구 필요성 대두. 기존 정적 HTML 분석만으로는 JavaScript 기반 현대 웹사이트의 렌더링 후 DOM 상태를 정확히 진단하지 못하는 한계 존재.

Technical Solution

  • 개발 생산성 및 데이터 스키마 정밀 제어를 위해 TypeScript 기반의 정적 타입 시스템 채택
  • 단순 Crawling 레이어와 데이터 분석용 Analysis Engine 레이어를 분리하여 확장성 확보
  • Playwright 도입을 통한 Raw HTML과 Rendered DOM의 비교 분석 체계 구축
  • 메타데이터, Canonical 태그, Schema Markup 등 다차원 데이터의 필터링 및 Scoring 로직 구현
  • 사용자 경험 최적화를 위한 단순화된 CLI Command 인터페이스 설계

1. JS 렌더링 전후의 DOM 차이를 분석하여 Client-side Rendering으로 인한 SEO 누락 여부 검토

2. 대량의 크롤링 데이터 발생 시 노이즈 제거를 위한 Scoring 및 Filtering 메커니즘 도입

3. CLI 도구 설계 시 복잡한 옵션보다 목적 중심의 단순한 Command 셋 구성

원문 읽기