피드로 돌아가기
Dev.toInfrastructure
원문 읽기
Deterministic Curation Gate 도입으로 80개 중 62개 Thin Page의 Indexing 제어
How I kept 62 of 80 programmatic pages alive while hiding them from Google
AI 요약
Context
AdSense 거절 사유인 Scaled Content 문제를 해결하기 위해 저품질 페이지 제거가 필요했으나, 외부 유입 링크 보존을 위해 404 에러 방지 전략이 요구됨. 단순 삭제 대신 검색 엔진 평가에서 제외하되 실제 페이지는 유지하는 정교한 노출 제어 메커니즘이 필요했던 상황.
Technical Solution
isCurated함수를 통한 정량적 품질 임계치(Alternative 4개 이상, GitHub Stars 1,000개 이상, Intro 80자 이상) 정의 및 자동 판별 구조 설계curation.ts모듈을 분리하여 DB 종속성(@libsql/client)을 제거함으로써 Astro static page bundle 빌드 시 서버 전용 의존성 충돌 문제 해결noindex메타 태그, Sitemap 제외, RSS 피드 필터링, 내부 내비게이션 제어 등 4가지 접점에 동일한 판별 로직을 적용하여 일관된 Discovery 제어 구현- 빌드 타임에 DB 데이터를 기반으로 Deterministic하게 평가하여, ETL 프로세스로 데이터 품질 향상 시 수동 개입 없이 자동 노출 전환되는 파이프라인 구축
- 카테고리 레이어에 '최소 2개 이상의 Curated Entry 보유'라는 추가 제약 조건을 설정하여 계층적 품질 관리 체계 적용
실천 포인트
1. 서버 사이드 DB 라이브러리가 포함된 모듈을 클라이언트/정적 페이지에서 참조해야 할 때 Type-only import를 활용한 모듈 분리 검토
2. SEO 품질 관리를 위해 삭제(404) 대신 `noindex`와 Sitemap 필터링을 조합한 Soft-hide 전략 고려
3. 정성적 판단이 아닌 정량적 임계치(Threshold) 기반의 자동화 게이트를 설계하여 운영 공수 제거
태그