AT Protocol 기반 Bluesky Scraper 구축 및 API 라우팅 최적화

How I built a Bluesky scraper using the AT Protocol API (and published it on Apify)

Daniel Ainsworth2026년 5월 27일3분intermediate

AI 요약

Context

기존 소셜 미디어 스크래퍼의 Cloudflare 차단 및 복잡한 API 비용 체계로 인한 데이터 수집 제약 발생. 공개 데이터 접근이 설계 단계부터 반영된 AT Protocol의 개방형 구조를 활용한 효율적 데이터 추출 체계 필요.

실천 포인트

1. 외부 API 연동 시 인증 토큰 포함 여부에 따른 HTTP 응답 코드(403 등)의 변화를 먼저 테스트할 것

2. Monorepo 기반 클라우드 배포 시 런타임 의존성 해결을 위해 빌드 타임 소스 복제 또는 번들링 전략을 검토할 것

3. 계층형 데이터 구조(Nested Tree) 수집 시 데이터 가공 목적에 맞는 평탄화(Flattening) 알고리즘을 적용할 것

태그