피드로 돌아가기
Dev.toInfrastructure
원문 읽기
Concurrency 기반 과금 모델 도입으로 대규모 reCAPTCHA 비용 99% 절감
The real cost of solving reCAPTCHA at scale (per-1,000 vs thread-based)
AI 요약
Context
공공 웹 자동화 시 reCAPTCHA 해결 비용이 트래픽 증가에 따라 선형적으로 상승하는 구조적 한계 발생. 기존 Per-1,000 과금 방식은 처리량 증가 시 운영 비용이 기하급수적으로 증가하는 병목 지점으로 작용.
Technical Solution
- 총 처리량(Total Volume)이 아닌 동시 처리 수(Peak Concurrency) 중심의 Thread-based 모델 채택
- 단일 Thread를 하나의 Concurrent In-flight Solve 단위로 정의하여 처리 능력 최적화
- 요청-폴링 기반의 Token Flow(in.php 요청 후 res.php 상태 확인)를 통한 비동기 처리 구현
- 실시간 Concurrency 모니터링을 통한 최적의 Thread 수 산정 및 프로비저닝
- 처리량 증가 시 추가 비용 없이 기존 Thread의 회전율을 높이는 구조적 효율성 확보
Impact
- 월 1,000만 건 처리 시 비용: Usage-based $20,000 $\rightarrow$ Thread-based $300으로 약 98.5% 절감
- 유효 단가(Effective per-1k): $2.00에서 $0.015 수준으로 급격히 하락
Key Takeaway
시스템 규모 확장 시 단순 단위 단가보다 트래픽 패턴(Burst vs Sustained)에 맞는 과금 및 리소스 할당 모델 선택이 비용 효율성의 핵심임.
실천 포인트
- 월간 처리량이 낮고 불규칙한 경우 Usage-based 모델 유지 - 지속적인 고부하 트래픽 발생 시 Thread-based 또는 Concurrency 기반 모델로 전환 검토 - Thread 수 산정 전 24시간 이상의 실시간 Peak Concurrency 지표 측정 필수 - 10배 규모 확장 시의 비용 시뮬레이션을 통한 아키텍처 경제성 검증