피드로 돌아가기
Dev.toInfrastructure
원문 읽기
Proximity Caching를 통한 API 호출 80% 절감 및 응답 속도 40배 개선
Arara Watch: a serverless global disaster monitor, developed with technology from Google Gemini, AWS, OpenWeather and NASA.
AI 요약
Context
실시간 기상 및 위성 데이터 기반의 재난 모니터링 시스템 구축 과정에서 LLM API의 Rate Limit 문제와 높은 Latency 발생. 트래픽 급증 시 비용 효율성과 시스템 안정성을 보장해야 하는 제약 조건 존재.
Technical Solution
- Terraform 기반의 100% Serverless 아키텍처를 채택하여 트래픽 변동성에 따른 자동 확장성 확보
- 좌표값 소수점 둘째 자리 반올림을 통한 Proximity Caching 전략으로 약 1.1km 범위의 데이터 그룹화
- Amazon DynamoDB의 Global Secondary Index(GSI)를 활용해 캐시된 분석 결과의 고속 조회 구조 설계
- Google Gemini 2.5 Flash를 구조화된 백엔드 마이크로서비스로 활용하여 엄격한 JSON 포맷의 분석 결과 생성
- S3와 CloudFront 조합의 정적 호스팅 및 API Gateway-Lambda 파이프라인을 통한 요청 처리 경로 최적화
실천 포인트
외부 API의 Rate Limit 및 Latency 해결을 위해 데이터의 정밀도 타협 지점을 설정하고, 이를 기반으로 한 캐싱 키(Caching Key) 설계 검토