피드로 돌아가기
Dev.toInfrastructure
원문 읽기
연비용 10달러로 16GB RAM AI 환경을 구축한 HF-CF 프록시 아키텍처
How I Hosted a Production AI App for $10/Year — HuggingFace Spaces + Cloudflare Worker
AI 요약
Context
기존 Serverless 플랫폼의 낮은 RAM 할당량과 프로세스 강제 종료로 인한 AI 스택 배포 제약 발생. 특히 SSE 스트리밍 및 무거운 Neural TTS 모델 구동 시 메모리 부족과 타임아웃 문제 직면.
Technical Solution
- HuggingFace Spaces의 16GB RAM 및 Docker 지원을 활용한 고성능 런타임 확보
- Cloudflare Worker를 활용한 Reverse Proxy 구성으로 HF Pro 구독 없이 Custom Domain 적용
- HF Spaces의 HEAD 요청 405 에러 해결을 위해 Worker단에서 HEAD를 GET으로 변환하는 인터셉터 로직 구현
- UptimeRobot의 주기적 헬스체크 요청을 통한 HF Spaces의 48시간 자동 Sleep 상태 방지
- 단일 Docker 이미지 내 FastAPI 기반 백엔드와 AI 모델을 통합한 Monolithic 패키징 전략 채택
실천 포인트
1. AI 모델 구동을 위한 최소 RAM 요구사항 확인 후 HF Spaces Docker SDK 검토
2. 외부 모니터링 도구 사용 시 대상 서버의 HTTP Method 지원 여부 확인 및 Proxy 단 변환 처리
3. 무료 티어의 Sleep 정책 방지를 위해 외부 헬스체크 봇을 활용한 Keep-alive 설정 적용