피드로 돌아가기
How I Hosted a Production AI App for $10/Year — HuggingFace Spaces + Cloudflare Worker
Dev.toDev.to
Infrastructure

연비용 10달러로 16GB RAM AI 환경을 구축한 HF-CF 프록시 아키텍처

How I Hosted a Production AI App for $10/Year — HuggingFace Spaces + Cloudflare Worker

Muralidhar M Pala2026년 5월 28일5intermediate

Context

기존 Serverless 플랫폼의 낮은 RAM 할당량과 프로세스 강제 종료로 인한 AI 스택 배포 제약 발생. 특히 SSE 스트리밍 및 무거운 Neural TTS 모델 구동 시 메모리 부족과 타임아웃 문제 직면.

Technical Solution

  • HuggingFace Spaces의 16GB RAM 및 Docker 지원을 활용한 고성능 런타임 확보
  • Cloudflare Worker를 활용한 Reverse Proxy 구성으로 HF Pro 구독 없이 Custom Domain 적용
  • HF Spaces의 HEAD 요청 405 에러 해결을 위해 Worker단에서 HEAD를 GET으로 변환하는 인터셉터 로직 구현
  • UptimeRobot의 주기적 헬스체크 요청을 통한 HF Spaces의 48시간 자동 Sleep 상태 방지
  • 단일 Docker 이미지 내 FastAPI 기반 백엔드와 AI 모델을 통합한 Monolithic 패키징 전략 채택

1. AI 모델 구동을 위한 최소 RAM 요구사항 확인 후 HF Spaces Docker SDK 검토

2. 외부 모니터링 도구 사용 시 대상 서버의 HTTP Method 지원 여부 확인 및 Proxy 단 변환 처리

3. 무료 티어의 Sleep 정책 방지를 위해 외부 헬스체크 봇을 활용한 Keep-alive 설정 적용

원문 읽기