피드로 돌아가기
Dev.toInfrastructure
원문 읽기
Cloudflare Workers 기반 Edge-first AI 이미지 생성 스튜디오 구축
I built Img2Gen, a GPT Image 2 studio on Cloudflare Workers
AI 요약
Context
단일 프롬프트 입력 방식의 한계를 극복하고 다중 Aspect Ratio 및 Reference Image 제어가 가능한 실무 중심 워크플로우 필요성 대두. 전통적인 서버 구조 대신 빠른 반복 개발과 낮은 지연 시간을 위해 Edge Runtime 기반의 경량 아키텍처 설계 요구.
Technical Solution
- Cloudflare Workers 및 D1, R2를 활용한 Serverless Stack 구성으로 인프라 관리 오버헤드 제거 및 Edge 단의 빠른 응답성 확보
- 이미지 생성 작업의 비동기 특성을 고려한 Job 제출, Polling, 상태 업데이트 기반의 상태 머신 설계
- 품질 옵션(Low/Medium/High)에 따른 가변 비용 체계를 적용한 Credit 기반 과금 로직 구현
- 생성 실패 시 예약된 Credit을 자동 복구하는 Transactional Refund 메커니즘을 통한 사용자 경험 최적화
- 외부 Provider URL의 휘발성 문제를 해결하기 위해 생성 결과물을 R2 Storage에 즉시 영속화하는 파이프라인 구축
- 최대 5장의 Reference Image 업로드 및 처리를 통한 시각적 일관성 유지 기능 구현
실천 포인트
- AI 모델의 긴 추론 시간을 고려하여 Client Polling 또는 Webhook 기반의 비동기 상태 관리 설계 검토 - API 기반 유료 서비스 설계 시 생성 실패 시점의 자동 환불 로직을 통한 신뢰성 확보 - 외부 AI 서비스의 임시 URL에 의존하지 않고 자체 Object Storage에 결과물을 저장하는 Persistence 레이어 구축 - Serverless 환경에서 Long-running Job 처리를 위한 상태 설계 및 타임아웃 전략 수립