피드로 돌아가기
Dev.toAI/ML
원문 읽기
Gemini 2.5 Flash 기반 9,500만 개 조합의 AI Generator 동적 생성 구조
I built an app where the AI invents its own generators
AI 요약
Context
사용자 사진을 입력받아 가상의 기업 매뉴얼이나 사양서를 생성하는 엔터테인먼트 앱 설계 온디바이스 전처리 및 서버리스 환경을 통한 데이터 프라이버시 확보와 빠른 배포 체계 구축 필요
Technical Solution
- Gemini 2.5 Flash 모델을 Firebase Functions(asia-northeast1)에 배포하여 서버리스 추론 환경 구축
- 개인정보 보호를 위해 사진 데이터를 서버로 전송하지 않고 온디바이스에서 Prompt로 변환하는 전처리 구조 채택
- Subject, Genre, Tone, Format, Color Palette의 조합을 통해 약 9,500만 개의 Generator를 동적으로 합성하는 Recursive Layer 설계
- Prompt 수준의 UGC Moderation과 사용자 신고 기반의 리포트 플로우를 통한 콘텐츠 필터링 구현
- iOS 17+ API 제약을 통해 최신 온디바이스 처리 성능 확보
실천 포인트
1. 개인정보 민감 데이터 처리 시 서버 전송 전 온디바이스에서 텍스트 기반 Prompt로 추상화하는 방안 검토
2. AI 모델의 낮은 일관성(Inconsistency)을 해결하기보다 UX 차원에서 투명하게 공개하여 이탈률을 낮추는 전략 고려
3. Firebase Functions와 같은 지역 기반 서버리스 런타임을 활용한 추론 지연 시간 최적화 적용