피드로 돌아가기
I Built a Quotation Generator for Kenyan Street Welders Using Gemma 4's Vision
Dev.toDev.to
AI/ML

Gemma 4 MoE 기반 비전 분석을 통한 1분 내 실시간 견적 생성 시스템

I Built a Quotation Generator for Kenyan Street Welders Using Gemma 4's Vision

Lewis Sawe2026년 5월 24일3intermediate

Context

케냐 비정형 숙련공(Jua Kali)의 수동 견적 산출 방식에 따른 전문성 결여 및 고객 이탈 문제 발생. 기존의 단순 이미지 캡셔닝으로는 복잡한 도면의 재료 수량 산출과 정확한 가격 매칭 구현 불가.

Technical Solution

  • Gemma 4 26B A4B MoE 모델 채택을 통한 추론 품질 유지 및 응답 지연 시간 최소화
  • Vision-to-Structured-Data 파이프라인 설계를 통한 이미지 내 의도 분석 및 수치 데이터 추출
  • System Prompting 기반의 도메인 특화 페르소나 설정으로 별도 RAG나 Fine-tuning 없는 시장가 반영
  • FastAPI 기반의 경량 백엔드와 localStorage를 활용한 오프라인 이력 관리 구조 설계
  • JSON 응답 형식을 통한 동적 가격 수정 및 실시간 총액 재계산 로직 구현
  • 모바일 우선 환경을 고려한 WhatsApp 공유 및 PDF 렌더링 워크플로우 구축

1. 실시간 응답성이 중요한 모바일 서비스 설계 시 MoE(Mixture-of-Experts) 모델의 활성 파라미터 수치 검토

2. 비정형 데이터(이미지)에서 정형 데이터(JSON) 추출 시, 모델의 추론 능력을 활용한 수량 산출 및 검증 로직 설계

3. 초기 MVP 단계에서 RAG 도입 전, Base 모델의 Zero-shot 도메인 지식 한계치를 먼저 측정하여 개발 공수 최적화

원문 읽기