피드로 돌아가기
Gemma 4 CAD Orchestrator
Dev.toDev.to
AI/ML

Gemma 4 MoE 기반의 Deterministic Text-to-Geometry 파이프라인 구축

Gemma 4 CAD Orchestrator

Aravind d2026년 5월 25일4intermediate

Context

기존 CAD 설계 과정에서 발생하는 수동 모델링의 높은 Friction과 시간 소모 문제 해결 필요. 자연어 기반의 설계 의도를 정밀한 Parametric Geometry로 변환하는 Zero-install 파이프라인 구현을 목표로 함.

Technical Solution

  • Model-Agnostic Interface 설계를 통한 Vertex AI, Ollama, Hugging Face 등 멀티 엔드포인트 Cascading Fallback 구조 확보
  • MoE(Mixture-of-Experts) 기반 Gemma 4 26B 모델을 활용하여 토큰당 3.8B Active Parameter만 사용하여 추론 속도 최적화
  • System Prompt 내 Multi-shot valid execution pairs 주입을 통한 9종의 Geometric Primitives JSON 스키마 강제 및 Hallucination 억제
  • Thinking block과 Payload block을 분리하는 Prompt 구조 설계를 통해 복잡한 기술 용어 포함 시 발생하는 JSON 문법 오류 해결
  • Serverless Cloud Run 환경에서 512MB RAM footprint의 초경량 마이크로서비스 구성으로 오버헤드 최소화
  • Three.js 및 HTML5 Canvas 기반의 Pure Client-side Rendering을 채택하여 서버측 이미지 처리 부하 제거 및 실시간성 확보

- LLM의 JSON 출력 불안정성 해결을 위해 '사고 과정(Thinking)'과 '결과물(Payload)' 영역을 명확히 분리하는 태그 기반 프롬프팅 적용 - 고성능 모델의 비용 및 지연 시간을 줄이기 위해 MoE 구조 모델의 Active Parameter 효율성을 검토 - 인프라 종속성 제거를 위해 추상화된 Backend Interface를 구축하여 다중 AI API Fallback 전략 수립

원문 읽기