피드로 돌아가기
AI-Orchestrated 3D Asset Pipeline: From JPEG to Game-Ready GLB Without Touching Blender
Dev.toDev.to
AI/ML

MCP 기반 AI 에이전트와 VLM 피드백 루프로 Blender 자동화 파이프라인 구축

AI-Orchestrated 3D Asset Pipeline: From JPEG to Game-Ready GLB Without Touching Blender

Aleksandr Kossarev2026년 5월 27일13advanced

Context

전통적인 3D 에셋 파이프라인은 높은 학습 곡선과 수작업 기반의 리깅 공정으로 인해 막대한 시간 비용이 발생함. 특히 Blender Python API의 반환 값과 실제 뷰포트의 시각적 결과물 간의 괴리로 인해 자동화 시 신뢰성 확보에 한계가 있음.

Technical Solution

  • MCP(Model Context Protocol)를 통한 AI Coding Agent와 Blender 간의 JSON-RPC 통신 구조 설계
  • 'One Action, One Verification' 원칙을 적용하여 단일 연산 후 즉시 뷰포트 스크린샷을 촬영하는 결정적 롤백 체계 구축
  • VLM(Vision Language Model)에 도메인 특화된 구조적 프롬프트를 제공하여 시각적 Ground Truth 기반의 검증 단계 구현
  • 상태 전이 시 bpy.ops.wm.redraw_timer를 강제 실행하여 스크린샷의 프레임 최신성을 보장하는 렌더링 동기화 로직 적용
  • Orphan Data Block 제거 스크립트를 통한 씬 초기화를 수행하여 모델 간 데이터 오염 및 애니메이션 누수 방지
  • 3회 연속 실패 시 전략을 강제로 변경하는 Anti-stuck 규칙을 통해 에이전트의 무한 루프 가능성 제거

1. GUI 기반 도구 자동화 시 API 반환값 대신 시각적 결과물(Screenshot)을 Ground Truth로 설정했는가?

2. 복합 연산을 원자적 단위(Atomic Action)로 분할하여 실패 지점을 명확히 식별하고 롤백 가능한 구조인가?

3. VLM 사용 시 개방형 질문 대신 다지선다형 또는 비교 기반의 구조적 프롬프트를 설계했는가?

4. 이전 작업의 잔재가 다음 작업에 영향을 주지 않도록 데이터 퍼지(Purge) 프로세스를 포함했는가?

원문 읽기