피드로 돌아가기
Dev.toAI/ML
원문 읽기
Two-pass 파이프라인 기반 AI 캐릭터 일관성 확보 및 고밀도 프롬프트 설계
We Built an AI Comic Generator in 3 Sprints — Here's What Actually Worked
AI 요약
Context
단일 문장 기반의 AI 만화 생성 과정에서 발생하는 캐릭터 외형 및 화풍의 불일치 문제 분석. 단순 텍스트 프롬프트 반복 주입만으로는 모델의 확률적 특성으로 인해 페이지별 시각적 연속성 유지가 불가능한 한계 직면.
Technical Solution
- Character Reference Sheet를 선행 생성하여 전체 작품의 시각적 계약(Visual Contract)으로 활용하는 Two-pass 파이프라인 구축
- base64 인코딩된 참조 이미지와 직전 페이지 이미지를 Gemini 모델에 함께 전달하여 장면 간 Continuity 확보
- [Subject & Action] + [Spatial Placement] + [Camera Angle] + [Lighting] + [Key Details] 구조의 정형화된 프롬프트 인터페이스 설계
- CLAUDE.md 파일을 통한 영역별 컨벤션 및 제약 사항 명문화로 AI 기반 개발 프로세스의 일관성 유지
- PostToolUse 및 Stop 훅을 활용한 ESLint, tsc, Gitleaks 자동 실행 기반의 Quality Gate 구축
- Supabase 기반의 상태 머신을 도입하여 멀티모달 이미지 생성의 긴 지연 시간을 관리하는 폴링 구조 설계
실천 포인트
- AI 프롬프트를 단순 텍스트가 아닌 Typed Interface로 정의하여 출력 값의 예측 가능성 확보 - AI 모델의 확률적 오차를 줄이기 위해 정적 참조 이미지(Reference Sheet)를 컨텍스트에 포함하는 설계 검토 - AI 에이전트 활용 시 CLAUDE.md와 같은 문서 기반의 제약 사항(Guardrails)을 설정하여 코드 품질 유지 - AI 파이프라인 구축 시 UI 개발보다 API 엔드포인트의 안정성 확보를 우선하는 Milestone 설정