피드로 돌아가기
How I Built an AI Character That Lives on My Desktop and Learns New Expressions
Dev.toDev.to
AI/ML

Wan2.7 I2V 기반 동적 표정 생성 및 Electron 기반 Desktop AI Agent 구현

How I Built an AI Character That Lives on My Desktop and Learns New Expressions

Jakim2026년 5월 2일4intermediate

Context

기존 AI 컴패니언의 정적인 아바타나 단순 규칙 기반 애니메이션으로 인한 부자연스러운 사용자 경험 해결 필요. 에이전트의 자율적 판단에 따른 실시간 표정 변화와 확장 가능한 애니메이션 파이프라인 구축을 목표로 함.

Technical Solution

  • Wan2.7 Image-to-Video 모델을 활용한 텍스트 기반 커스텀 표정 생성 및 자동 등록 파이프라인 설계
  • Electron의 transparent frameless window 및 Chroma Key 제거 공정을 통한 데스크톱 상주형 UI 구현
  • Double-buffer GIF crossfade 기법을 적용한 이미지 교체 시 플래시 현상 제거 및 부드러운 전환 처리
  • HTTP API 기반의 단일 엔드포인트 설계를 통한 다양한 AI Agent Framework와의 신속한 통합 구조 확보
  • 에이전트의 Lifecycle 상태(Processing, Idle 등)를 애니메이션과 동기화하여 시스템 상태의 시각적 피드백 제공
  • 8~15초 주기 기반의 무작위 Idle 애니메이션 사이클링을 통한 존재감 부여 및 정적 상태 탈피

- 시각적 전환 시 Double-buffer crossfade 적용을 통한 UI 깜빡임 방지 검토 - 정적 규칙(Rule-based) 대신 LLM의 컨텍스트 판단에 따른 상태 제어 설계 도입 - Chroma Key 제거 후 Edge Feathering 처리를 통한 투명 배경 이미지의 자연스러운 합성 품질 확보 - 기능 확장성을 위해 내부 상태 제어를 단순화된 HTTP/JSON API 형태로 추상화

원문 읽기