피드로 돌아가기
How I Digitized Years of Home Videos and Photos with Immich
Dev.toDev.to
Infrastructure

20년치 아날로그 미디어의 AI 자동화 디지털 파이프라인 구축기

How I Digitized Years of Home Videos and Photos with Immich

Max Wheeler2026년 4월 5일12intermediate

Context

아날로그 테이프와 인쇄 사진 등 파편화된 구형 미디어의 손실 위험 존재. iCloud 저장 용량 부족 및 데이터 소유권 제어의 한계 발생. 통합 검색과 관리가 가능한 자가 호스팅 라이브러리 필요성 증대.

Technical Solution

  • Synology NAS 기반 Docker 환경에 Immich를 구축하고 외부 라이브러리 기능을 활용한 파일 시스템 구조 유지
  • MiniDV 테이프의 디지털 스트림 무손실 캡처를 위해 FireWire-Thunderbolt-USB-C 체인 어댑터 구성 및 OBS Studio 활용
  • PySceneDetect의 ContentDetector를 이용해 픽셀 차이 기반의 하드 컷을 감지하고 씬 단위로 자동 분할하는 파이프라인 설계
  • Claude API를 연동하여 분할된 영상 씬별 장면 묘사 텍스트를 생성하고 이를 메타데이터로 변환하는 AI 워크플로우 구현
  • exiftool을 활용해 ImageDescription 및 XMP:Description 필드에 AI 생성 설명을 기록하여 Immich 내 검색 가능성 확보
  • AWS S3 Glacier Deep Archive를 활용한 오프사이트 백업 전략으로 재해 복구 체계 구축

Impact

  • S3 Glacier Deep Archive 이용 시 TB당 월 약 $1의 저렴한 저장 비용 달성
  • MiniDV 60분 분량 테이프당 약 3GB의 MOV 파일 생성
  • 씬 감지 임계값 45, 최소 씬 길이 20초 설정으로 브라우징 최적화

Key Takeaway

데이터의 가치는 단순 저장이 아닌 정확한 메타데이터 주입 단계에서 결정됨. 특히 AI 기반의 정형화된 설명 추가는 대규모 비정형 데이터의 검색 효율성을 극대화하는 핵심 전략임.


대규모 미디어 마이그레이션 시 SMB 네트워크 쓰기 부하를 줄이기 위해 로컬 스테이징 후 배치 전송 방식을 적용할 것

원문 읽기