피드로 돌아가기
Chapter-marker survival across the EPUB to multi-voice audio pipeline
Dev.toDev.to
Backend

EPUB-to-Audio 파이프라인의 Chapter 단위 격리를 통한 데이터 무결성 확보

Chapter-marker survival across the EPUB to multi-voice audio pipeline

AudioProducer.ai2026년 5월 27일7intermediate

Context

EPUB 파일의 비정형적인 내비게이션 구조와 오디오 플랫폼의 개별 파일 요구 사항 사이의 불일치 발생. 전체 도서를 단일 단위로 처리할 경우 수정 시 전체 재렌더링이 필요하며 데이터 정렬 오류가 누적되는 구조적 한계 존재.

Technical Solution

  • EPUB 내비게이션 문서를 기준으로 Chapter를 최소 처리 단위로 정의하여 전체 파이프라인에 일관되게 투영
  • Chapter별 독립적 소유권 모델을 설계하여 Speaker Map 및 Sound Annotation의 상태를 해당 Chapter 내에만 격리
  • Global State 제거를 통해 특정 Chapter의 렌더링 수정이 타 Chapter에 영향을 주지 않는 무상태성(Stateless) 렌더링 구현
  • EPUB의 불필요한 Front/Back matter를 사용자가 직접 필터링하여 최종 오디오 인덱스와 일치시키는 정제 프로세스 도입
  • 렌더링 단위를 'One Chapter One File'로 고정하여 배포 플랫폼의 메타데이터 요구 사양과 1:1 매핑 구조 설계

1. 데이터 파이프라인 설계 시 상위 단계의 데이터 모델이 하위 단계까지 변형 없이 전달되는 'Load-bearing' 단위가 정의되었는지 검토

2. 전체 리소스 재처리를 방지하기 위해 변경 영향 범위를 최소화하는 단위별 격리(Isolation) 전략 적용

3. 외부 입력 데이터(EPUB)의 불확실성을 처리하기 위해 자동화된 파싱 후 사용자가 최종 확정하는 'Human-in-the-loop' 정제 단계 배치

원문 읽기