피드로 돌아가기
Dev.toBackend
원문 읽기
EPUB-to-Audio 파이프라인의 Chapter 단위 격리를 통한 데이터 무결성 확보
Chapter-marker survival across the EPUB to multi-voice audio pipeline
AI 요약
Context
EPUB 파일의 비정형적인 내비게이션 구조와 오디오 플랫폼의 개별 파일 요구 사항 사이의 불일치 발생. 전체 도서를 단일 단위로 처리할 경우 수정 시 전체 재렌더링이 필요하며 데이터 정렬 오류가 누적되는 구조적 한계 존재.
Technical Solution
- EPUB 내비게이션 문서를 기준으로 Chapter를 최소 처리 단위로 정의하여 전체 파이프라인에 일관되게 투영
- Chapter별 독립적 소유권 모델을 설계하여 Speaker Map 및 Sound Annotation의 상태를 해당 Chapter 내에만 격리
- Global State 제거를 통해 특정 Chapter의 렌더링 수정이 타 Chapter에 영향을 주지 않는 무상태성(Stateless) 렌더링 구현
- EPUB의 불필요한 Front/Back matter를 사용자가 직접 필터링하여 최종 오디오 인덱스와 일치시키는 정제 프로세스 도입
- 렌더링 단위를 'One Chapter One File'로 고정하여 배포 플랫폼의 메타데이터 요구 사양과 1:1 매핑 구조 설계
실천 포인트
1. 데이터 파이프라인 설계 시 상위 단계의 데이터 모델이 하위 단계까지 변형 없이 전달되는 'Load-bearing' 단위가 정의되었는지 검토
2. 전체 리소스 재처리를 방지하기 위해 변경 영향 범위를 최소화하는 단위별 격리(Isolation) 전략 적용
3. 외부 입력 데이터(EPUB)의 불확실성을 처리하기 위해 자동화된 파싱 후 사용자가 최종 확정하는 'Human-in-the-loop' 정제 단계 배치