피드로 돌아가기
NYTimes वीडियो स्ट्रीमिंग का विश्लेषण: HLS और FFmpeg के साथ एक हाई-परफॉर्मेंस एक्सट्रैक्शन इंजन का निर्माण
Dev.toDev.to
Backend

Asyncio와 FFmpeg Stream Copy 기반 고성능 HLS 추출 엔진 설계

NYTimes वीडियो स्ट्रीमिंग का विश्लेषण: HLS और FFmpeg के साथ एक हाई-परफॉर्मेंस एक्सट्रैक्शन इंजन का निर्माण

yqqwe2026년 4월 21일6advanced

Context

NYTimes의 HLS 기반 Dynamic Adaptive Delivery 구조로 인한 단순 파일 추출 불가능 상태 분석. 세그먼트 단위 분할 전송 및 복잡한 API 인증 체계로 인한 데이터 획득 병목 발생.

Technical Solution

  • .m3u8 Index Tree의 Recursive Parsing을 통한 최고 Bitrate 트랙 자동 식별 로직 구현
  • 브라우저 Handshake 시뮬레이션 및 Self-healing Session Pool 도입을 통한 Dynamic Token 인증 우회
  • Python Asyncio 및 Httpx 스택 채택으로 I/O-bound 작업의 동시성 처리 극대화 및 서버 오버헤드 감소
  • FFmpeg의 -c copy 플래그를 활용한 Lossless Muxing으로 재인코딩 없는 즉각적인 MP4 변환 처리
  • Vanilla JS 기반 Zero-bloat 프론트엔드 설계로 FCP 1초 미만의 빠른 초기 렌더링 달성

1. I/O Bound 작업 시 Synchronous 모델 대신 Asyncio 기반 비동기 스택 검토

2. 미디어 처리 시 Transcoding 대신 Stream Copying 가능 여부 확인을 통한 리소스 절감

3. 동적 인증 체계 대응을 위한 세션 풀링 및 핸드셰이크 자동화 로직 설계

원문 읽기