피드로 돌아가기
Dev.toAI/ML
원문 읽기
Pixel-space 규칙 기반 처리에서 Learned Prediction 기반 AI SR 구조로의 전환
What's Actually Happening When AI "Enhances" a Video
AI 요약
Context
Laplacian Kernel이나 Bicubic Interpolation 등 수동 규칙 기반의 Pixel-space 처리 방식 채택. 콘텐츠 문맥을 이해하지 못하는 단순 연산으로 인한 Halo 현상 및 텍스처 뭉개짐 발생.
Technical Solution
- CNN 및 Transformer 기반 아키텍처 도입을 통한 Low-quality/High-quality 페어 데이터 매핑 학습
- 단순 보간법 대신 Learned Priors를 활용하여 고주파수 디테일을 생성하는 Super-Resolution(SR) 구조 설계
- Optical Flow Estimation을 통한 프레임 간 Motion Vector 계산 및 중간 프레임 합성 기반의 Frame Interpolation 구현
- 모델의 추론 부하를 고려하여 Client-side가 아닌 Server-side Inference 및 Progress Streaming 아키텍처 채택
- 고압축 영상의 Blocking Artifact 제거를 위한 전처리 파이프라인 선행 배치
실천 포인트
1. 원본 데이터의 Signal 손실 정도에 따른 SR 모델 적용 가능 여부 검토
2. 고해상도 추론 시 발생하는 Latency 해결을 위한 Server-side 배치 및 스트리밍 구조 설계
3. Frame Interpolation 적용 시 Scene Cut 감지 로직을 통한 Artifact 방지 구현
4. 단순 Upscaling과 Generative Detail 생성의 차이를 인지한 데이터 정합성 검증