피드로 돌아가기
Dev.toAI/ML
원문 읽기
Preprocessing 최적화로 CIFAR-10 정확도를 65%에서 87%로 개선
When Preprocessing Helps-and When It Hurts: Why Your Image Classification Model's Accuracy Varies So Much
AI 요약
Context
이미지 분류 모델 설계 시 아키텍처와 하이퍼파라미터에 치중하여 입력 데이터 준비 과정의 영향력을 간과하는 경향 존재. Raw Pixel 데이터를 그대로 사용할 경우 Gradient 불안정성과 모델의 단순 암기 현상으로 인한 Generalization 성능 저하 발생.
Technical Solution
- Pixel Scaling을 통한 0-1 범위 Normalization으로 Exploding Gradient 방지 및 가중치 수렴 속도 향상
- Data Augmentation(Flips, Rotations) 도입을 통해 특정 픽셀 위치 암기가 아닌 객체 고유 Feature 학습 유도
- RGB 채널별 분포 차이를 제거하는 Standardization 적용으로 특정 색상 및 밝기에 편향되지 않는 예측 체계 구축
- 입력 텐서 크기를 32323으로 고정하는 Dimensionality 정렬을 통해 CNN 내부 Matrix Multiplication의 수학적 정합성 확보
- 단순 CNN 구조에 전처리 전략과 아키텍처 개선을 결합하여 데이터-모델 간 정렬(Alignment) 최적화
실천 포인트
- 데이터 스케일링 부재 시 Exploding Gradient 발생 여부 확인 - 모델이 훈련 데이터의 위치 정보를 암기하는지 확인 후 Data Augmentation 적용 - 입력 피처 간 분포 차이가 클 경우 Standardization을 통한 기여도 균등화 검토 - 입력 텐서의 Dimensionality가 네트워크 레이어 구조와 수학적으로 일치하는지 검증