피드로 돌아가기
컬리 기술블로그AI/ML
원문 읽기
고객에게 뚜렷한 경험을: 컬리의 후기 이미지 처리 기술
컬리가 Laplacian 필터 기반 룰 알고리즘으로 CNN 모델을 대체하여 리뷰 이미지 흐림 탐지 정확도를 60%에서 90%로 개선
AI 요약
Context
컬리는 일일 3만 건 이상의 리뷰 이미지를 처리하며, 기존 Fourier 변환 기반 흐림 탐지 알고리즘이 과탐지로 인한 수동 검토 부담과 precision 0.6 수준의 낮은 정확도를 겪고 있었다.
Technical Solution
- Laplacian 필터를 통한 윤곽선 검출: RGB 컬러 이미지를 흑백 변환 후 Laplacian 필터 적용으로 경계선 추출
- 픽셀값 표준편차 기반 이진 분류: Laplacian 변환 후 이미지 픽셀값의 표준편차를 threshold 4에서 3.5로 설정하여 흐림 판정
- CNN 모델(BDNet) 실험 및 폐기: AlexNet 유사 구조의 BDNet을 PyTorch로 구현하여 학습하였으나, convolution과 pooling 과정의 정보손실로 인해 precision 0.75 수준에 머물러 룰 기반 접근으로 전환
- 인위적 학습 데이터 생성 및 검증: 뚜렷한 이미지에 5×5~99×99 크기의 Gaussian 블러 필터를 적용하여 학습 데이터 구성하고 실험용 이미지셋 확보
Impact
- Precision 60%에서 90%로 개선 (threshold 표준편차 3.5 적용 시)
- 검출된 이미지 중 실제 흐린 이미지 비율 90% 달성
Key Takeaway
이미지 분류 문제에서 CNN이 항상 최적의 해법은 아니며, 문제의 본질(흐린 이미지의 경계선 부재)을 파악한 후 간단한 필터 기반 룰 알고리즘으로 CNN보다 높은 정확도를 달성할 수 있다는 것을 보여준다.
실천 포인트
이미지 품질 판정이 필요한 전자상거래 플랫폼에서 CNN 도입을 검토할 때, 먼저 Laplacian 필터의 픽셀값 표준편차를 이용한 간단한 룰 기반 접근으로 baseline을 설정하고, 그 결과를 CNN 성능과 비교하여 투자 대비 효과를 검증하는 것이 효율적이다.