피드로 돌아가기
Dev.toAI/ML
원문 읽기
Skinive가 수백만 실사용자 이미지로 AI 스킨 분석 모델을 개선하며 얻은 검증-set 고정, 데이터 품질 우선, 전처리 파이프라인 최적화 운영 교훈
We Trained a Skin analysis AI Model on Millions of Real Photos — What Actually Works in Production
AI 요약
Context
기존 스킨 분석 AI 시스템은 임상 데이터가 아닌 스마트폰 사용자가 촬영한 노이즈가 많은 이미지로 운영되며, 수백만 장의 이미지 중 정제된 수십만 장만 학습에 사용했다. 모델 성능 추적을 위해 약 27,000장의 검증-set을 고정하여 사용했다.
Technical Solution
- 검증-set 고정을 통해 테스트 데이터 편의 없이 모델 실제 개선만 측정
- 전체 수백만 장보다 정제된 수십만 장 데이터셋이 더 높은 학습 효율 제공
- 이미지 전처리 파이프라인 구축으로 원본 입력의 30~40%를 필터링
- YOLO 기반 경량 객체 탐지기로 영역 자동 인식 및 크롭 처리
- 스킨 포함 여부 판별 후 관련 없는 이미지는 재촬영 요청
- 경계 사례에 대해서는 노이즈 제거, 선명화, 대비 조정 후 처리
- 전체 이미지 대신 탐지 기반 접근 방식으로 관심 영역 집중 분석
- 민감도뿐 아니라 정밀도 균형 조정을 통해 신뢰도 향상 추구
Impact
전처리 개선만으로 모델 변경 없이 시스템 전체 신뢰도 크게 향상됨
Key Takeaway
사전 정의된 검증-set으로 측정 일관성 유지, 데이터 품질과 양 균형 맞추기, 입력 데이터 표준화가 모델 자체 개선보다 먼저 고려되어야 한다.
실천 포인트
모바일 기반 이미지 인식 시스템에서 노이즈 많은 사용자 입력 처리 시 YOLO 기반 전처리 파이프라인으로 영역 탐지 및 필터링을 적용하면 모델 변경 없이도 시스템 안정성을 크게 개선할 수 있다.