피드로 돌아가기
Fine-tuning YOLOv11 to detect stamps and signatures on banking documents - a practical walkthrough
Dev.toDev.to
AI/ML

YOLOv11 기반 문서 분석 최적화로 추론 속도 100ms 미만 달성

Fine-tuning YOLOv11 to detect stamps and signatures on banking documents - a practical walkthrough

Muhammad umair akram2026년 4월 30일8intermediate

Context

은행 문서 내 도장 및 서명 검출을 위해 기존 LayoutLMv3의 무거운 연산 비용과 OpenCV의 낮은 강건성 문제를 해결해야 하는 상황. 특히 스캔 품질 저하, 촬영 각도 다양성 등 실제 운영 환경의 비정형 데이터 처리 능력이 핵심 요구사항으로 작용.

Technical Solution

  • 추론 속도와 정밀도의 균형점 확보를 위해 YOLOv11m 모델 채택
  • 소형 객체 검출력 향상을 위해 입력 이미지 해상도를 640에서 1024px로 상향 조정
  • 문서 특성에 맞지 않는 Mosaic 및 Horizontal Flip 증강 기법을 제거하여 모델 오작동 방지
  • ±5° 이내의 제한적 Rotation과 Gaussian Blur, JPEG Noise를 도입하여 실제 모바일 촬영 환경의 데이터 분포를 모사
  • 학습/검증/테스트 셋 분리 시 랜덤 샘플링 대신 소스 기반 분리를 적용하여 템플릿 암기 현상 방지 및 일반화 성능 강화
  • GPU 의존성을 제거한 경량 배포 구조를 설계하여 기업 내 폐쇄망 환경의 배포 제약 사항 해결

- 문서 데이터 학습 시 Mosaic 및 Horizontal Flip 옵션 비활성화 여부 확인 - 소형 객체 검출 실패 시 imgsz 파라미터 상향 조정 검토 - mAP 지표보다 실제 비즈니스 요구사항에 맞는 Precision-Recall Operating Point 설정 - 데이터셋 분리 시 동일 템플릿이 Train/Val 셋에 중복 포함되었는지 검증

원문 읽기