피드로 돌아가기
Dev.toAI/ML
원문 읽기
Qwen3-VL 기반 AI 검증 도입을 통한 드라이버 승인 인건비 75% 절감
How AI Reduced Manual Driver Verification by 75% — Operations Case Study. Part 2
AI 요약
Context
사용자 직접 업로드 방식의 수동 검증 프로세스로 인한 리소스 병목 발생. 마케팅 캠페인 등 트래픽 급증 시 10인의 운영 인력으로 처리 불가능한 대기열 형성 및 드라이버 온보딩 지연 문제 직면.
Technical Solution
- Qwen3-VL-30B-A3B-Instruct-FP8 모델을 활용한 문서 및 차량 사진의 자동 교차 검증 구조 설계
- 단일 GPU 내 구동 가능한 FP8 양자화 모델 채택으로 인프라 비용 최적화 및 추론 효율 확보
- GoLang과 NATS FIFO Queue를 조합한 비동기 처리 아키텍처로 급증하는 검증 요청 부하 분산
- AI 검증 통과 후 실제 승객의 피드백을 통한 2차 검증(Cross-check) 루프 구축으로 오탐지 리스크 제어
- AI 판단 실패 또는 승객 신고 발생 시에만 휴먼 서포트 큐로 라우팅하는 예외 처리 파이프라인 구현
실천 포인트
1. 단일 GPU 내 최적 배치를 위한 양자화 모델(FP8 등) 검토
2. AI 오판 가능성을 상쇄할 수 있는 실사용자 기반의 피드백 루프 설계
3. 트래픽 변동성 대응을 위한 메시지 큐 기반의 비동기 처리 구조 적용