피드로 돌아가기
Dev.toAI/ML
원문 읽기
Local Whisper pipeline 구축을 통한 한국어 기술 용어 인식률 향상 및 데이터 보안 확보
Local Whisper pipeline beats paid Korean transcription services
AI 요약
Context
유료 STT 서비스인 Notta의 낮은 한국어 기술 용어 인식 정확도로 인한 수동 수정 비용 증가 발생. NDA 및 개인정보 보호법 준수를 위해 클라우드 전송이 불가능한 로컬 기반의 전사 시스템 요구.
실천 포인트
1. 기술 용어 비중이 높은 데이터셋의 경우 base/small 모델보다 large-v3 모델 검토
2. STT 인식률 향상을 위해 ffmpeg를 활용한 오디오 샘플 레이트 및 노이즈 전처리 수행
3. 가독성 확보를 위해 Whisper 출력값에 대한 문장 단위 re-chunking 로직 추가