피드로 돌아가기
GeekNewsAI/ML
원문 읽기
Show GN: Whispree - 한국어 개발자를 위한 STT + LLM 교정 음성 입력 macOS 앱
STT와 LLM 교정 레이어로 구현한 고정밀 한국어 음성 입력 도구
AI 요약
Context
한국어 전용 STT 부재로 인한 낮은 전사 인식률 문제. 로컬 STT 및 LLM 구성 시 발생하는 심각한 응답 속도 저하 한계.
Technical Solution
- [STT] → Groq API 및 WhisperKit 기반의 하이브리드 전사 구조
- [Correction] → LLM 교정 레이어를 통한 기술 용어 및 문맥 최적화 방식
- [Context] → 화면 캡처 기반의 Visual Context 프롬프트 주입 설계
- [User Experience] → 핫키 기반의 단어 사전 등록 및 커서 위치 자동 삽입 기능
- [Architecture] → Swift 기반 macOS 전용 앱 구조
Impact
- 타이핑 대비 3~5배 빠른 입력 속도
Key Takeaway
단순 전사(STT) 결과물에 LLM 교정 레이어를 추가하여 도메인 특화 인식률을 비약적으로 향상시킨 설계 전략.
실천 포인트
특정 도메인 용어 인식률이 낮은 STT 도입 시, 후처리 LLM 레이어를 구성하여 컨텍스트 기반 교정 프로세스를 구축할 것