피드로 돌아가기
Show GN: vvrite — 오픈소스 macOS 온디바이스 AI 음성 타이핑 앱
GeekNewsGeekNews
AI/ML

Show GN: vvrite — 오픈소스 macOS 온디바이스 AI 음성 타이핑 앱

vvrite 개발자가 Qwen3-ASR 모델을 로컬에서 실행해 네트워크 레이턴시를 제거하고 클라우드 음성 인식 도구와 동일한 UX 제공

rayinclay2026년 3월 22일3intermediate

Context

superwhisper, spokenly 등 기존 음성 타이핑 도구는 클라우드 기반이라 네트워크 레이턴시가 발생했다. 8bitdo micro 게임패드 연결 방식도 별도의 하드웨어 장비를 필요로 했다.

Technical Solution

  • Qwen3-ASR 모델을 macOS 로컬 환경에서 온디바이스 실행: 클라우드 API 호출 제거
  • macOS 메뉴바 애플리케이션 아키텍처 채택: Option+Space 핫키로 즉시 녹음 시작
  • 녹음된 음성을 로컬 AI 모델로 인식 후 현재 입력창에 자동 텍스트 붙여넣기: 완전 자동화 워크플로우 구현
  • Apple Silicon Mac 기반 바이너리 배포: macOS 13 이상 지원
  • DMG 서명/공증 파일 형태로 GitHub Releases에 배포: 보안 및 설치 간소화

Impact

Qwen3-ASR 모델이 클라우드 모델과 동등한 성능을 제공하며 기기 성능에 따라 빠른 응답 속도와 낮은 메모리 점유율을 달성했다.

Key Takeaway

음성 처리 같은 실시간 인터랙션이 필요한 기능은 클라우드 API의 네트워크 레이턴시를 제거하기 위해 온디바이스 AI 모델 실행을 검토할 가치가 있다. 최신 로컬 모델의 성능이 충분하다면 사용자 경험과 개인정보 보호 양쪽을 동시에 개선할 수 있다.


macOS 데스크톱 애플리케이션을 개발하는 팀에서 Qwen3-ASR 같은 경량 온디바이스 AI 모델을 메뉴바 애플리케이션 형태로 통합하면 클라우드 API 호출로 인한 네트워크 지연을 완전히 제거하면서도 클라우드 기반 도구 수준의 음성 인식 정확도를 유지할 수 있다.

원문 읽기