피드로 돌아가기
GeekNewsFrontend
원문 읽기
Show GN: Ghostmeet - 셀프호스팅 AI 미팅 비서 (실시간 자막 + 요약, Chrome 확장)
Ghostmeet이 Chrome 확장 + Whisper + FastAPI 조합으로 브라우저 미팅에서 오디오 외부 전송 없이 실시간 자막 및 AI 요약 제공
AI 요약
Context
Google Meet, Zoom, Teams 등의 미팅 중 실시간 자막과 AI 요약이 필요하지만, 오디오 데이터를 외부 서버로 전송하는 것이 개인정보 보호 관점에서 부담스러웠다.
Technical Solution
- Chrome 사이드 패널 확장으로 구현: tabCapture API를 통해 브라우저 미팅 오디오 캡처
- Whisper 모델로 실시간 자막 생성: 10초 단위로 오디오를 처리하여 자막 업데이트
- Python + FastAPI 백엔드 구성: 로컬 서버에서 Whisper 및 오디오 처리 로직 실행
- Claude API 통합 (선택사항): 생성된 텍스트에서 핵심 결정사항과 액션 아이템 자동 추출
- Docker Compose 기반 배포: docker compose up -d 한 명령으로 전체 시스템 시작
Key Takeaway
브라우저 미팅 데이터를 로컬에서만 처리하는 Chrome 확장 + 로컬 FastAPI 서버 조합은 사용자 프라이버시를 보호하면서도 실시간 AI 기능을 제공할 수 있는 실용적인 아키텍처 패턴을 제시한다.
실천 포인트
Whisper와 같은 오픈소스 음성 인식 모델을 로컬 환경에서 구동하는 Chrome 확장을 개발할 때, tabCapture API로 미팅 오디오를 캡처하고 FastAPI 백엔드에서 처리하면 외부 API 호출 없이 실시간 자막 및 요약 기능을 10초 단위 레이턴시로 구현할 수 있다.