피드로 돌아가기
Turn Your Bedroom into a Sleep Lab: Building an AI-Powered Sleep Apnea Screener with Whisper & FFT
Dev.toDev.to
AI/ML

Whisper VAD와 FFT 기반의 OSA 탐지 파이프라인 구축

Turn Your Bedroom into a Sleep Lab: Building an AI-Powered Sleep Apnea Screener with Whisper & FFT

Beck_Moulton2026년 6월 2일5intermediate

Context

고비용의 병원 기반 Polysomnography 검사로 인한 수면 무호흡증 진단 진입장벽 발생. 야간 오디오 데이터의 비정형성과 백색 소음으로 인해 정확한 호흡 패턴 추출에 어려움이 있는 상황.

Technical Solution

  • Whisper의 Voice Activity Detection(VAD) 로직을 활용한 인간 생성 소음과 배경 소음의 정밀 분리
  • 10초 이상의 호흡 공백을 탐지하는 Temporal Analysis 기반의 Apnea Event 마킹 설계
  • Fast Fourier Transform(FFT)을 통한 시간 도메인 신호를 주파수 도메인으로 변환하여 호흡 특성 분석
  • 500Hz 이하의 코골이 신호와 광대역의 Choke 사운드를 Spectral Centroid 수치로 구분하는 Frequency Analysis 구현
  • FastAPI 기반의 비동기 Ingestion 레이어를 통한 대용량 오디오 파일 처리 및 추론 결과 제공

- STFT 및 Spectral Centroid 분석을 통해 유사한 소음 내 특정 이벤트의 주파수 시그니처 식별 가능 여부 검토 - Whisper 모델을 단순 전사가 아닌 VAD 엔진으로 활용하여 정교한 Segment 분리 전략 수립 - 의료 데이터 처리 시 HIPAA 준수를 위한 인프라 격리 및 TensorRT 기반의 추론 최적화 고려

원문 읽기