ν”Όλ“œλ‘œ λŒμ•„κ°€κΈ°
RealtimeSTT's 5 Hidden Uses πŸ”₯
Dev.toDev.to
AI/ML

VAD와 On-device 좔둠을 ν†΅ν•œ GPU μ‚¬μš©λŸ‰ 80% 절감 및 300ms μ €μ§€μ—° STT κ΅¬ν˜„

RealtimeSTT's 5 Hidden Uses πŸ”₯

韩2026λ…„ 5μ›” 19일6λΆ„intermediate

Context

κΈ°μ‘΄ STT κ΅¬ν˜„ λ°©μ‹μ˜ λ¬΄λΆ„λ³„ν•œ 연속 슀트리밍으둜 μΈν•œ GPU λ¦¬μ†ŒμŠ€ 낭비와 높은 μ „λ ₯ μ†ŒλΉ„ 문제 λ°œμƒ. λͺ¨λΈ μž¬λ‘œλ“œ μ‹œ λ°œμƒν•˜λŠ” 2~3초의 μ§€μ—° μ‹œκ°„ 및 λ¬Έμž₯ μ™„μ„± ν›„ κ²°κ³Όκ°€ 좜λ ₯λ˜λŠ” 높은 Latency ꡬ쑰의 ν•œκ³„ 쑴재.

Technical Solution

  • Silero VAD λ„μž…μ„ ν†΅ν•œ μŒμ„± ꡬ간 선택적 처리둜 무음 κ΅¬κ°„μ˜ Compute λ‚­λΉ„ 제거
  • return_times μ˜΅μ…˜ ν™œμ„±ν™”λ‘œ λ¬Έμž₯ λ‹¨μœ„ λŒ€κΈ° μ‹œκ°„μ„ μ œκ±°ν•œ Word-by-word 슀트리밍 μ•„ν‚€ν…μ²˜ 섀계
  • Porcupine 기반의 Lightweight Wake Word λͺ¨λΈμ„ 전면에 λ°°μΉ˜ν•˜μ—¬ 메인 νŒŒμ΄ν”„λΌμΈμ˜ Deep Sleep μ œμ–΄
  • λͺ¨λΈ μž¬λ‘œλ“œ μ—†λŠ” update_language λ©”μ„œλ“œ ν™œμš©μœΌλ‘œ λŸ°νƒ€μž„ 쀑 동적 μ–Έμ–΄ μŠ€μœ„μΉ­ κ΅¬ν˜„
  • ONNX ν”„λ ˆμž„μ›Œν¬ 기반의 Tiny λͺ¨λΈ μ΅œμ ν™” 및 μƒ˜ν”Œ 레이트 λ³€ν™˜ νŒŒμ΄ν”„λΌμΈμ„ ν†΅ν•œ 저사양 Edge Device 이식

- μƒμ‹œ λ¦¬μŠ€λ‹ μ„œλΉ„μŠ€ 섀계 μ‹œ VADλ₯Ό ν†΅ν•œ GPU/CPU Wake-up 둜직 κ²€ν†  - μ‹€μ‹œκ°„μ„± 확보λ₯Ό μœ„ν•΄ Sentence-level κ²°κ³Ό λŒ€κΈ° λŒ€μ‹  Word-level Timestamp 기반 UI μ—…λ°μ΄νŠΈ 적용 - 저사양 Edge μž₯λΉ„ 배포 μ‹œ ONNX 포맷 λ³€ν™˜ 및 Tiny λͺ¨λΈ 채택을 ν†΅ν•œ λ¦¬μ†ŒμŠ€ μ΅œμ ν™” μˆ˜ν–‰

원문 읽기