νΌλλ‘ λμκ°κΈ°
Dev.toAI/ML
μλ¬Έ μ½κΈ°
VADμ On-device μΆλ‘ μ ν΅ν GPU μ¬μ©λ 80% μ κ° λ° 300ms μ μ§μ° STT ꡬν
RealtimeSTT's 5 Hidden Uses π₯
AI μμ½
Context
κΈ°μ‘΄ STT ꡬν λ°©μμ 무λΆλ³ν μ°μ μ€νΈλ¦¬λ°μΌλ‘ μΈν GPU 리μμ€ λλΉμ λμ μ λ ₯ μλΉ λ¬Έμ λ°μ. λͺ¨λΈ μ¬λ‘λ μ λ°μνλ 2~3μ΄μ μ§μ° μκ° λ° λ¬Έμ₯ μμ± ν κ²°κ³Όκ° μΆλ ₯λλ λμ Latency ꡬ쑰μ νκ³ μ‘΄μ¬.
Technical Solution
- Silero VAD λμ μ ν΅ν μμ± κ΅¬κ° μ νμ μ²λ¦¬λ‘ 무μ ꡬκ°μ Compute λλΉ μ κ±°
- return_times μ΅μ νμ±νλ‘ λ¬Έμ₯ λ¨μ λκΈ° μκ°μ μ κ±°ν Word-by-word μ€νΈλ¦¬λ° μν€ν μ² μ€κ³
- Porcupine κΈ°λ°μ Lightweight Wake Word λͺ¨λΈμ μ λ©΄μ λ°°μΉνμ¬ λ©μΈ νμ΄νλΌμΈμ Deep Sleep μ μ΄
- λͺ¨λΈ μ¬λ‘λ μλ update_language λ©μλ νμ©μΌλ‘ λ°νμ μ€ λμ μΈμ΄ μ€μμΉ κ΅¬ν
- ONNX νλ μμν¬ κΈ°λ°μ Tiny λͺ¨λΈ μ΅μ ν λ° μν λ μ΄νΈ λ³ν νμ΄νλΌμΈμ ν΅ν μ μ¬μ Edge Device μ΄μ
μ€μ² ν¬μΈνΈ
- μμ 리μ€λ μλΉμ€ μ€κ³ μ VADλ₯Ό ν΅ν GPU/CPU Wake-up λ‘μ§ κ²ν - μ€μκ°μ± ν보λ₯Ό μν΄ Sentence-level κ²°κ³Ό λκΈ° λμ Word-level Timestamp κΈ°λ° UI μ λ°μ΄νΈ μ μ© - μ μ¬μ Edge μ₯λΉ λ°°ν¬ μ ONNX ν¬λ§· λ³ν λ° Tiny λͺ¨λΈ μ±νμ ν΅ν 리μμ€ μ΅μ ν μν