Microsoft VibeVoice로 3B TTS와 9B ASR 모델을 로컬 실행하여 90분 오디오 생성 및 50개 언어 음성 인식이 가능함
ما هو Microsoft VibeVoice؟ وكيفية استخدام نماذج الذكاء الاصطناعي الصوتية مفتوحة المصدر
ما هو Microsoft VibeVoice؟ وكيفية استخدام نماذج الذكاء الاصطناعي الصوتية مفتوحة المصدر