피드로 돌아가기
Supertonic 3 - 초경량 온디바이스 TTS 출시, 31개 언어 및 감정 태그 지원
GeekNewsGeekNews
AI/ML

Supertonic 3 - 초경량 온디바이스 TTS 출시, 31개 언어 및 감정 태그 지원

99M Parameters 기반 31개 언어 지원 초경량 On-device TTS 구현

rbynddd2026년 5월 15일1intermediate

Context

기존 TTS 시스템의 네트워크 의존성으로 인한 Latency 발생 및 데이터 프라이버시 노출 문제 분석. 고성능 모델의 거대한 파라미터 크기로 인한 엣지 디바이스 배포 제약 해결 필요.

Technical Solution

  • 99M Parameters 규모의 경량 모델 설계를 통한 On-device 추론 환경 구축
  • , 등 10종의 Emotion Tag 삽입을 통한 음성 표현력 제어 로직 구현
  • 발음 정확도 향상 및 단어 반복/생략 방지를 위한 모델 최적화 수행
  • Browser, PC, Mobile, Raspberry Pi를 아우르는 멀티 플랫폼 런타임 지원
  • OpenRAIL-M 라이선스 적용을 통한 상업적 활용 가능성 확보

Impact

  • 99M Parameters의 초경량 모델 크기 달성
  • 31개 언어 및 10종의 감정 태그 지원 가능

Key Takeaway

모델 파라미터 최적화를 통한 On-device 전환으로 Network Latency 제거 및 Privacy 보안 강화 달성


1. 엣지 디바이스 배포를 위한 모델 파라미터 수치 최적화 검토

2. 단순 텍스트-음성 변환을 넘어선 Emotion Tag 기반의 제어 인터페이스 설계

3. Raspberry Pi 등 저사양 하드웨어에서의 추론 성능 벤치마크 수행

원문 읽기