피드로 돌아가기
The RegisterAI/ML
원문 읽기
Microsoft, 음성·이미지 AI 모델 3종 출시로 OpenAI 투자자에서 경쟁사로 전환함
Microsoft shivs OpenAI with three new AI models for speech and images
AI 요약
Context
Microsoft가 OpenAI에 약 1350억 달러 규모의 투자를 유지하면서도 직접 경쟁자로 나서고 있음. AI 하이프 리더인 OpenAI는 올해 140억 달러 손실이 예상되며 구조 조정이 진행 중임.
Technical Solution
- MAI-Transcribe-1: 25개 언어 음성 인식 모델로 주요 대안 대비 GPU 비용 약 50% 절감함
- MAI-Voice-1: 단일 GPU에서 1초 미만으로 60초 오디오 생성하는 음성 합성 모델임
- MAI-Image-2: 텍스트 프롬프트 기반 이미지 생성 모델임
- Azure AI Foundry 플랫폼을 통해 독점 제공하고 Copilot, Bing, PowerPoint 등 자사 제품에 이미 적용함
- Azure Speech 서비스에서 MAI-Transcribe-1과 MAI-Voice-1 평가판 제공함
Impact
Copilot Audio Expressions에 MAI-Voice-1 적용됨. Copilot Voice Mode 전사 서비스에 MAI-Transcribe-1 적용됨.
Key Takeaway
대규모 클라우드 플랫폼은 외부 AI 공급업체 의존도를 줄이기 위해 자체 모델을 내부 제품에 먼저 적용 후 외부 개발자에게 제공하는 전략을 활용함.
실천 포인트
기업용 AI 통합을 구축할 때 자사 제품에서 검증된 모델을 Foundry 같은 개발 플랫폼을 통해 외부에 제공하면 외부 공급업체 의존도를 줄이고 운영 통제력을 확보할 수 있음.