피드로 돌아가기
카카오 기술블로그AI/ML
원문 읽기
Kanana-o 신규 모델 및 API 베타 서비스를 공개합니다.
카카오가 Kanana-1.5-o-9.8b-2602 옴니 모델을 API 베타 서비스로 공개해 한국어 특화 멀티모달 AI 기능 검증 시작
AI 요약
Context
기존 AI 모델들은 한국어와 한국적 맥락 이해에 깊이가 부족했으며, 텍스트만 처리하거나 멀티모달 기능이 제한적이었다. 개발자들이 한국어 최적화 옴니 모델을 실제로 검증할 수 있는 통로가 필요했다.
Technical Solution
- Kanana-1.5-o-9.8b-2602 옴니 모델 개발: 텍스트, 이미지, 오디오를 동시에 이해하고 처리하는 통합 멀티모달 언어 모델 구현
- 한국어 특화 기능: 한국어 이해, 자연스러운 발화, 한국 문화적 맥락 해석 능력 탑재
- 감정 표현 강화: 억양, 속도, 감정 등 화자의 특성을 반영한 자연스러운 한국어 발화 제공
- 다양한 애플리케이션 지원: 팟캐스트 발화, 멀티턴 대화 시나리오, 다중 화자 대화 TTS 등 여러 사용 사례 대응
- 클로즈드 베타 테스트 체계: 2026년 2월 27일부터 5월 27일까지 선정된 개발자에게 일일 제한 횟수의 API 접근 제공
Key Takeaway
신기술 검증 단계에서는 대규모 트래픽 처리보다 구체적인 사용 시나리오와 기술적 구현 계획을 제시하는 개발자를 선발하는 것이 더 높은 품질의 피드백을 확보할 수 있다.
실천 포인트
멀티모달 AI 모델을 개발하는 팀에서 한국어 최적화 모델 공개 시 클로즈드 베타 프로그램 신청 양식에 '구체적 비즈니스 폼(소속, 사용 목적, 예상 시나리오)' 요구 조건을 포함하면 실제 구현 가능한 사용 사례 기반의 신뢰할 수 있는 피드백을 수집할 수 있다.