텍스트-to-스피치 분야에서 고품질 오픈 모델로 경쟁 가속… “개발자 중심 AI” 선언

프랑스 AI 스타트업 Mistral AI가 2026년 3월 26일(현지시간) 새로운 오픈소스 음성 생성 모델 ‘Mistral Speech’를 공식 출시했다. 이 모델은 기존 상용 TTS(Text-to-Speech) 모델(Google TTS, ElevenLabs, OpenAI TTS 등) 대비 음성 품질과 자연스러움에서 동등하거나 뛰어나면서도 완전 오픈소스로 공개되어 개발자·기업들의 즉각적인 커스터마이징이 가능하다.
Mistral은 모델 가중치, 코드, 학습 데이터셋 구성까지 GitHub에 공개했으며, Hugging Face와 연동해 누구나 1클릭으로 로컬·클라우드에서 실행할 수 있도록 지원한다. 특히 다국어(한국어 포함 30개 이상 언어) 지원과 감정·억양·속도 제어 기능이 대폭 강화되어, 실시간 음성 AI 에이전트, 팟캐스트 자동 생성, 게임 NPC 대사, 교육 콘텐츠 제작 등 다양한 분야에서 즉시 활용될 전망이다.
Mistral CEO Arthur Mensch는 출시 발표에서 “우리는 폐쇄형 상용 모델이 독점하는 음성 AI 시장을 열어젖히기 위해 이번 모델을 만들었다. 개발자들이 자유롭게 수정하고 개선할 수 있어야 진정한 혁신이 일어난다”고 밝혔다. 업계에서는 이번 발표를 ‘오픈소스 진영의 멀티모달 반격’으로 평가하고 있다. 기존 Llama 시리즈가 텍스트 중심이었다면, Mistral Speech는 음성·텍스트 통합 멀티모달 시대를 본격적으로 열었다는 분석이다.
이미 여러 스타트업과 연구팀이 모델을 포크해 한국어 억양 최적화 버전을 만들고 있으며, 오픈소스 커뮤니티에서 하루 만에 1,200개 이상의 이슈와 PR이 등록되는 등 폭발적인 반응을 보이고 있다.
출처: TechCrunch (2026.03.26)
'IT' 카테고리의 다른 글
| Mistral, 기업용 커스텀 AI 플랫폼 ‘Forge’ 출시 (0) | 2026.03.25 |
|---|---|
| Google Stitch AI, 디자인·건축 분야 대격변 일으켜 (0) | 2026.03.25 |
| OpenAI, AI 비디오 플랫폼 Sora 공식 중단 발표 (0) | 2026.03.25 |
| OpenAI, Pentagon 계약으로 ChatGPT 대규모 사용자 이탈 (0) | 2026.03.24 |
| 과학기술정보통신부, '전 국민 AI 일상화 및 역량 강화 대책' 발표 (0) | 2026.03.11 |