
Mistral, açık kaynaklı ilk ses modeli Voxtral’i tanıttı
Fransız yapay zeka girişimi Mistral, açık kaynaklı ilk ses modeli Voxtral‘i duyurdu. Konuşma verilerini anlamlandırma ve sesli komutlarla işlem yapma yeteneğine sahip model, hem bulut hem de uç cihazlara entegre edilebilecek şekilde geliştirildi. Voxtral, Mistral’in üretim ortamlarına uygun şekilde sunduğu ilk ses tabanlı yapay zeka çözümü olma özelliğini taşıyor.
Mistral, Voxtral’i iki farklı versiyonla piyasaya sundu: 24 milyar parametreli Voxtral Small, yüksek doğruluk ve semantik görevlerde güçlü performans sunarken; 3 milyar parametreli Voxtral Mini, özellikle maliyet ve kaynak kısıtı olan sistemlerde kullanılmak üzere optimize edildi. Her iki model de çok dilli destek sunuyor. İngilizce başta olmak üzere Fransızca, Almanca, İtalyanca, İspanyolca, Portekizce, Hollandaca ve Hintçe dillerinde yüksek performans gösteriyor.

Voxtral, sadece sesin yazıya dökülmesini değil, aynı zamanda ses üzerinden özet çıkarma, soru-cevap ve fonksiyon çağırma gibi ileri düzey görevleri de yerine getirebiliyor. Bu özellikler sayesinde kullanıcı sesli komutla API tetikleyebiliyor ya da sesli girdiye dayalı iş akışlarını başlatabiliyor. Mistral’in açıklamasına göre model, 30 dakikalık konuşmaları yüksek doğrulukla transkribe edebiliyor, 40 dakikaya kadar olan ses içeriklerinden ise anlam çıkarımı yapılabiliyor.
Mistral, bu modelleri hem açık kaynak kodlu olarak Hugging Face üzerinden yayınladı hem de API üzerinden kullanıma sundu. Transkripsiyon odaklı daha hafif bir sürüm olan Voxtral Mini Transcribe da geliştiricilere API aracılığıyla sunuluyor. Bu sürüm, OpenAI’ın Whisper modeliyle kıyaslandığında daha düşük birim maliyetlerle çalışıyor.
Voxtral, Mistral’in çok modlu modeller geliştirme stratejisinin bir parçası. Şirket, Voxtral’i Mistral Small 3.1 dil modeliyle entegre ederek sesli girdileri metne dönüştürmenin ötesine geçiyor. Voxtral, şirketin sohbet botu Le Chat üzerinde de test edilebiliyor.
Mistral, 6 Ağustos’ta Inworld ile birlikte düzenleyeceği bir etkinlikte Voxtral’in kullanım senaryolarını canlı demolarla tanıtacak.