Gelisiyorum.com | Blog

Amazon Nova Sonic Ses Modelini Duyurdu

09.04.2025
37
Amazon Nova Sonic Ses Modelini Duyurdu

Amazon Nova Sonic

Amazon, geliştiricilerin gerçek zamanlı, insan benzeri sesli konuşmalar içeren uygulamalar oluşturmasını sağlayan Nova Sonic adlı konuşmadan konuşmaya modelini duyurdu. Amazon, bu yeni ses modelinin sektör lideri fiyat performansı ve düşük gecikme süresi sunduğunu iddia ediyor.

Amazon Nova Sonic Özellikleri

Nova Sonic, anlama ve ses oluşturma yeteneklerini tek bir modelde birleştirerek önemli bir zorluğun üstesinden geliyor. Genellikle, sesle etkinleştirilen bir uygulama geliştirmek geliştiricilerin konuşmayı metne dönüştürmek için bir konuşma tanıma modeli, yanıtları anlamak ve oluşturmak için büyük dil modelleri ve metni tekrar sese dönüştürmek için bir metinden konuşmaya modeli gibi birden fazla modelle çalışmasını gerektiriyor. Bu yaklaşım karmaşıklığının yanı sıra aynı zamanda ton, prozodi ve konuşma stili gibi önemli akustik bağlamı ve nüansları yakalamada da başarısız oluyor.

Bu entegre yaklaşım, modelin tonu, stili ve konuşulan girdiyi kavramasını sağlayarak daha doğal bir diyalog sağlıyor. Ayrıca bu yaklaşım yanıt vermek için uygun zamanı belirleyebilir ve kesintileri (araya girmeleri) daha iyi idare edebilir.

Nova Sonic, Amerikan ve İngiliz aksanları da dahil olmak üzere çeşitli İngilizce aksanlarında hem erkeksi hem de kadınsı seslere destek veriyor. Geliştiriciler, işlev çağrısı desteğiyle çift yönlü bir akış API’si aracılığıyla Amazon Bedrock üzerinden modele erişebiliyor. Ayrıca içerik denetimi ve filigranlama gibi yerleşik korumalar da mevcut.

Reklam

Amazon geçtiğimiz gün ise 2 dakikalık videolar üretebilen Nova Reel 1.1 modelini tanıtmıştı.

Kaynak

BİR YORUM YAZIN

ZİYARETÇİ YORUMLARI - 0 YORUM

Henüz yorum yapılmamış.

Gelisiyorum.com | Görsel Eğitim Akademisi!