Gelisiyorum.com | Blog

Microsoft’un kendi yapay zekası: MAI neler vadediyor?

03.09.2025
26
Microsoft’un kendi yapay zekası: MAI neler vadediyor?

Yazılım devi Microsoft, kısa süre öncesinde şirket bünyesinde geliştirdiği ilk yapay zeka modellerini tanıtmıştı. Şirket içi ekiplerin tasarladığı Microsoft AI (MAI) ailesinde ilk olarak iki model boy gösterecek: MAI-Voice-1 ve MAI-1-preview.

Bu yalnızca teknik bir dönüm noktası değil, aynı zamanda stratejik bir bağımsızlık bildirgesi niteliğinde. Yıllardır Microsoft, Copilot gibi yenilikleri desteklemek için OpenAI ile olan ortaklığına güveniyordu. Redmond merkezli dev, yeni modelleriyle kendi kendine yeterliliğe doğru cesur bir dönüş sinyali veriyor.

MAI bölümünün liderliğini DeepMind ve Inflection AI’da görev yapmış olan CEO Mustafa Suleyman yürütmekte. Microsoft AI departmanı verimliliği artırmak ve şirketin AI ekosistemindeki rolünü yeniden şekillendirmek için tasarlanmış, amaca yönelik AI sistemleri geliştirmek üzere çalışıyor.

Şirket, yeni MAI-Voice-1 konuşma modelinin tek bir GPU ile bir saniyeden daha kısa sürede bir dakikalık ses üretebileceğini, MAI-1-preview’in ise “Copilot’un gelecekteki özelliklerine bir bakış sunduğunu” belirtiyor. Özetle MAI–Voice-1, şirketin ilk doğal konuşma üretme modeli. MAI-1-preview’e gelince, metin tabanlı bir model ve baştan sona eğitilen ilk temel model.

Reklam

Microsoft’un AI yolculuğu

Microsoft’un AI yolculuğu ayrı bir işbirliği ve yatırım hikayesi oldu. 2019’dan bu yana şirket, OpenAI’a milyarlarca dolar yatırım yaparak GPT modellerini Azure, Office 365 ve Windows gibi ürünlere entegre etmişti. Yapılan büyük yatırımlar, şu anda dünya çapında bir milyardan fazla kullanıcıya yardımcı olan Microsoft’un AI asistanı Copilot’un patlayıcı yükselişine büyük destek sağladı.

Ancak Microsoft gibi hiper ölçekli şirketlerin veri merkezlerine her çeyrekte on milyarlarca dolar harcaması sürdürülebilir değil. Kullanıcı sayısının yanı sıra yüksek hesaplama gücü ihtiyaçlarıyla birlikte yapay zeka maliyetleri çok arttı. Bunun yanı sıra, böylesine büyük şirketler için dış ortaklara bağımlılık riskler doğurmakta.

Büyük teknoloji tekellerine yönelik düzenleyici denetimler yoğunlaşırken, Microsoft-OpenAI ilişkisinde gerginlik olduğuna dair söylentiler giderek artıyordu. Salesforce CEO’su Marc Benioff, geçen yıl Microsoft’un gelecekte OpenAI’dan tamamen vazgeçebileceğini öngörüyordu.

Şirketin Microsoft AI kolu, Suleyman’ın liderliğinde 2024 yılında kurulmuştu. Bu bölümün misyonu, “herkes için uygun bir yapay zeka” yaratmak; aşırı bağımlılık yükü olmadan insanlığa hizmet eden, güvenilir sistemler.

  • MAI-Voice-1: Doğal sesler üreten, ifade gücü yüksek bir konuşma üretme modeli. Copilot üzerinden denenebilir.
  • MAI-1-preview: Microsoft’un uçtan uca eğittiği ilk tescilli metin temel modeli. İlk olarak sadece LM Arena üzerinden erişilebilecek, daha sonra entegrasyonlar başlayacak.

Suleyman, lansmanın ardından Semafor’a verdiği röportajda “Biz dünyanın en büyük şirketlerinden biriyiz. Dünyanın en güçlü modellerini yaratmak için şirket içinde uzmanlığa sahip olmalıyız” dedi. MAI-Voice-1 ve MAI-1-preview’un tanıtımı, üçüncü tarafların katılımı olmadan tamamen şirket içinde eğitilen bu vizyonun ilk meyvelerini temsil ediyor. İlk modeller, minimum kaynakla performansı en üst düzeye çıkarmak için açık kaynaklı tekniklerden yararlanarak verimliliğe, tüketici deneyimine ve etik önlemlere odaklanıyor.

Standart yapay zeka: MAI-1-Preview

MAI-1-preview, Microsoft’un ilk uçtan uca eğitilmiş temel modeli olacak. Yani talimatları takip etmek ve günlük sorgulara yanıtlar vermek için optimize edilmiş bir mixture-of-experts (MoE, uzman karışımı) büyük dil modeli (LLM).

Token başına tüm parametreleri etkinleştiren yoğun modellerin aksine, MoE mimarisi görevleri “uzmanlara (expert)” yönlendirerek hesaplama ihtiyaçlarını azaltırken kapasiteyi ölçeklendirebiliyor. Yaklaşık 15.000 H100 GPU’da (300 milyon doları aşan bir yatırım) eğitilmiş ve eğitim sonrası işlemlerden geçirilmiş olan bu model, Microsoft’un veri küratörlüğü becerisinin bir sonucu: “Mükemmel verilere” odaklanarak, düşük değerli token’larla gereksiz eğitimden kaçınan bir yapı.

MAI-1-preview, metin iş yüklerinde genel sıralamada 13. sırada yer alıyor ve Anthropic Claude, Google Gemini ve OpenAI GPT-5 gibi önde modellerin gerisinde. Ancak tekrarlayan (çok turlu) konuşmalarda, uzun bağlamlı muhakemede ve uyum (daha az halüsinasyon) konusunda üstünlük gösteriyor.

MMLU (%78) gibi benchmark platformlarında rekabetçi bir puan elde ediyor, ayrıca kod sorunlarını giderme veya belgeleri özetleme gibi pratik görevlerde parlıyor. Bu model şu an için doğrudan tüketici odaklı ve geniş kullanım için ileri matematik gibi niş alanlara öncelik vermiyor.

Microsoft, diğer özel modellerle birlikte çalıştırarak sorguları en iyi sonuçlar için “doğru” araca yönlendirmeyi planlıyor. Gelecekteki yinelemeler, yeni GB200 kümesini (NVIDIA’nın Blackwell GPU’larını birleştiren) kullanarak daha da büyük sıçramalar vaat ediyor.

Özetle MAI-1 orta seviyede olan bir AI modeli. Yeni çıkış yaptığı için bunu normal karşılayabiliriz. Öte yandan, arkasında Microsoft gibi bir sermaye ve güç olduğunu unutmayalım. Zamanla modeller gelişecek ve sayıları da artacaktır. Bu modeller Copilot’u gerçek bir AI yardımcısı haline getirebilir, Windows, Teams ve diğer platformlarda sorunsuz bir deneyim için ses ve metin için entegrasyonlar yapılabilir.

Öte taraftan geliştiriciler, sağlık ve finans gibi sektörler için özel ince ayarları göz önünde bulundurarak API erişimi için erkenden başvurularda bulunmaya başladı.

İfade gücü yüksek, sesli yapay zeka: MAI-Voice-1

MAI-1-preview temel beyin ise, MAI-Voice-1 onu hayata geçiren ses gibi. Microsoft tarafından “ilk yüksek ifade gücü ve doğal konuşma üretme modeli” olarak tanımlanan MAI-Voice-1, “geleceğin arayüzü” olan sesle çalışan yapay zeka yardımcıları için tasarlandı.

Peki onu diğerlerinden ayıran ne? Hızı ve gerçekçiliği. Ses modeli, tek bir GPU kullanarak bir saniyeden daha kısa sürede bir dakikalık yüksek kaliteli, ifade gücü yüksek ses üretebiliyor. Bu da MAI-Voice-1’i piyasadaki en verimli konuşma sentez sistemlerinden biri haline getiriyor.

Kısa süreler, gecikmenin uzun süredir bir darboğaz olduğu gerçek zamanlı uygulamalar için bir dönüm noktası. Teknik olarak MAI-Voice-1, yüksek verimli bir sinirsel vokoder ile eşleştirilmiş sıkı bir kod çözücüden yararlanarak çok dilli destek, çeşitli aksanlar, duygular ve stiller sunabiliyor. Tek konuşmacıya sahip anlatımların yanı sıra podcast tarzı tartışmalar veya etkileşimli hikaye anlatımı gibi çok konuşmacılı senaryoları da işleyebiliyor.

Copilot Labs’in ilk demoları sistemin çok yönlülüğünü göstermekte: Kullanıcılar “kendi maceranı seç” hikayesi başlatabiliyor, uyku için özel rehberli meditasyon hazırlayabiliyor veya özelleştirilebilir seslerle kişiselleştirilmiş haber özetleri oluşturabiliyor.

Uzun lafın kısası, Copilat’a veya diğer araçlara bir metin yapıştırarak hiç ummadığınız kalitede sesli sonuçlar üretebileceksiniz. Ayrıca çıktıları indirebilirsiniz. Bu da içerik üreticiler, sanatçılar, eğitimciler ve işletmeler için yeni fırsatlar demek. Üretim özelliklerine zaten entegre olan MAI-Voice-1, Copilot Daily (haberleri okuyan bir AI sunucusu) ve Copilot Podcasts (karmaşık konuları ilgi çekici sesli tartışmalara dönüştüren) desteğine sahip.

Microsoft’un ses odaklı yapak zekası, robotik sesler sunan aldatıcı metinden sese araçlar gibi değil. Duygusal zeka için tasarlanmış olup, doğal etkileşimleri teşvik etmek için insan nüanslarını taklit edebiliyor. Geliştirici Jonathan Padilla, Voice-1’i şimdiye kadar piyasaya sürülen “ifade gücü en yüksek doğal ses üretme modeli” olarak nitelendirerek düşük gecikmeli asistanlar için potansiyelini vurguladı.

Sesli yapay zeka, 2025 yılında sağlık hizmetleri (örneğin empatik hasta desteği), eğitim (etkileşimli öğrenme) ve eğlence (kişiselleştirilmiş sesli kitaplar) alanlarındaki uygulamalarla birlikte patlama yaşayabilir. MAI-Voice-1’in verimliliği, uç cihazların maliyetlerini önemli ölçüde azaltarak, arabalarda veya giyilebilir cihazlarda çevrimdışı çalışabilen akıllı asistanların kullanılmasını sağlayabilir.

Microsoft AI Nasıl Kullanılır?

Bahsettiğimiz gibi Microsoft, MA1-Voice-1’i halihazırda Copilot Daily gibi bazı özelliklerinde kullanıyor. Copilot Daily’de bir AI sunucusu günün en önemli haberlerini okuyor ve konuları açıklamaya yardımcı olmak için podcast tarzı tartışmalar oluşturuyor.

MA1-Voice-1’i Copilot Labs‘te deneyebilirsiniz. Burada AI modelinin söylemesini istediğiniz şeyi girebilir, sesini ve konuşma stilini değiştirebilirsiniz.

MAI-1-preview ise talimatları takip edebilen ve “günlük sorulara yararlı yanıtlar verebilen” bir AI modeline ihtiyaç duyan kullanıcılar için geliştirildi. Microsoft AI, şu anda OpenAI’ın büyük dil modellerine dayanan Copilot AI asistanında belirli metin kullanım durumları için MAI-1 önizlemesini kullanıma sunmayı planlıyor. Ayrıca, AI karşılaştırma platformu LMArena’da MAI-1 önizleme modelini halka açık olarak test etmeye başladılar.

Microsoft, blog gönderisinde “Gelecekte büyük hedeflerimiz var” diye yazıyor. “Burada daha fazla ilerleme kaydetmekle kalmayacak, farklı kullanıcı amaçlarına ve kullanım durumlarına hizmet eden bir dizi özel modeli koordine etmenin muazzam bir değer yaratacağına inanıyoruz.”

Kaynak

BİR YORUM YAZIN

ZİYARETÇİ YORUMLARI - 0 YORUM

Henüz yorum yapılmamış.

Gelisiyorum.com | Görsel Eğitim Akademisi!