Mobil Cihazlar için Google Gemma 3n Modeli Duyuruldu

27.06.2025

102

Mobil Cihazlar için Google Gemma 3n Modeli Duyuruldu

Google, Gemma 3n adı ile açık yapay zeka modellerinin yeni neslini duyurdu. Geçtiğimiz ay Google I/O 2025 etkinliğinde yapılan bir ön izlemenin ardından, tam sürüm artık doğrudan donanımlarla çalışmaya hazır.

Google Gemma 3n Özellikleri

Bilmeyenler için, Gemma bir açık yapay zeka modelleri ailesi. Gemini’den farkı ise geliştiricilerin indirip değiştirebilmesi için tasarlanmış olması. Gemini ise Google’ın kapalı, tescilli güç merkezi.

Model artık metin tabanlı bir model olmaktan çıkarak metin oluşturmak için görüntü, ses ve video gibi girdileri yerel olarak işleyebiliyor. Ek olarak, 2 GB kadar az belleğe sahip donanımlarda da çalışabiliyor ve kodlama veya akıl yürütme gibi görevlerde daha iyi olduğu varsayılıyor.

Google tarafından özetlenen iyileştirmelerin tam listesi şu şekilde:

Tasarım gereği çok modlu: Gemma 3n yerel olarak görüntü, ses, video ve metin girdilerini ve metin çıktılarını destekler.
Cihazda kullanım için optimize edildi: Verimliliğe odaklanılarak tasarlanan Gemma 3n modelleri, etkili parametrelere göre iki boyutta mevcuttur: E2B ve E4B. Ham parametre sayıları sırasıyla 5B ve 8B olsa da, mimari yenilikler, geleneksel 2B ve 4B modellerine benzer bir bellek ayak izinde, 2 GB (E2B) ve 3 GB (E4B) kadar az bellekle çalışmasını sağlar.
Çığır açan mimari: Gemma 3n, özünde hesaplama esnekliği için MatFormer mimarisi, bellek verimliliği için Katman Başına Gömme (PLE) ve cihazda kullanım durumları için optimize edilmiş yeni ses ve MobileNet-v5 tabanlı görüntü kodlayıcılar gibi yenilikçi bileşenlere sahiptir.
Gelişmiş kalite: Gemma 3n, çok dillilik (metin için 140 dili ve 35 dilin çok modlu anlaşılmasını destekler), matematik, kodlama ve muhakeme alanlarında kalite iyileştirmeleri sunar.

Verimliliğinin özü, Google’ın MatFormer adını verdiği yeni bir mimari olarak karşımıza çıkıyor. Google, bunu tanımlamak için Rus Matruşka bebeği benzetmesini kullanıyor: daha büyük bir model, içinde daha küçük ve tamamen işlevsel bir versiyon barındırıyor.

Bu, tek bir modelin farklı görevler için farklı boyutlarda çalışmasını sağlıyor. Karşılaştırmalar tarafında daha büyük E4B modeli, 10B parametreleri altında 1300’lük bir LMArena puanını aşan ilk model oldu.

Modelin ses yetenekleri artık konuşmayı ayrıntılı bir şekilde işleyebilen bir kodlayıcı kullanarak cihaz içi konuşmayı metne dönüştürme ve çeviriyi destekliyor. İşin görme tarafı, selefinden çok daha hızlı ve daha verimli olan MobileNet-V5 adlı yeni bir kodlayıcı tarafından destekleniyor. Bir Google Pixel cihazında 60 FPS’ye kadar video işleyebiliyor.

Modeller artık Hugging Face ve Kaggle gibi bilindik platformlar aracılığıyla mevcut olduğundan hemen kullanmaya başlayabilir ve hatta doğrudan Google AI Studio’da deneyebilirsiniz.

Kaynak

BİR YORUM YAZIN

[ Yoruma cevap yazmaktan vazgeç ]

ZİYARETÇİ YORUMLARI - 0 YORUM

Henüz yorum yapılmamış.