
Google’dan Yunusları Anlayan Yapay Zeka: DolphinGemma
Google, bilim insanlarının yunusların nasıl iletişim kurduğunu incelemelerine ve ne söylediklerini de bulmalarına yardımcı olmayı amaçlayan DolphinGemma adlı yeni bir büyük dil modelini (LLM) duyurdu.
Google, kurucusu Dr. Denise Herzing liderliğindeki Georgia Tech ve Wild Dolphin Project (WDP) araştırmacılarıyla birlikte çalışıyor. WDP’nin birincil görevi, “istilacı olmayan, uzun vadeli saha araştırmaları” yoluyla vahşi yunusların, özellikle de Atlantik benekli yunusunun (Stenella frontalis) doğal davranışlarını, sosyal yapılarını, iletişim kalıplarını ve yaşam alanlarını gözlemlemek, belgelemek ve raporlamak.
WDP, yıllar içinde belirli yunus seslerini davranışlarla ilişkilendirmesine olanak tanıyan veriler de toplamış durumda. Bunlar:
- Anne ve yavruların yeniden bir araya gelmeleri için kullanılabilen imza düdükleri (benzersiz isimler)
- Kavgalar sırasında sıklıkla görülen ani nabız “gıcırtıları”
- Kur yapma veya köpekbalıklarını kovalama sırasında sıklıkla kullanılan tıklama “vızıltıları”
Google’a göre yunusların doğal, karmaşık iletişimini analiz etmek çok büyük bir görev ve WDP’nin geniş, etiketli veri seti, son teknoloji yapay zeka için benzersiz bir fırsat sunuyor.
DolphinGemma tam da burada devreye giriyor ve Google tarafından WDP’nin veri seti üzerinde geliştirilen ve yunus seslendirmelerini daha yönetilebilir ses birimlerine ayırmak için Google’ın kendi SoundStream belirteçleyicisini kullanan bir yapay zeka modeli. Daha sonra bunlar karmaşık dizileri anlamlandırmak için tasarlanmış özel bir model mimarisinden geçiriliyor. Tüm kurulum yaklaşık 400 milyon parametrede oturuyor ve bu da onu WDP araştırmacılarının sahada yanlarında taşıdıkları Pixel telefonlarda yerel olarak çalışacak kadar hafif hale getiriyor.
Geleneksel makine öğrenme modellerinin aksine, DolphinGemma kelimelerle veya resimlerle ilgilenmiyor ve ses girişi ile ses çıkışına odaklanıyor. Model, doğal yunus seslendirmelerinin dizilerini alıp bunları büyük dil modellerinin insan konuşmasını nasıl anladığından esinlenen bir yaklaşım kullanarak eşliyor ve bir dizideki en olası bir sonraki sesi tahmin ediyor. Model seslerdeki kalıpları, yapıyı ve ilerlemeyi tanımlamak için eğitilmiş durumda.
Google DolphinGemma ile birlikte gelmeden önce, WDP’deki araştırma ekibi yunuslarla iki yönlü iletişim olasılığını araştırmak için CHAT (Cetacean Hearing Augmentation Telemetry) kullanıyordu. CHAT ile amaç yunus dilinin tüm karmaşıklığını çözmek değil, etkileşim için daha basit, paylaşılan bir kelime dağarcığı oluşturmaktı.
Artık daha iyi hoparlör ve mikrofon yetenekleri ekleyen ve aynı anda derin öğrenme modelleri ve desen eşleştirmeyi çalıştırmak için yeterli güce sahip olan Pixel 9’a geçiş yapılacak.
Diğer Gemma modelleri gibi Google bu yaz DolphinGemma’yı açık bir model olarak getireceğini ve “dünya çapındaki araştırmacılara kendi akustik veri kümelerini çıkarma, desen aramayı hızlandırma ve bu zeki deniz memelileri hakkındaki anlayışımızı topluca derinleştirme” umudunu taşıdığını söylüyor.