Google’ın açık kaynak yapay zeka metin filigranı teknolojisi: SynthID Text
Google’ın Bard’da yayına aldığı görsellerin yapay zeka ile oluşturulduğunu belirten SynthID teknolojisinden sizlere daha önce bahsetmiştik. Şirketin SynthID Text teknolojisi ise üretken yapay zeka modelleri tarafından yazılan metinleri algılayıp filigranla işaretliyor. Google, SynthID Text’i genel kullanıma sunduğunu açıkladı. Dileyenler SynthID Text’i Hugging Face‘den ve Google’ın güncellenmiş Sorumlu Üretken Yapay Zeka Araç Kiti üzerinden indirilebiliyor.
Tek bir karakter veya kelime olabilen token’lar (belirteç), üretici bir modelin bilgiyi işlemek için kullandığı yapı taşları. Metin üreten modeller, üretim sürecinde hangi belirtecin bir başka belirteci takip etme olasılığının en yüksek olduğunu tahmin ediyor. Bu kapsamda bir model, her olası belirtece, çıktı metnine dahil edilme olasılığının yüzdesi olan bir puan atar. Google’ın belirttiğine göre; SynthID Text, “belirteçlerin üretilme olasılığını modüle ederek” bu belirteç dağılımına ek bilgi ekliyor. Şirketin blog yazısında paylaştığı bilgilere göre; hem modelin kelime seçimleri hem de düzeltilmiş olasılık puanları için nihai puan modeli filigran olarak kabul ediliyor:
“Bu puan örüntüsü, filigranlı ve filigransız metinler için beklenen puan örüntüsüyle karşılaştırılarak SynthID’nin metni bir yapay zeka aracının mı oluşturduğunu yoksa başka kaynaklardan mı geldiğini tespit etmesine yardımcı oluyor.”
Aslına bakarsanız SynthID Text, bahardan beri Gemini modelleriyle entegre edilmiş durumda. Google’ın aktardıklarına göre; bu teknoloji, metin üretiminin kalitesinden, doğruluğundan veya hızından ödün vermiyor. Hatta kırpılmış, başka kelimelerle ifade edilmiş veya değiştirilmiş metinlerde bile çalışıyor.
Öte yandan şirketin belirttiğine göre filigranlama yaklaşımının sınırlamaları da bulunuyor. Bu bağlamda SynthID Text kısa metinlerde, yeniden yazılmış veya başka bir dilden çevrilmiş metinlerde ya da gerçeklere dayalı sorulara verilen yanıtlarda aynı performansı gösteremiyor.
Ayrıca Gemini’in kullanıcıların yapay zeka modelinin yanıtlarının kalitesini beğeniye dayalı bir şeklinde derecelendirmesini sağladığını ekleyelim. Google DeepMind araştırma başkan yardımcısı Pushmeet Kohli ve ekibi, yaklaşık 20 milyon filigranlı ve filigransız chatbot yanıtının puanlarını analiz etti. Ekibin tespitine göre; kullanıcılar, ikisi arasında kalite ve kullanışlılık açısından bir fark görmedi.
Bu arada Google’ın yanı sıra OpenAI’ın da uzun süredir filigran ekleme yöntemlerini araştırdığını belirtelim. Ancak OpenAI, teknik ve ticari nedenlerle bunların yayınlanmasını erteledi. Yine yasal yaptırımlar, yapay zeka şirketlerini, çıktılara filigran eklemek zorunda bırakabilir.