OpenAI, yeni yapay zeka modeli GPT-4.5’i tanıttı

28.02.2025

254

OpenAI, yeni yapay zeka modeli GPT-4.5’i tanıttı

OpenAI‘ın birkaç hafta içinde “Orion” kod adlı GPT-4.5’i piyasaya sürmeyi planladığını sizlere aktarmıştık. OpenAI, bu akşam düzenlediği bir canlı yayın ile yapay zeka modeli GPT-4.5′i piyasaya sürdüğünü duyurdu. GPT-4.5, OpenAI’ın bugüne kadarki en büyük modeli olarak karşımıza çıkıyor. Şirketin paylaştığı bilgilere göre model, şirketin önceki sürümlerinden daha fazla bilgi işlem gücü ve veri kullanılarak eğitildi.

GPT-4.5’in detayları

GPT-4.5, denetimsiz öğrenme kullanılarak geliştirildi. Bu sayede ön eğitim aşamasında bilgi işlem gücü ve veri miktarının önemli ölçüde artırılması söz konusu oldu. OpenAI’ın GPT-4, GPT-3, GPT-2 ve GPT-1’i geliştirmek için aynı temel tekniği kullandığını da ekleyelim.

OpenAI’ın belirttiğine göre; GPT-4.5’in artan boyutu, modele daha derin bir dünya bilgisi ve daha yüksek duygusal zeka kazandırdı. Öte yandan GPT-4.5, çeşitli yapay zeka kıyaslamalarında DeepSeek, Anthropic ve OpenAI’ın yeni akıl yürütme modellerinin gerisinde kalmakta. GPT-4.5’in çalıştırılmasının yüksek maliyetli olması ise OpenAI’ın GPT-4.5’i uzun vadede API’sinde sunmaya devam etme konusunda tereddütler yaşayabileceğini gösteriyor.

OpenAI’ın yaptığı açıklamalara göre; GPT-4.5’in GPT-4o’nun yerine geçmesi planlanmıyor. GPT-4.5, dosya ve resim yükleme ve ChatGPT’nin tuval aracı gibi özellikleri destekliyor. Ancak şimdilik ChatGPT’nin gerçekçi iki yönlü ses modu GPT-4.5 ile kullanılamıyor.

GPT-4.5’in performansı

Yine de GPT-4.5, GPT-4o’dan ve diğer birçok modelden daha yüksek performans gösterdiğini söyleyebiliriz. SimpleQA kıyaslamasında GPT-4.5, doğruluk açısından GPT-4o, o1 ve o3-mini’den daha iyi performans gösteriyor. SimpleQA kıyaslamasının modelleri basit, gerçeklere dayalı sorular üzerinde test ettiğini belirtelim. Ayrıca OpenAI’ın paylaştığı bilgilere göre GPT-4.5, çoğu modelden daha az halüsinasyon görüyor.

SWE-Bench Verified ölçütünde ise GPT-4.5’in, GPT-4o ve o3-mini’nin performansıyla yaklaşık olarak eşleştiğini söyleyebiliriz. SWE-Bench Verified ölçütünü kodlama problemlerinin bir alt kümesi olarak tanımlayabiliriz. GPT-4.5 bu ölçütte OpenAI’ın derin araştırma özelliği ve Anthropic’in Claude 3.7 Sonnet modelinin gerisinde kalıyor.

OpenAI’ın SWE-Lancer kıyaslamasında GPT-4.5, GPT-4o ve o3-mini’den daha iyi performans gösteriyor, ancak derin araştırmanın gerisinde kalıyor. SWE-Lancer, modelin tam yazılım özellikleri geliştirme becerisini ölçüyor.

GPT-4.5, AIME ve GPQA gibi ölçütlerde o3-mini, DeepSeek R1 ve Claude 3.7 Sonnet gibi önde gelen muhakeme modellerinin performansına ulaşamıyor. Bununla beraber GPT-4.5’in aynı testlerde mantık yürütmeyen modellerle eşleştiğini veya onları geçtiğini de belirtelim.

OpenAI, GPT-4.5’in insan niyetini anlama yeteneği gibi alanlarda diğer modellerden niteliksel olarak üstün olduğunu öne sürüyor. GPT-4.5’in daha sıcak ve doğal bir tonda yanıt verdiğini de dile getiren OpenAI, yazma ve tasarım gibi yaratıcı görevlerde iyi performans gösterdiğini ifade ediyor.

OpenAI, GPT-4.5, GPT-4o ve o3-mini’den SVG’de bir tek boynuzlu at oluşturmalarını istediğinde GPT-4.5 görevi yerine getirebildiği görülüyor. Başka bir testte OpenAI, GPT-4.5 ve diğer iki modelden “Bir sınavdan kaldıktan sonra zor bir dönemden geçiyorum” isteminde yanıt vermelerini istedi. GPT-4o ve o3-mini yararlı bilgiler verirken, GPT-4.5 sosyal açıdan en uygun olan yanıtıyla öne çıktı.

GPT-4.5’e kimler erişebilir?

OpenAI’ın aylık 200 dolarlık planı olan ChatGPT Pro aboneleri, araştırma önizlemesi kapsamında bu akşamdan itibaren GPT-4.5’e erişebilecek. Aynı şekilde OpenAI’ın API’sinin ücretli katmanlarındaki geliştiricilerin de bugünden itibaren GPT-4.5’i kullanabileceğini belirtelim. ChatGPT Plus ve ChatGPT Team’e kayıt olan müşteriler ise modele önümüzdeki hafta erişebilecek.

Kaynak

BİR YORUM YAZIN

[ Yoruma cevap yazmaktan vazgeç ]

ZİYARETÇİ YORUMLARI - 0 YORUM

Henüz yorum yapılmamış.