xAI Grok 4 Neler Sunuyor? Nasıl Kullanılır?

13.08.2025

xAI Grok 4 Neler Sunuyor? Nasıl Kullanılır?

Yapay zeka sahnesine etkili bir giriş yapan xAI, Grok isimli sohbet robotuyla hızla popülerlik kazanmayı başardı. X platformu bir yana, bu yükselişin ardındaki en büyük paylardan biri de sürekli olarak geliştirilen model yapısı.

Bizler Grok 3.5’i beklerken, xAI buçuklu sürümü atlayarak doğrudan Grok 4’e geçiş yapmayı seçmişti. Peki neler değişti? Grok 4, pek çok konuda kağıt üzerinde dünyadaki en iyi modellerden, belki de en iyi model haline dönüştü.

Grok 4 Nedir?

Elon Musk’ın yapay zeka şirketi xAI, bildiğiniz gibi kendi yapay zeka platformuna “Grok” adını vermişti. Zaman içinde yeni sürümler tanıtıldı, son nokta ise Grok 4 oldu. Grok 3‘ü geçmişte detaylıca ele almıştık. 2025 Temmuz ayının ortalarında ise Grok 4 adlı yeni çok modlu yapay zeka modeli duyuruldu.

xAI, Grok 4’ün akademik, matematiksel ve akıl yürütme ölçütlerinde yüksek performansa sahip üst düzey bir yapay zeka modeli olduğunu iddia etti. Ek olarak, çoklu ajan araçlarına sahip Grok 4 Heavy sürümü popüler yapay zeka ölçütlerinde daha da etkileyici kazanımlar sağlıyor.

Grok 4 ailesi yalnızca Grok 4 ve Grok 4 Heavy modellerini içeriyor, hızlı akıl yürütme için kullanabileceğimiz bir mini versiyon yok. Grok 4, xAI’ın en son tek ajan modeli konumunda. Yani birden fazla ajan (agent) kullanan Grok 4 Heavy’den farklı.

Şirketin duyurusunda mühendislik açısından özellikle çığır açan bir şey yoktu. Öte yandan xAI, modellerinde bazı küçük ayarlamalar yaptı ve Grok 3’te kullanılanın yaklaşık 10 katı kadar önemli bir hesaplama performansı artışı sağladı. xAI’a göre son model Grok 3’e kıyasla 10 kat daha fazla hesaplama gücü kullanmakta. Buna istinaden Grok 4’ün bugün mevcuttaki en akıllı model olduğunu iddia ediyorlar. İddia ediyorlar lakin karşılaştırma sonuçları da iddiaları doğruluyor.

En dikkat çekici sonuç, matematik, fizik, kimya, dilbilim ve mühendislik alanlarını kapsayan, 2.500 adet elle seçilmiş doktora düzeyinde sorudan oluşan Humanity’s Last Exam testinden geldi. Grok 4 (araçlarla birlikte) sorunların yaklaşık %38,6’sını çözmeyi başardı.

Uygulamada bağlam penceresi 128.000 token, API’de ise 256.000 token. Bu uzun formlu akıl yürütme için biraz alan sağlıyor, ancak mevcut standartlara göre çok da büyük sayılmaz. Örneğin Gemini 2.5 Pro 1 milyon token sunuyor. Grok ile geliştirme yapıyorsanız, bağlamınızı dikkatlice yapılandırmak ve kırpmak için zaman harcamanız gerekecek.

Açıkça belirtmek gerekirse Grok 4, gündelik sorular yöneltebileceğiniz basit bir AI modeli değil. Basit işler için Grok 3’ü kullanmanız daha yerinde olur, daha hızlı sonuç alabilirsiniz.

Ek olarak, tüketiciler için xAI’nin yeni abonelik katmanları mevcut. Temel ücretsiz katmanda Grok 3’e yalnızca sınırlı erişim sağlanacak. SuperGrok planı aylık 30 dolar, Grok 4 ve Grok 3 modellerine daha fazla geniş sağlanabiliyor. 300 dolar/aylık SuperGrok Heavy planı ise Grok 4 Heavy, Grok 4 ve Grok 3 modellerine erişim imkanı tanıyor.

Grok 4 Performansı

Grok 4’ün en dikkat çekici yanı, akademik sınavlardan iş simülasyonlarına kadar çok çeşitli testlerde gösterdiği performans. xAI, modelin önceki sürümlerine göre önemli ölçüde daha iyi olduğunu dile getiriyor. Bu gelişim yeni mimari atılımlar sayesinde değil, daha çok eğitim ve çıkarım aşamalarında daha fazla hesaplama gücü kullanılması sayesinde gerçekleşti.

Humanity’s Last Exam (HLE)

Grok 4’ün performansının arkasındaki temel model ölçeklendirme. Daha fazla eğitim hesaplama gücünden ve daha da ilginci, daha fazla test zamanı hesaplama gücünden yararlanıyor. Basit bir ifadeyle: Ne kadar çok kaynak ayırırsanız, o kadar iyi performans sağlarsınız. Bahsettiğimiz durum, İnsanlığın Son Sınavı anlamına gelen Humanity’s Last Exam testinde kendini özellikle hissettiriyor.

Araç kullanımı olmadan Grok 4, yaklaşık %26,9 doğruluk oranında sabit kalıyor. Araçlar etkinleştirildiğinde (ör. kod yürütme) %41,0’a ulaşıyor, Heavy (çoklu ajan) yapılandırmasında çalıştırıldığında ise %50,7’ye çıkıyor. Elde edilen bu skor, önceki araçsız model skorlarının iki katından fazla.

Akademik ve STEM Kıyaslamaları

En yeni Grok modeli, yüksek performanslı LLM’leri karşılaştırmak için bu alanda yaygın olarak kullanılan, daha geleneksel STEM odaklı değerlendirmelerde de iyi sonuçlar elde ediyor:

	En İyi Rekabetçi Modeller	Grok 4 (Araçsız)	Grok 4 Heavy
GPQA	79.6–86.4%	87.5%	88.9%
AIME25	75.5–98.8%	91.7%	100.0%
LCB (Jan–May)	72.0–74.2%	79.0%	79.4%
HMMT25	58.3–82.5%	90.0%	96.7%
USAMO25	21.7–49.4%	37.5%	61.9%

Grok 4, çoğu kategoride Claude Opus, Gemini 2.5 Pro ve GPT-4 (o3) modellerinden daha iyi performans göstermekte. Ancak bazı kullanıcılar, karşılaştırmalarda rakip modellerin temel puanlarının seçici bir şekilde kullanılmış olabileceğini belirtiyor.

ARC-AGI (Gelişmiş Muhakeme)

En zor ve belirsiz benchmarklardan biri de modelin soyut muhakeme görevlerinde genelleme yapma yeteneğini test eden ARC-AGI. Grok’un son sürümü, ARC-AGI v1’de bilinen tüm rakiplerinin önüne geçerek %66,6 puan elde etti. ARC-AGI v2’de ise Claude 4 Opus %8,6’lık skor kaydederken, Grok 4 %15,9 puan aldı.

Yukarıdaki testler tamamen kamuya açık değil, bu nedenle olağan uyarılar geçerli. Ancak rakamlar doğruysa, Grok 4 çok adımlı, mantık ağırlıklı akıl yürütme görevlerinde güçlü bir performans sergiliyor diyebiliriz.

Vending-Bench (İş Simülasyonu)

xAI, Grok 4’ü Vending-Bench adlı gerçek dünya simülasyonunda da test etti. Buradaki amaç, bir modelin zaman içinde küçük bir işletmeyi yönetip yönetemeyeceğini görmek: Stokları yenilemek, fiyatları ayarlamak, tedarikçilerle iletişime geçmek gibi.

Vending-Bench oldukça yeni bir benchmark çeşidi. Sonuçlar ise şöyle:

	Model	Net Değer	Satılan Birim
1	Grok 4	$4,694	4,569
2	Claude Opus 4	$2,077	1,412
3	Human baseline	$ 844	344
4	Gemini 2.5 Pro	$ 789	356
5	GPT-4 (o3)	$1,843	1,363

Grok 4, hem gelir hem de ölçek açısından en yakın rakibinin performansına iki kattan fazla fark attı. Ayrıca uzun vadeli planlama ile karşı karşıya kaldığında birçok modelin zorlandığı 300 turluk simülasyon boyunca performansını tutarlı bir şekilde sürdürmeyi başardı.

Kısacası Grok 4, xAI’ın test ettiği alanlarda iyi performans gösteriyor. Yine de liderlik tabloları her zaman her şeyi anlatmıyor. Sonuçlar pozitif lakin gerçek dünya senaryolarında sonuçlar bazen değişebiliyor.

Grok 4 Nasıl Kullanılır?

Grok 4’ü üç ayrı şekilde kullanabilirsiniz; X uygulaması, grok.com ve xAI API olmak üzere:

Sohbet Erişimi (X Üzerinden)

Grok 4’ü denemenin en kolay yolu X uygulaması (eski adıyla Twitter). Buradan ChatGPT veya Claude’a benzer bir sohbet arayüzü içinde Grok’a erişim sağlayabilirsiniz.

Kullanmak için en üst düzey plan olan X Premium+’ya abone olmalısınız. X uygulamasını açınveya x.com adresini ziyaret edin. Grok simgesine dokunun (mobil cihazlarda alt gezinme çubuğu, masaüstü bilgisayarlarda kenar çubuğu). Hepsi bu kadar. Grok 4 varsayılan model, sürümler arasında geçiş yapabilirsiniz.

Grok.com Üzerinden

Grok 4’ü bağımsız bir arayüz sunan grok.com üzerinden de kullanabilirsiniz. https://grok.com adresini ziyaret edin, kaydolun ve oturum açın. Son sürüme arayüz üzerinden erişebilirsiniz.

Grok 4 API

Grok’u kendi uygulamanıza veya iş akışınıza entegre etmek istiyorsanız xAI API’sine yönelebilirsiniz. https://x.ai/api adresine gidin ve geliştirici erişimi talep edin.
Onaylandıktan sonra bir API anahtarı ve belgelere erişim hakkı alacaksınız. Daha fazla ayrıntı için belgeleri mutlaka okuyun.

Grok’un Görüntü ve Video Oluşturma Özelliği Ücretsiz Sunuluyor

Grok 4’ten bağımsız olarak güzel bir haber verelim. Elon Musk’ın sahibi olduğu yapay zeka şirketi xAI, Grok Imagine adlı görüntü ve video oluşturma aracının artık tüm kullanıcılar için ücretsiz olduğunu duyurdu. Özellik, çok modlu yapay zeka kullanarak metin komutlarını görüntü ve videolara dönüştürebiliyor. Grok Imagine, Grok’un iOS ve Android uygulamaları için kullanıma sunulmuştu ancak başlangıçta SuperGrok, Heavy veya Premium Plus planlarının ücretli aboneleriyle sınırlıydı.

Temel özellik artık herkese açık olsa da ülkeler genelinde değil, bazı gelişmiş seçenekler ücretli kalabiliyor. Özellikle, Grok Imagine’in cinsel içerikli görüntü ve videolar oluşturabilen tartışmalı Spicy Mode özelliği hala ücretli kalmaya devam ediyor.

Grok Imagine, kullanıcıların doğrudan metin komutlarından sesli görüntü ve kısa videolar oluşturmasına olanak tanıyor. Yazılı açıklamaları görsellere dönüştürmek ve ardından bunları video kliplere animasyonla dönüştürmek için üretken yapay zeka araçlarını bir araya getiriyor.

xAI Grok Imagine Nasıl Kullanılır?

Akıllı telefonunuzda Grok uygulamasını açın.
Giriş yapın ve sohbet penceresine gidin.
Sağ üst köşedeki Hayal Et sekmesine dokunun.
İstediğiniz sahneyi, stili veya eylemi açıklayan bir metin girin.
Alternatif olarak, yapay zeka destekli düzenlemeler için galerinizden bir resim yükleyin.

Grok Imagine’ın tüm kullanıcılara açılması yapay zeka destekli yaratıcı araçlardaki rekabetin artmasını sağlayacak.

Kaynak