DeepSeek Önemli İyileştirmelerle Güncellenmiş R1 Akıl Yürütme Modelini Yayınladı

31.05.2025

113

DeepSeek Önemli İyileştirmelerle Güncellenmiş R1 Akıl Yürütme Modelini Yayınladı

Bu yılın başlarında büyük ölçüde bilinmeyen bir Çin girişimi olmasına rağmen DeepSeek, OpenAI, Anthropic ve Google gibi büyük yapay zeka şirketlerinin önde gelen modelleriyle aynı performansı ortaya koyan ücretsiz ve açık kaynaklı bir akıl yürütme modeli olan R1 ile dikkatleri üzerine çekmişti. Şimdi ise DeepSeek R1 akıl yürütme modeli iyileştirmeler aldı.

DeepSeek-R1-0528 Çıktı

DeepSeek, açık kaynaklı ve yüksek performanslı olmasının yanı sıra eğitim için çok daha az kaynak kullanarak dikkate değer bir verimlilik gösterdi. Bu, rafine edilmiş bir uzmanlar karışımı (MoE) mimarisi, gelişmiş sıkıştırma yöntemleri, çoklu belirteç tahmin yetenekleri ve takviyeli öğrenme öncelikli eğitim metodolojisi dahil olmak üzere çeşitli tekniklerle elde edildi.

Son olarak DeepSeek, R1 modelinin ilk büyük güncellemesi olan DeepSeek-R1-0528’i yayınladı. Güncellenen model ve ağırlıkları halihazırda Hugging Face‘te mevcut. DeepSeek henüz resmi ölçütleri yayınlamamış olsa da birkaç yapay zeka meraklısı ve geliştiricisi sonuçları paylaşmaya başladı ve etkilenmiş görünüyorlar.

Büyük dil modellerinin kodlama yeteneklerini değerlendirmek için bir ölçüt olan LiveCodeBench’e göre, DeepSeek-R1-0528 artık 4. sırada yer alıyor ve o4 Mini (Düşük), Grok-3-mini (Yüksek) ve Gemini 2.5 Flash Preview gibi modelleri geride bırakıyor.

Ayrıca, son DeepSeek R1 güncellemesinin artık Google’ın modellerine benzer şekilde derinlemesine akıl yürüttüğünü ve göreve bağlı olarak 30-60 dakikaya kadar düşünebildiği ifade ediliyor.

Bu son R1 güncellemesini denemek isteyenler için model OpenRouter veya LMArena‘da mevcut.

Kaynak