
Meta AI: Yeni Llama 4 Modeli Neler Sunuyor?
Llama, yapay zekayla ilgilenen kişilerin bildiği üzere Meta’nın büyük dil model (LLM) ve büyük multimodal model (LMM’ler) ailesi. Yani tanık olduğumuz büyük AI rekabetinin içinde Facebook, Instagram ve WhatsApp gibi sosyal medya platformlarının ardındaki isim olan Meta da var. Bu işe büyük yatırımlar yapan sosyal medya devi, çok kısa süre önce en yeni ve en güçlü modelini duyurdu: Llama 4.
OpenAI ChatGPT ve Google Gemini gibi modellerin rakibi olan Llama 4’ün alternatiflerinden ayrıştığı önemli bir nokta var. Tüm Llama modelleri neredeyse herkesin araştırma ve ticari amaçlarla kullanabilmesi için ücretsiz. Bu oldukça önemli bir şey ve çeşitli Llama modelleri yapay zeka geliştiricileri arasında inanılmaz derecede popüler hale geldi.
Llama 4 çatısı altında toplamda üç model bulunuyor: Llama 4 Scout, Llama 4 Maverick ve Llama 4 Behemoth. Meta, tüm modellerin “geniş görsel anlayış” kazandırmak için “büyük miktarda etiketsiz metin, görüntü ve video verisi” üzerinde eğitildiğini söylüyor.
Çinli yapay zeka laboratuvarı DeepSeek, Meta’nın geçmiş Llama modelleriyle “aynı ya da daha iyi seviyede performans gösterdiklerini” iddia etmişti. Bu nedenle Llama’nın gelişimi hızlandı, tabiri caizse bir karşılık gerekiyordu. Söylentilere göre Meta, DeepSeek’in R1 ve V3 gibi modelleri çalıştırma ve dağıtma maliyetini nasıl düşürdüğünü deşifre etmek için bu işin üzerine fazlasıyla düşmüş.
Llama 4 duyurusunda göze çarpan bir eksiklik vardı: Herhangi bir muhakeme modeli gelmiş değil. Meta bir ön tanıtım sayfası hazırlamış, görünüşe göre yakında bir muhakeme (akıl yürütme) modeli geliyor. Şimdilik Llama muhakeme dışı modellerle sınırlı.
Llama 4 Nedir?
Llama 4, Meta’nın büyük dil model ailesinin sonuncusu. Llama 4 Scout ve Llama 4 Maverick olmak üzere halihazırda mevcut olan iki modelin yanı sıra üçüncü bir model olan Llama 4 Behemoth halen eğitim aşamasında.
Llama 4 önemli geliştirmeler sunuyor. Özellikle, belirli görevler için yalnızca gerekli bileşenleri etkinleştirerek verimliliği ve performansı artırmayı amaçlayan MoE (mixture-of-experts) mimarisini benimsiyor. Bu tasarım, daha ölçeklenebilir ve uzmanlaşmış yapay zeka modellerine doğru bir geçişi temsil ediyor. Hatırlarsanız oldukça düşük maliyetlerle geliştirilen DeepSeek aynı mimari üzerine inşa edilmişti.
Meta, Llama 4’ün sorguları eğitmek ve yanıtlamak için hesaplama açısından daha verimli olan MoE mimarisi kullanan ilk model grubu olduğunu vurguladı. MoE mimarileri temel olarak veri işleme görevlerini alt görevlere ayıran, ardından bunları daha küçük, alan odaklı “uzman” modellere devreden bir yaklaşıma sahip. Örneğin Maverick’te 400 milyar toplam parametre var, ancak 128 “uzman” arasında yalnızca 17 milyar aktif parametre bulunmakta. Parametreler, kabaca bir modelin problem çözme becerilerine karşılık gelmekte. Scout’un ise 17 milyar aktif parametresi, 16 uzmanı ve 109 milyar toplam parametresi var.
Llama 4, Meta’nın açık kaynaklı model sunma stratejisini olduğu gibi devam ettiriyor. Ancak bir fark ile. Şirketiniz aylık 700 milyondan fazla aktif kullanıcısı olan hizmetler işletiyorsa, Meta’dan ayrı bir lisans almanız gerekecek. Bu sınırlama bir yana, son sürüm halen açık kaynaklı ve ücretsiz olarak yoluna devam ediyor.
Geçmişte Llama 3’ün oldukça güçlü olduğunu konuşmuştuk. Llama 4 şimdi çok daha rekabetçi bir alana giriyor. DeepSeek iddialı muhakeme yetenekleriyle geldi. Alibaba’nın Qwen serisi çok dilli ve kodlama karşılaştırmalarında iyi performans gösterdi. Google’ın Gemini modelleri daha küçük ve verimli mimarilerle aynı alana girmeye çalışıyor. Ve kısa süre önce OpenAI, bir yıl önce olası görünmeyen bir değişim olan açık ağırlıklı bir model yayınlamayı planladığını duyurdu.
Scout ve Maverick, Llama.com ve yapay zeka geliştirme platformu Hugging Face de dahil olmak üzere Meta’nın ortaklarından açıkça temin edilebilirken, Behemoth hala eğitim aşamasında. Şirket WhatsApp, Messenger ve Instagram gibi uygulamalardaki yapay zeka destekli asistanı Meta AI’ın 40 ülkede Llama 4’ü kullanacak şekilde güncellendiğini bildirdi. Multimodal özellikler ise şimdilik ABD’de İngilizce ile sınırlı.
Llama 4 Nasıl Kullanılır?
Hem Llama 4 Scout hem de Llama 4 Maverick, Meta’nın açık lisansı altında şu anda kullanılabilir durumda. Bunları doğrudan resmi Llama web sitesinden veya Hugging Face aracılığıyla indirebilirsiniz.
Modellere Meta’nın kendi hizmetleri aracılığıyla erişmek için sosyal medya platformlarını ziyaret edebilirsiniz: WhatsApp, Messenger, Instagram ve Facebook. Ayrıca bu bağlantı üzerinden Meta AI web sayfasına ulaşabilirsiniz.
Modelleri kendi uygulamalarınıza veya altyapınıza entegre etmeyi planlıyorsanız, lisanslama maddesini hatırlatalım: Ürününüzün veya hizmetinizin aylık 700 milyondan fazla aktif kullanıcısı varsa, Meta’dan ayrı bir izin almanız gerekecek. Zaten 700 milyon ciddi bir rakam, ulaşmak da kolay değil. Modeller bunun dışında araştırma, deney ve çoğu ticari kullanım durumu için kullanılabilir.
Llama Sürüm Detayları
Sürüm numaraları biraz karışık. Meta bazı modeller için Llama 4, diğerleri içinse Llama 3.3, 3.2 ve 3.1 sürümleri aktif. Llama 3 halen kullanılmaya devam edilse de, Llama 4 gelecekte daha fazla söz sahibi olacak. Meta’dan indirilebilecek modeller ise şunlar:
- Llama 3.1 8B
- Llama 3.1 405B
- Llama 3.2 1B
- Llama 3.2 3B
- Llama 3.2 11B-Vision
- Llama 3.2 90B-Vision
- Llama 3.3 70B
- Llama 4 Scout
- Llama 4 Maverick
Ayrıca henüz piyasaya sürülmemiş iki adet Llama 4 modeli daha var:
Genel olarak tüm Llama modelleri aynı temel ilkeler üzerinde çalışmakta. Transformatör mimarisinin varyasyonlarını kullanılıyor, ön eğitim ve ince ayar kullanılarak geliştirildiler. En büyük farklara gelince, Llama 4 modellerinin doğal olarak çok modlu olması ve MoE mimarisini kullanması.
Metin girdisi girdiğinizde ya da modele başka bir şekilde metin girdisi sağladığınızda, model insan beyni örnek alınarak modellenmiş milyarlarca değişkene (parametre olarak bilinen) sahip basamaklı bir algoritma olan sinir ağını kullanarak takip eden en makul metni tahmin etmeye çalışıyor. Ayrıca benzer bir süreç, onu destekleyen modeller için görüntülerle de gerçekleşiyor.
Çeşitli Llama 3 modelleri farklı fiyat/performans dengeleri sunuyor. Örneğin Llama 3.1 8B ve Llama 3.2 3B gibi küçük modeller, akıllı telefonlar ve bilgisayarlar gibi uç cihazlarda çalışmak üzere veya daha güçlü donanımlarda çalışmak için inanılmaz derecede hızlı ve ucuz olacak şekilde tasarlandı. En büyük model olan Llama 3.1 405B çoğu senaryoda en yüksek performansa sahip, ancak çalıştırmak için en yüksek kaynak kullanımı gerektiriyor. Vision modelleri multimodal kullanım durumları için. Llama 3.3 70B ise performans ve maliyet arasında iyi bir denge sunuyor.
Llama 4 Scout ve Llama 4 Maverick isimli modeller, parametreler için uzmanların karışımı yani MoE adı verilen biraz farklı bir yaklaşım üzerine kurulu. Llama 4 Scout’un toplam 109 milyar parametresi olsa da 17 milyarlık kısmından yararlanıyor. Llama 4 Maverick’in ise toplam 400 milyar parametresi olsa da yine de maksimum 17 milyarını kullanmakta. Bu yaklaşım yapay zeka modellerinin hem daha güçlü hem de daha verimli olmasını sağlıyor. Geliştirilme süreci ise daha karmaşık hale geliyor.
Scout ve Maverick’e ek olarak Meta, Llama 4 Behemoth’u da duyurdu. Benzer şekilde MoE mimarisini temel alan model 288 milyar aktif parametreye sahipken toplamda 2 trilyon parametresi mevcut. Dediğimiz gibi, en azından şu an için eğitim aşamasında.
Llama 4 Scout
Llama 4 Scout, yeni paketteki en hafif ve ilgi çekici olan model. Tek bir H100 GPU üzerinde çalışabiliyor ve 10 milyon jetonluk bir bağlam penceresini destekliyor. Bu, Scout’u bugüne kadar piyasaya sürülen en bağlama aç açık ağırlıklı model ve çoklu belge özetleme, uzun biçimli kod muhakemesi ve etkinlik ayrıştırma gibi görevler için potansiyel olarak en kullanışlı model haline getiriyor.
Mimari olarak Scout, tüm parametrelerin etkinleştirildiği GPT-4o gibi yoğun modellerin aksine, belirteç başına yalnızca bir parametre alt kümesinin etkinleştirildiği Meta’nın MoE mimarisi kullanılarak oluşturuldu. Bu da hem hesaplama açısından verimli hem de yüksek oranda ölçeklenebilir olduğu anlamına geliyor.
Meta, çekirdek mimarinin ötesinde Scout’un çok modlu yeteneklerini vurguladı. Erken füzyon kullanılarak metin, görüntü ve video verileri üzerinde önceden eğitilmiş, bu da metin ve görsel istemlerin kombinasyonlarını yerel olarak ele almasına olanak tanımakta.
Lama Maverick
Llama 4 Maverick, sohbet, akıl yürütme, görüntü anlama ve kodlama alanları için tasarlanmış tam ölçekli, çok modlu bir model olan olarak serideki geniş kapsamlı seçenek olarak ön plana çıkıyor. Scout bağlam uzunluğunun sınırlarını zorlarken, Maverick görevler arasında dengeli, yüksek kaliteli çıktıya odaklanıyor. Başka bir deyişle GPT-4o, DeepSeek-V3 ve Gemini 2.0 Flash gibi modellerin karşısında konumlanıyor.
Daha kapsamlı olan model Scout ile aynı 17 milyar aktif parametreye ve daha büyük bir MoE yapılandırmasına sahip: 128 uzman ve toplam 400 milyar parametre. Scout gibi bu model de uzmanların karışımından oluşan bir mimari kullanıyor ve her token başına modelin yalnızca bir kısmını etkinleştirerek kapasiteyi ölçeklendirirken çıkarım maliyetini azaltıyor. Ayrıca tek bir H100 DGX ana bilgisayarında çalışabiliyor.
Meta burada hafif denetimli ince ayar, çevrimiçi takviye öğrenimi ve doğrudan tercih optimizasyonunun bir karışımını kullanarak eğitim sonrası için farklı bir yaklaşım benimsedi. Amaç, modeli aşırı zorlamadan zor ipuçlarında performansı keskinleştirmekti. Bu amaçla Meta, daha önceki Llama modelleri tarafından “kolay” olarak işaretlenen eğitim örneklerinin %50’sinden fazlasını filtreledi ve daha zor akıl yürütme, kodlama ve çok modlu görevleri vurgulayan bir müfredat oluşturdu.
Lama Behemoth
Llama 4 Behemoth, Meta’nın bugüne kadarki en güçlü ve en büyük modeli olacak. Henüz kullanıma sunulmadı lakin belki siz bu kelimeleri okurken belki kullanımda olacak. Hala eğitim aşamasında olan Behemoth, çok adımlı düşünce zinciri görevleri için oluşturulmuş ve optimize edilmiş DeepSeek-R1 veya OpenAI’nin o3’ü ile aynı olan bir muhakeme modeli değil.
Diğer taraftan, doğrudan kullanım için bir ürün olarak da tasarlanmamış gibi görünüyor. Bunun yerine, hem Scout hem de Maverick’i şekillendirmek için kullanılan bir öğretmen modeli olarak hareket ediyor. Yayınlandığında, başkalarının da kendi modellerini oluşturmasına olanak sağlayabilir.
Behemoth, toplam parametre sayısı 2 trilyona yaklaşan ve 16 uzman aracılığıyla organize edilen 288 milyar aktif parametre barındırıyor. Meta, Behemoth’u bu ölçekte desteklemek için tamamen yeni bir eğitim altyapısı oluşturdu.
Llama 4 Hangi Konumda?
Llama 4 Maverick ve Scout oldukça başarılı açık modeller, ancak sınıfının en iyi performansını sunuyorlar diyemeyiz. Özellikle bir muhakeme modelinin olmaması nedeniyle çoğu kıyaslamada üst sıralardan uzak kalıyorlar.
Llama 4 Maverick, doğrudan DeepSeek V3, Grok 3, GPT-4o, Claude Sonnet 3.7 ve Gemini 2.0 Flash ile rekabet halinde. Artificial Analysis’in aşağıdaki tablosunda görebileceğiniz gibi, iyi bir muhakeme dışı model. En önemli avantajı, en yüksek performans gösteren açık çok modlu model ve en yüksek performans gösteren Çince olmayan açık dil modeli.
Maverick’in MoE yapısı, özellikle GPT-4o gibi tescilli modellerle karşılaştırıldığında çalıştırmayı uygun maliyetli hale getiriyor. Deneysel bir sürüm şu anda sohbet robotu arenasında ikinci sırada, bu yüzden kesinlikle biraz umut vaat ediyor. Bir milyon tokenlık bir bağlam penceresine sahip ve bu iyi bir değer.
Llama 4 Scout, GPT-4o mini ile rekabet edebilecek kapasitede. İlginç olan şey ise tek bir H100 GPU ile çalışmak üzere tasarlanmış olması. H100 sunucu sınıfı güçlü GPU olsa da, büyük modeller genellikle tek bir özel GPU yerine birden fazla GPU’dan oluşan bir küme üzerinde çalışır. İkinci olarak, gerçekten sınıfının en iyisi olan 10 milyon tokenlık bir bağlam penceresi sunuyor.
Meta, Behemoth için bazı geçici performans puanları yayınladı. Görünüşe göre bu model birkaç kıyaslamada GPT-4.5’i geride bırakıyor. Şimdilik böyle diyoruz ama AI endüstrisi o kadar hızlı ilerliyor ki, OpenAI birkaç gün sonra daha iyi bir sürümü kullanıma sunabilir. Llama 4 ile ilgili detaylar ve performans skorlarına aşağıdaki sayfadan ulaşabilirsiniz: