
Intel’in yepyeni grafik mimarisi: Xe3 neleri geliştiriyor?
Intel, yakın zamanda düzenlediği Tech Tour etkinliği kapsamında birçok yenilikle karşımıza çıktı. Panther Lake mimarisine diğer makalemizde derin bir dalış yapmıştık. Ayrıyeten bir de yeni Xe3 grafik mimarisine değinelim istedik. Intel, ilk olarak entegre grafiklerde kullanacağı yeni mimarisine dair iyileştirmeleri ve performans iyileştirmelerini anlattı.
Zaman zaman sözünü ediyoruz, artık tüm donanımların bir arada yer aldığı yekpare işlemci çözümleri daha fazla göz önünde: Güçlü dahili grafik yongası (iGPU), yapay zeka iş yükleri için kullanılan NPU, CPU çekirdekleri ve hatta bellek paketleri bir arada toplanıyor. Böylelikle yüksek verimlilik sağlanmakta.
Intel, AMD, Apple ve Qualcomm şimdi özellikle taşınabilir pazarda bir rekabet içinde. Tahmin edebileceğiniz gibi, SoC’lerin sunduğu grafik performans çok önemli. Mavililerin yeni Xe3 grafik yongaları birçok farklı sistemde, belki avuç içi oyun konsollarında kullanılacak. Ayrıca gelecekte Xe3P adında farklı GPU’ların geleceği de söyleniyor.
Geçtiğimiz yıl Intel, Core Ultra 200 (Lunar Lake) ve Arc B Serisi Battlemage harici ekran kartlarında Xe2 mimarisini kullanmıştı. Yıllar içinde kazanılan tecrübelerle beraber şimdi Xe3 sahnede. Mimari daha iyi gelirken, aynı zamanda yazılım tarafında da iyi işler çıkarıyorlar Intel ekipleri. Şirket yazılım alanında da önemli ilerlemeler kaydederek, yalnızca oyunlarla sınırlı kalmayıp içerik üretimi, render alma ve yapay zeka iş yükleri için de başarılı sürücü desteği sunuyor.
Xe3 nedir, ne değildir?
Baştan hatırlatalım, Xe3 ismindeki GPU’lar Celestial mimarisine dayanmıyor. Şirket bu mimariyi önceki Battlemage ailesinin bir parçası olarak sınıflandırıyor. Başka bir tabirle, mevcut Battlemage Xe2 mimarisinin üzerinde önemli geliştirmeler yapılmış.
İlginç şekilde, yeni tanıtılan Panther Lake işlemcilerde iki ayrı tipte Xe3 iGPU yer alacak. Üç Panther Lake SoC’in ikisinde kullanılan temel iGPU, sadece dört Xe3 çekirdeği ve 4 MB L2 önbellek içeriyor. İlginç olan kısım ise yonga “Intel 3” teknolojisiyle üretildi. Temel Panther Lake modelleri bu yapılandırmayı kullanacak. Diğer Xe3 iGPU varyantı ise TSMC’nin N3E süreciyle üretiliyor. Bu model 12 adet Xe3 çekirdeğine sahip ve Intel’in şimdiye kadarki en büyük entegre GPU’su. Şöyle ki, üst model yeni GPU’nun çekirdekleri Meteor Lake, Lunar Lake ve Arrow Lake’te kullanılan çekirdeklerin sayısından %50 daha fazla.

Xe3 ile Intel, grafikleri daha geniş konfigürasyonlara ölçeklendirerek ve daha fazla işlem hacmi optimize edilmiş bir tasarım sunarak Xe2 mimarisini geliştiriyor. Öte yandan şirketin planları arasında halihazırda yeni bir Arc ailesi bulunuyor ve bu ailenin Xe3P adlı güncellenmiş Xe3 GPU mimarisi kullanacağı söyleniyor. Detaylar çok kısıtlı, birkaç ay içerisinde daha net bilgiler ortaya çıkacaktır. Diyebiliriz ki Intel doğrudan Xe4’e geçmeyecek, bunun yerine entegre veya harici olsun, gelecekteki ürünler için Xe3’ü optimize etmekle uğraşacak.
Xe3 grafik mimari iyileştirmeleri
Temel Xe3 Xe Core yapısı Xe2 ile aynı temel düzeni koruyor. Bu birimde kayan nokta ve tamsayı matematiği için sekiz Xe Vektör Motoru, AI uygulamaları için matris matematiğinin hızlandırılması için sekiz XMX motoru ve bir ışın izleme birimi yer almakta. İlk olarak, yeni mimariyle render slice adı verilen render birimlerinin boyutu büyüdü. Xe2, render birimi başına 4 Xe çekirdeği ve 4 ışın izleme birimi ile yapılandırılmıştı. Xe3 ise birim başına 6 Xe çekirdeği ve 6 ışın izleme birimine kadar çıkıyor. Bu da her render dilimi için çekirdek ve ışın izleme birimi sayısında %50’lik bir artışı demek.

Nitekim farklı SoC’lerde çeşitli GPU yapılandırmaları kullanmak mümkün olacak. 8 ve 16 çekirdekli iki Panther Lake modelinde 4’lü Xe3 GPU konfigürasyonu vardı. En üst düzey 16 çekirdekli işlemcide ise 12 çekirdekli GPU yapısı karşımıza çıkıyor. Xe3 render birimi altı adet Xe çekirdeği ile geliyor demiştik. Yeni tasarım şimdiye kadar iki ayrı iGPU üretmek için kullanıldı, gelecekte daha fazlasını görmeyi umuyoruz. Şu anki en yüksek performanslı Panther Lake yonga oyun, içerik üretimi ve yapay zeka iş yüklerini destekleyecek iki render parçasını bir araya getiriyor.


Çip üreticisi, Xe3’teki değişikliklerin iki sorunlu noktayı iyileştirmeyi amaçladığını söylüyor: mevcut kaynakların daha iyi kullanılması ve mimariyi daha ölçeklenebilir hale getirme. Bu da daha büyük ve daha yüksek performanslı ürünler oluşturmak için önemli.
Devam edelim. Intel, her bir Xe3 Xe Core’un önceki modele kıyasla %25 daha fazla iş parçacığı (sekizden 10’a çıktı) çalıştırabildiğini ve çekirdeğin daha iyi kullanım sağlamak için her bir Xe Vector Engine’in kayıt dosyasının bölümlerini iş parçacığı başına değişken olarak tahsis edebildiğini belirtiyor. Değişken kayıt tahsisi Xe3 için tamamen yeni bir özellik. Önceki Arc GPU’lar, çekirdeğin mevcut kaynaklarını tam olarak kullanmak için zorluklar yaratan, daha kaba bir iş parçacığı başına kayıt tahsis stratejisini kullanıyordu. Ekipler, bunun Xe3 mimarisinde önemli bir gelişme olduğunu ve “performans üzerinde çarpıcı etkileri” olduğunu vurguluyor.

Xe3’ün diğer büyük yapısal değişikliklerinden bir diğeri de Xe çekirdeği başına paylaşılan yerel belleğin artırılması. Xe3 artık Lunar Lake’teki Xe2 ve Meteor Lake’teki Xe-LPG mimarisinde benimsenen 192 KB’a kıyasla 256 KB’ye çıkarılmış paylaşılan yerel bellek içeriyor. Intel, paylaşılan yerel bellekten taşan iş yüklerinin eski Arc iGPU’larda performans düşüşlerinin ana nedeni olduğunu söylüyor. Nitekim daha fazla belleğe ihtiyaç vardı, böylelikle iş yükleri darboğaza uğramadan daha hızlı şekilde gerçekleşecek.
Bellek kapasitesini artırmak basit gibi görünen, lakin performansa ciddi katkılar sunabilen bir geliştirme. Kapasite artışıyla entegre GPU’lar artık masaüstü Xe2 modelleriyle aynı seviyeye geldi. Arc B580 ve B5700, Xe Core başına 56 KB yerel bellek sunuyordu.
Önbellek sisteminin alt kısımlarında büyük değişiklikler meydana geldi. En büyük 12-Xe-Core yapılandırmasında, Panther Lake SoC’ler artık 16 MB paylaşımlı L2 önbelleğe sahip. Bu değer Lunar Lake’in sekizli Xe-Core yapılandırmasına kıyasla iki kat daha fazla. Masaüstü sınıfı Arc B580, çok daha fazla Xe Çekirdeğine sahip olmasına rağmen sadece 18 MB (%12,5 daha fazla) L2 önbellek barındırıyor.

Şirket, daha büyük L2 önbelleğin grafik işlemcisini ana belleğe bağlayan Panther Lake’in paket içi yapısında trafiği azalttığını söylüyor. Yani RAM’e erişim için CPU ve NPU ile rekabet halinde olabilecek entegre bir grafik işlemcisi için önemli bir husus. Intel, 8 MB L2’ye sahip bir ürünü referans alarak yapı trafiğinde %17 ila %36 arasında azalma olduğunu iddia eden bir grafik gösterdi.
Diğer geliştirmelere bakalım. Mavi takım, GPU’daki işlevsel birimler arasında veri aktarımı için kullanılan Unified Return Buffer (URB) adlı önbelleğin performansını da artırdı. Xe3 URB, her bağlam geçişi için tam bir boşaltma gerektirmeden bu arabellekte kısmi güncellemeler yapabilen yeni bir yönetim aracısı ile desteklendi ve böylece işlevsel birimler arası iletişim maliyeti düştü.
Xe3, bazı yaygın grafik görevlerinde performansı artırmak için sabit işlevli donanımda da iyileştirmeler içeriyor. Şirket, anizotropik filtreleme oranının 2 kata kadar, şablon test oranının ise 2 kata kadar iyileşmesini beklediğini belirtiyor.
Xe Vektör Motoru
Son nesil Xe Çekirdeğinde sekiz adet 512-bit Vektör Motoru (XVE), sekiz adet 2048-bit XMX Motoru ve %33’ten fazla paylaşımlı L1/SLM önbelleği bulunuyor. Xe Vektör Motoru, artık %25’e kadar daha fazla iş parçacığı, değişken kayıt tahsisi ve FP8 dekuantizasyon desteğiyle Xe3 mimarisinde daha fazla kullanım sunuyor. SIMD16 yerel ALU’lar, 3 Yollu Ortak Yayın, Genişletilmiş matematik ve FP64 blokları ve Xe matris uzantılarından oluşuyor.

XMX AI Motoru
Xe3 XMX motorları yapay zeka hızlandırmasından sorumlu kısım. 96’ya kadar XMX motoruna sahip 12Xe iGPU’lar 120 TOP’a ulaşan performans sunabiliyor. Bu hesaplamaya göre 4Xe iGPU’lar 40 TOP’a kadar hıza ulaşabilecek. Xe2 mimarisine dayalı 8 Xe iGPU’lar ise 67 TOP’a kadar hıza erişebiliyordu. Aynı hesaplama yöntemi kullanılarak, 8 Xe Çekirdekli bir Xe3 iGPU, %25’lik bir iyileştirmeyle 67 TOP yapay zeka hesaplaması sağlayabilir.

Intel Xe3 performansı
Şimdi gelelim son tüketicilerin doğrudan baktığı performans verilerine. Intel Xe3 Panther Lake Mikro Benchmark grafiği, çeşitli görevlerdeki performans iyileştirmelerini gösteriyor; en yüksek iyileştirme 7,4 ile Derinlik Yazma (Depth Writes) görevinde. GEMM’deki FP16 ölçümleri, GPU’nun ölçeğiyle orantılı olarak %50’lik bir iyileşme gösteriyor. Xe3, Xe2’den %50 daha büyük ve bu mikro benchmarklar mimarinin yeteneklerini tam olarak kullanabiliyor. Aradaki performans farkı da çip büyüklüğünden kaynaklanmakta. Anizotropik oran, Mesh Render oranı, Dağınık Okumalar ve R/T kesişimi gibi skorlar ise 2 kat ila 2,7 kat arasında iyileşme gösteriyor.

Panther Lake Xe3 ile yapılan Lunar Lake Xe2 ve Arrow Lake-H Xe+ kıyaslamalarına göz atalım. Xe3, en yüksek güçte Lunar Lake’e kıyasla %50’den fazla performans ve Arrow Lake-H’e kıyasla watt başına %40’tan fazla daha yüksek performansla çalışabiliyor.
