Microsoft Azure, NVIDIA GB200 ile Blackwell Sistemine Sahip İlk Hiper Ölçekleyici Oldu
NVIDIA, Mart ayında büyük dil modeli eğitimi için selefinden 25 kata kadar daha düşük maliyet ve enerji tüketimi sunan yeni NVIDIA Blackwell platformunu duyurmuştu. Amazon Web Services, Dell Technologies, Google, Meta, Microsoft, OpenAI, Oracle, Tesla ve xAI dahil olmak üzere büyük bulut sağlayıcıları ve önde gelen yapay zeka girişimlerinin Blackwell kullanıma sunulduğunda onu benimsemeleri bekleniyor.
Bir tasarım hatası nedeniyle Blackwell platformunun piyasaya sürülmesi 3 aya kadar ertelense de Microsoft, yakın zamanda X platformu üzerinden NVIDIA GB200 Blackwell yongalarını aldığını ve NVIDIA Infiniband ağ iletişimi ve kapalı devre sıvı soğutmasından yararlanarak sunucularını yeni yongalar için optimize ettiğini paylaştı.
Microsoft Azure is the 1st cloud running @nvidia‘s Blackwell system with GB200-powered AI servers. We’re optimizing at every layer to power the world’s most advanced AI models, leveraging Infiniband networking and innovative closed loop liquid cooling. Learn more at MS Ignite. pic.twitter.com/K1dKbwS2Ew
— Microsoft Azure (@Azure) October 8, 2024
NVIDIA Blackwell platformu için potansiyel müşterilerin kapsamlı listesi göz önüne alındığında, Microsoft ve OpenAI gibi şirketlerinden ilk alıcılar olması tabii ki pek de şaşırtıcı değil. Bunun nedeni, Google ve AWS gibi diğer büyük bulut sağlayıcılarının aksine yapay zeka eğitimi için tamamen NVIDIA’ya güvenmeleri. Google, model eğitimlerinin çoğu için kendi Tensör İşleme Birimlerini (TPU’lar) kullanıyor ve hatta bulut müşterilerine TPU kaynakları sunuyor. Benzer şekilde, AWS eğitim ve çıkarım için kendi yongalarını geliştirdi. Buna karşılık, Microsoft ve OpenAI’ın NVIDIA’ya olan tam bağımlılığı onları muhtemelen NVIDIA’nın en büyük müşterileri konumuna getiriyor.
Microsoft tarafından Kasım ayındaki Ignite konferansında NVIDIA GB200 dağıtımı hakkında daha fazla ayrıntı paylaşılması bekleniyor.