Teknoloji devi Microsoft, bulut bilişim platformu Azure'u NVIDIA'nın en yeni Grace Blackwell GB300 GPU'ları ile güçlendirerek yapay zeka alanında çığır açacak bir gelişmeye imza attı. Bu kapsamda, dünya üzerinde ilk kez 'süper bilgisayar ölçeğinde' bir GB300 NVL72 kümesi Azure bulutunda kullanıma sunuldu.
Bu devasa küme, toplamda 4.608 adet GB300 GPU'yu NVIDIA'nın NVLink 5 ve Quantum-X800 InfiniBand ağ teknolojileriyle birbirine bağlıyor. Bu entegrasyon sayesinde, her bir NVL72 sunucu rafı tek bir birleşik hızlandırıcı gibi çalışarak 92.1 exaFLOPS'luk FP4 çıkarım gücü sunuyor. Ayrıca, bu küme, GB300 GPU'ların her biri için 800 Gb/s'lik bant genişliği ile birlikte toplamda 130 TB/s bellek bant genişliği sağlıyor.
NVIDIA tarafından belirtilen 4.608 GPU sayısı, 64 adet GB300 NVL72 sisteminin bir araya gelmesiyle oluşuyor. Her bir sunucu rafı 72 adet Blackwell GPU ve 36 adet Grace CPU barındırıyor. Bu güçlü mimari, OpenAI'nin iş yükleri için özel olarak ayrılmış durumda ve gelişmiş akıl yürütme modellerinin daha hızlı çalışmasını sağlayarak, model eğitim sürelerini aylardan haftalara indirmeyi hedefliyor.
Sunucu rafı düzeyinde, her bir NVL72 sistem, 37 terabaytlık birleşik "hızlı bellek" ile destekleniyor. Bu bellek, GPU'lar için 20 TB HBM3E ve Grace CPU'lar için 17 TB LPDDR5X'ten oluşuyor. NVLink 5 teknolojisi bu belleği tek bir havuzda birleştirerek her rafın tek bir güçlü hızlandırıcı gibi hareket etmesini sağlıyor.
GB300 NVL72 kümesi, yoğun iş yükleri altında su kullanımını en aza indirmek için özel olarak tasarlanmış sıvı soğutma sistemlerine sahip. Bu yeni nesil kümenin konuşlandırılması için veri merkezlerinin her katmanının yeniden tasarlandığı belirtiliyor. Microsoft, bunun GB300 teknolojisinin küresel çapta yaygınlaşmasının ilk adımı olduğunu ve tam ölçekli potansiyele ulaşılacağının altını çiziyor. OpenAI ve Microsoft'un halihazırda model eğitimi için GB200 kümelerini kullandığı göz önüne alındığında, bu gelişme iş birliklerinin doğal bir uzantısı olarak görülüyor.
NVIDIA'nın OpenAI'ye olan yatırımının büyüklüğü düşünüldüğünde, bu GB300 NVL72 süper kümesi, gelecekteki yapay zeka altyapılarının bir ön gösterimi niteliğinde. Microsoft'un OpenAI için NVIDIA donanımlarını kullanarak bu kümeyi devreye alması, iki şirket arasındaki stratejik ortaklığın somut bir örneği.