Nvidia, en yeni nesil Blackwell Ultra GB300 NVL72 rack-sistemini kullanarak MLPerf kıyaslamalarında kendi rekorlarını kırdığını duyurdu. Şirket, DeepSeek R1 testlerinde Blackwell tabanlı GB200 platformuna kıyasla %45'lik bir çıkarım (inference) performansı artışı elde ettiğini iddia ediyor. Donanım iyileştirmeleri ve yazılım optimizasyonlarını bir araya getiren Nvidia, çeşitli modelleri çalıştırırken en üst sırayı aldığını ve bunun yapay zeka üretim süreçlerini iyileştirerek gelir artışı sağlayabileceğini belirtiyor.
Nvidia'nın Blackwell mimarisi, en yeni nesil grafik kartlarının temelini oluşturuyor. Bu mimari aynı zamanda GB200 platformu gibi büyük yapay zeka işlem gücü sağlayan sistemlerin de kalbinde yer alıyor. Blackwell Ultra, GB300 olarak adlandırılan bu platformun daha gelişmiş bir versiyonu olup, daha da yüksek performans sunuyor. Nvidia, bu yeni sistemle etkileyici MLPerf rekorlarına imza attı.
MLPerf kıyaslamalarının en son sürümü, DeepSeek R1, Llama 3.1 405B, Llama 3.1 8B ve Whisper modellerini kullanarak çıkarım performansı testlerini içeriyor. GB300 NVL72, bu testlerin tamamında öne çıktı. Nvidia, DeepSeek modelini çalıştırırken GB200'e kıyasla %45'lik bir performans artışı ve daha eski Hopper GPU'larına kıyasla beş kata kadar daha iyi performans elde ettiğini belirtiyor. Ancak, bu karşılaştırmalı sonuçların doğrulanmamış üçüncü taraf verilerine dayandığını da ekliyor.
Bu performans artışlarının bir kısmı, Blackwell Ultra ile birlikte kullanılan daha yetenekli tensör çekirdeklerinden kaynaklanıyor. Nvidia, dikkat katmanı hızlandırmasında %2 ve yapay zeka hesaplama FLOPS'unda %1,5'lik bir artış bildirdi. Ayrıca, bir dizi önemli yazılım iyileştirmesi ve optimizasyonu da bu başarının önemli bir parçası oldu.
Nvidia, bu optimizasyonların bir parçası olarak NVFP4 formatını yoğun bir şekilde kullandı. Bu format, DeepSeek R1 ağırlıklarını nicelleştirerek genel model boyutunu azaltmayı ve böylece doğruluktan ödün vermeden Blackwell Ultra'nın hesaplamaları hızlandırmasını sağladı.
Daha büyük Llama 3.1 405B modeli gibi diğer kıyaslamalar için Nvidia, modeli aynı anda birden fazla GPU'ya bölmeyi (sharding) başardı. Bu, gecikme standartlarını korurken daha yüksek bir çıkarım hacmi sağladı. Bu başarı, her bir 72 GPU arasındaki 1.8 TBps NVLink bağlantısı ve toplamda 130 TBps bant genişliği sayesinde mümkün oldu.
Tüm bu gelişmeler, Nvidia'nın Blackwell Ultra'yı "yapay zeka fabrikaları" geliştirmek için ekonomik olarak dönüştürücü bir çözüm olarak sunmasının bir parçası. Geliştirilmiş donanım ve yazılım optimizasyonları sayesinde elde edilen daha yüksek çıkarım performansı, GB300'ü veri merkezi iş yüklerinin geleceğinde daha karlı bir platform haline getiriyor. GB300 sevkiyatlarının bu ay başlamasıyla birlikte, bu yeni kıyaslama sonuçlarının zamanlaması dikkate değer.