NVIDIA'nın yeni nesil yapay zeka hızlandırıcısı Blackwell Ultra, özellikle veri merkezleri için tasarlanan GB300 NVL72 birimleriyle, düşük gecikmeli ve uzun bağlam gerektiren iş yüklerinde muazzam bir performans sergiliyor. Bu yeni nesil teknoloji, yapay zeka alanında yaşanan dönüşümü daha da hızlandıracak.
Yapay zeka sektörü, 2022'deki ilk yükselişinden bu yana önemli bir evrim geçirdi. Günümüzde ise gelişmiş modeller üzerine inşa edilen uygulamalar sayesinde 'ajan tabanlı' (agentic) bilişime doğru büyük bir kayma yaşanıyor. Bu bağlamda, NVIDIA gibi altyapı sağlayıcıları için, ajan tabanlı sistemlerin gecikme gereksinimlerini karşılamak üzere bol miktarda bellek bant genişliği ve performans sunmak giderek daha kritik hale geldi. Blackwell Ultra ile NVIDIA, bu ihtiyaca güçlü bir yanıt veriyor.
NVIDIA'nın paylaştığı yeni test sonuçlarına göre, Blackwell Ultra, özellikle 'token/watt' metriklerinde dikkat çekici bir iyileşme sağlıyor. GB300 NVL72 birimleri, önceki nesil Hopper GPU'lara kıyasla megawatt başına 50 kat daha fazla verimlilik sunuyor. Bu inanılmaz performans artışının temelinde, NVIDIA'nın NVLink teknolojisindeki yenilikleri yatıyor. Blackwell Ultra, 72 GPU'yu tek bir birleşik NVLink yapısı altında 130 TB/s'lik bir bağlantı hızıyla birleştiriyor. Hopper'ın 8 çipli NVLink tasarımıyla karşılaştırıldığında, Blackwell Ultra'nın üstün mimarisi, raf tasarımı ve NVFP4 hassasiyet formatı, bu muazzam verimliliğin anahtarı oluyor.
'Ajan tabanlı yapay zeka' dalgasının yükselişiyle birlikte, NVIDIA'nın GB300 NVL72 testleri, token maliyetlerine de odaklanıyor. Yukarıda bahsedilen iyileştirmeler sayesinde, her milyon token başına maliyette 35 katlık bir düşüş gözlemleniyor. Bu da GB300'ü, gelişmiş laboratuvarlar ve veri merkezleri için tercih edilen çıkarım (inference) seçeneği haline getiriyor. NVIDIA'nın 'ekstrem eş-tasarım' yaklaşımı ve sürekli gelişen ölçek yasaları, bu performans sıçramalarının arkasındaki ana etkenler olarak öne çıkıyor.
Uzun bağlam gerektiren iş yükleri açısından da Blackwell Ultra, önemli avantajlar sunuyor. GB300, GB200 ile karşılaştırıldığında, token başına maliyette 1.5 kata kadar düşüş ve dikkat işleme (attention processing) süresinde 2 kat hız artışı sağlıyor. Bu iyileştirmeler, ajan tabanlı sistemlerin karmaşık veri setleriyle daha etkili çalışabilmesi için büyük önem taşıyor.
Blackwell Ultra, veri merkezlerinde entegrasyon sürecindeyken, ilk benchmark sonuçları umut verici görünüyor. NVIDIA, performans ölçeklendirmesini günümüzün yapay zeka kullanım senaryolarına uygun şekilde korumayı başarmış durumda. Bu gelişmeler, NVIDIA'nın yapay zeka altyapısı alanındaki liderliğini pekiştiriyor.