Ara

NVIDIA’dan Yapay Zeka Devrimi: Blackwell Ultra GB300 ile Tanışın!

NVIDIA, yapay zeka alanındaki en hızlı işlemcisi olan Blackwell Ultra GB300'ü detaylı bir şekilde tanıttı. GB200'den %50 daha hızlı ve 288 GB belleğe sahip bu yeni çip, yapay zeka fabrikası çağını şekillendirecek niteliklere sahip.

NVIDIA Blackwell Ultra "GB300": Yapay Zeka İçin Bir Mucize Çip

NVIDIA, en yeni ve en güçlü yapay zeka çipi GB300 Blackwell Ultra'yı hakkında ayrıntılı bir makale yayımladı. Tamamen üretime giren ve önemli müşterilere dağıtılan bu çip, Blackwell çözümlerinin bir uzantısı olmasına rağmen performans ve özellikler açısından önemli bir iyileştirme sunuyor. Tıpkı NVIDIA Super serisinin orijinal RTX oyun kartlarının daha iyi bir versiyonu olması gibi, Ultra serisi de başlangıçta tanıtılan yapay zeka çiplerinin geliştirilmiş bir versiyonu olarak karşımıza çıkıyor.

Peki, Blackwell Ultra GB300 nedir? Bu, TSMC'nin NVIDIA için optimize edilmiş 4NP (5nm) üretim süreciyle üretilen, iki Reticle boyutunda çekirdeği NVIDIA'nın NV-HBI yüksek bant genişlikli arayüzü ile birbirine bağlayarak tek bir GPU gibi davranmasını sağlayan geliştirilmiş bir versiyon. Bu yoğun GPU, toplam 208 milyar transistör barındırıyor. NV-HBI arayüzü, iki GPU çekirdeği arasında 10 TB/s bant genişliği sunarken, tek bir çip gibi çalışıyor.

NVIDIA Blackwell Ultra GB300 GPU, her biri 128 CUDA çekirdeği, FP8, FP6, NVFP4 hassasiyetli 4 adet 5. Nesil Tensor çekirdeği, 256 KB Tensor Belleği (TMEM) ve SFU'lar içeren toplam 160 SM'ye sahip. Bu da toplamda 20.480 CUDA çekirdeği, 640 Tensor çekirdeği ve 40 MB TMEM anlamına geliyor. Özellikle 5. Nesil Tensor Çekirdekleri, tüm yapay zeka işlem operasyonlarından sorumlu ve NVIDIA her nesilde önemli yenilikler sunuyor:

  • NVIDIA Volta: Eğitim için FP32 birikimli 8 iş parçacıklı MMA birimleri, FP16.
  • NVIDIA Ampere: Tam warp-genişliği MMA, BF16 ve TensorFloat-32 formatları.
  • NVIDIA Hopper: 128 iş parçacığı boyunca warp-grup MMA, FP8 desteği ile Transformer Engine.
  • NVIDIA Blackwell: 2. Nesil Transformer Engine, FP8, FP6, NVFP4 işlem gücü ve TMEM Belleği.

Blackwell Ultra, önceki Blackwell GB200 çözümlerindeki maksimum 192 GB'a kıyasla 288 GB HBM3e bellek kapasitesi ile bellekte de büyük bir iyileştirme getiriyor. Bu yükseltme, NVIDIA'yı trilyonlarca parametreye sahip yapay zeka modellerini desteklemeye yönlendirecek. 8 yığın halinde gelen bellek, 16 adet 512-bit denetleyici (8192-bit geniş arayüz) ile 8 TB/s bellek bant genişliği sağlıyor. Bu bellek şunları mümkün kılıyor:

  • Tam Model Yerleşimi: Bellek boşaltma olmadan 300 milyardan fazla parametreye sahip modellerin çalıştırılması.
  • Genişletilmiş Bağlam Uzunlukları: Transformer modelleri için daha büyük KV önbellek kapasitesi.
  • Geliştirilmiş İşlem Verimliliği: Çeşitli iş yükleri için daha yüksek işlem-bellek oranları.

Blackwell üzerindeki ara bağlantı, NVLINK Switch, NVLINK-C2C tarafından sağlanan NVLINK teknolojisi ve ayrıca ana GPU'lara bağlanmak için PCIe Gen6 x16 arayüzü kullanılıyor. NVLINK 5 ve ana bilgisayar tarafı bağlantı özellikleri ise şunları içeriyor:

  • GPU Başına Bant Genişliği: 1.8 TB/s çift yönlü (18 bağlantı x 100 GB/s).
  • Performans Ölçeklendirmesi: NVLink 4'e (Hopper GPU) göre 2 kat iyileştirme.
  • Maksimum Topoloji: Engelsiz hesaplama kumaşında 576 GPU.
  • Raf Ölçeğinde Entegrasyon: 130 TB/s toplam bant genişliğine sahip 72 GPU'luk NVL72 konfigürasyonları.
  • PCIe Arayüzü: Gen6 x16 hatları (256 GB/s çift yönlü).
  • NVLink-C2C: Bellek tutarlılığı ile Grace CPU-GPU iletişimi (900 GB/s).

NVIDIA'nın Blackwell Ultra GB300 platformu, yeni NVFP4 standardını kullanarak yoğun düşük hassasiyetli işlem çıktısında %50'lik bir artış sağlıyor. Yeni model, FP8'e yakın doğruluk sunuyor ve farklar genellikle %1'in altında kalıyor. Bu aynı zamanda FP8'e kıyasla 1.8 kat, FP16'ya kıyasla ise 3.5 kat daha az bellek ayak izi anlamına geliyor.

Blackwell Ultra ayrıca gelişmiş zamanlama yönetimi ve aşağıdaki gibi yeni kurumsal düzeyde güvenlik özellikleri sunuyor:

  • Geliştirilmiş GigaThread Motoru: Tüm 160 SM'de iyileştirilmiş bağlam değiştirme performansı ve optimize edilmiş iş yükü dağıtımı sağlayan yeni nesil iş zamanlayıcı.
  • Çoklu Örnek GPU (MIG): Blackwell Ultra GPU'ları farklı boyutlarda MIG örneğine bölünebilir. Örneğin, bir yönetici her biri 140 GB belleğe sahip iki örnek, her biri 70 GB'a sahip dört örnek veya her biri 34 GB'a sahip yedi örnek oluşturabilir. Bu, öngörülebilir performans izolasyonu ile güvenli çok kiracılığa olanak tanır.
  • Gizli Hesaplama ve Güvenli Yapay Zeka: Hassas yapay zeka modelleri ve verileri için güvenli ve yüksek performanslı koruma. Blackwell mimarisindeki endüstri lideri TEE-I/O yetenekleri ve şifrelenmemiş modlara kıyasla neredeyse aynı verimle satır içi NVLink koruması ile donanım tabanlı Güvenli Yürütme Ortamını (TEE) GPU'lara genişletiyor.
  • Gelişmiş NVIDIA Uzaktan Doğrulama Hizmeti (RAS) Motoru: Büyük ölçekli dağıtımlarda binlerce parametreyi izleyerek arızaları tahmin eden, bakım programlarını optimize eden ve sistem çalışma süresini en üst düzeye çıkaran yapay zeka destekli güvenilirlik izleme sistemi.

Performans verimliliği, Blackwell Ultra GB300'ün öne çıktığı bir diğer alan. Aşağıdaki grafikte gösterildiği gibi, Blackwell GB200'den daha yüksek TPS/MW sunuyor.

Tüm bu gelişmeler, NVIDIA'nın Blackwell ve Blackwell Ultra gibi mühendislik harikalarıyla yapay zeka alanında zirvede olduğunu gösteriyor. Kapsamlı yazılım desteği ve optimizasyonları, onları rakiplerinden bir adım öne taşıyor ve yıllık donanım güncellemeleri ile artan Ar-Ge çalışmaları, önümüzdeki yıllarda da bu liderliklerini sürdürecek gibi görünüyor.

Önceki Haber
Meta, Yapay Zeka İçin Devrim Yarattı: Catalina Pod Sistemi NVIDIA'nın Gücünü Sıvı Soğutma ve Open Rack v3 ile Buluşturuyor
Sıradaki Haber
ABD'den Intel'e Çip Üretimi Desteği: TSMC'ye Rakip Olacak Mı?

Benzer Haberler: