Yapay zeka dünyasının en güçlü platformlarından biri olan NVIDIA Vera Rubin, artık tam kapasite üretime geçti ve yapay zeka fabrikalarına entegre edilmeye hazır.
NVIDIA Vera Rubin Gecikme Söylentilerini Çürütüyor, Kitlesel Üretim ve Yapay Zeka Dağıtımına Başlıyor
NVIDIA, yaklaşık iki hafta önce Vera CPU'larının seri üretimine başladığını duyurmuştu. Bu yeni işlemcilerin 200 milyar dolarlık bir pazar payı açması bekleniyor. NVIDIA, Vera ile bu yılın en büyük CPU tedarikçisi olmayı hedefliyor. Şimdi ise, kod adı Vera Rubin NVL72 olan tüm platformun tam üretime geçtiği ve küresel çapta milyarlarca dolarlık yapay zeka fabrikalarını desteklemeye hazırlandığı bildirildi.
NVIDIA'nın Rubin platformu, fabrikalardan çıkan ve NVIDIA laboratuvarlarında test edilen altı farklı çipten oluşuyor. Bu çipler şunları içeriyor:
- Rubin GPU (336 milyar transistörlü)
- Vera CPU (227 milyar transistörlü)
- NVLINK 6 Ara Bağlantı Anahtarı
- CX9 & BF4 Ağ Kartları
- Spectrum-X 102.4T CPO Silikon Fotonik Çözümü
Bu çiplerin bir araya gelmesiyle, çeşitli DGX, HGX ve MGX sistemlerinde çalışan Rubin platformu hayat buluyor. Her veri merkezinin kalbinde ise, iki Rubin GPU, bir Vera CPU ve HBM4 ile LPDDR5x konfigürasyonlarında devasa bellek barındıran NVIDIA Vera Rubin Süperçipi yer alıyor. NVIDIA Rubin teknolojisinin öne çıkan özellikleri arasında şunlar bulunuyor:
- 6. Nesil NVLink (3.6 TB/s Ölçeklendirme)
- Vera CPU (Özel Olympus Çekirdeği)
- Rubin CPU (50 PF NVFP4 Transformatör Motoru)
- 3. Nesil Gizli Hesaplama (Rack Ölçekli TEE)
- 2. Nesil RAS Motoru (Sıfır Kesinti Sağlık Kontrolleri)
Rubin GPU, çok sayıda işlem ve tensör çekirdeği içeren iki retikül kalıbına sahip. Tamamen yapay zeka yoğun iş yükleri için tasarlanan bu çip, sırasıyla Blackwell'e göre 5 kat ve 3.5 kat artışla 50 FLOPs NVFP4 Çıkarım ve 35 PFLOPs NVFP4 Eğitim performansı sunuyor. Ayrıca, çip HBM4 belleğe sahip ve her çip için 22 TB/s'ye kadar bant genişliği sağlıyor, bu da Blackwell'e göre 2.8 kat artış anlamına geliyor. Her CPU için ise 3.6 TB/s NVLink bant genişliği sunuluyor, bu da Blackwell'e göre 2 kat artış demek.
Vera CPU için NVIDIA, Olympus kod adlı yeni nesil özel Arm mimarisini geliştirdi. Bu çip, 88 çekirdek, 176 iş parçacığı (NVIDIA Uzamsal Çoklu İşleme ile), 1.8 TB/s NVLink-C2C eşzamanlı bellek ara bağlantısı, 1.5 TB sistem belleği (Grace'in 3 katı) ve SOCAMM LPDDR5X ile 1.2 TB/s bellek bant genişliği sunuyor. Bu özellikler, Grace'e kıyasla 2 kat veri işleme, sıkıştırma ve CI/CD performansı sağlıyor.
NVLink 6 anahtarları, Rubin platformunda 400G SerDes, CPU başına 3.6 TB/s tüm-yönlü bant genişliği, toplamda 28.8 TB/s bant genişliği, ağ içinde 14.4 TFLOPS FP8 hesaplama gücü ve %100 sıvı soğutmalı tasarım ile ağ oluşturma yetenekleri sunuyor.
Ağ bağlantısı, en son ConnectX-9 ve BlueField-4 modülleri tarafından destekleniyor. ConnectX-9 SuperNIC, 1.6 TB/s bant genişliği, 200G PAM4 SerDes, programlanabilir RDMA ve veri yolu hızlandırıcı, üst düzey güvenlik sunuyor ve büyük ölçekli yapay zeka için optimize edilmiş durumda.
Bluefield-4 ise akıllı ağ kartı ve depolama işlemcisi için 800G DPU olarak hizmet veriyor. 64 çekirdekli Grace CPU ile ConnectX-9'u entegre eden bu çözüm, BlueField-3'e göre 2 kat ağ yeteneği, 6 kat işlem gücü ve 3 kat bellek bant genişliği sağlıyor.
Tüm bu bileşenler, Blackwell'e kıyasla etkileyici performans artışları sunan NVIDIA Vera Rubin NVL72 raf sisteminde bir araya geliyor:
- 5x NVFP4 Çıkarım (3.6 EFLOPS)
- 3.5x NVFP4 Eğitim (2.5 EFLOPS)
- 2.5x LPDDR5x Kapasitesi (54 TB)
- 1.5x HBM4 Kapasitesi (20.7 TB)
- 2.8x HBM4 Bant Genişliği (1.6 PB/s)
- 2x Ölçeklendirme Bant Genişliği (260 TB/s)
NVIDIA ayrıca, 102.4 Tb/s ölçeklenebilir anahtar altyapısı, entegre 200G silikon fotonik ve ölçekte %95 etkin bant genişliği sunan Spectrum-X Ethernet Entegre Optik çözümüyle dikkat çekiyor. Bu sistem, 5 kat daha verimli, 10 kat daha güvenilir ve 5 kat daha yüksek uygulama çalışma süresi sunuyor.
Rubin SuperPOD için NVIDIA, devasa ölçekte çıkarım işlemleri için tasarlanmış ve Dynamo, NIXL & DOCA gibi NVIDIA yazılım çözümleriyle tam entegre olan Çıkarım Bağlam Bellek Depolama platformunu da tanıtıyor.
Sonuç olarak NVIDIA, Rubin platformunu en gelişmiş DGX SuperPOD'unda 8 adet Vera Rubin NVL72 raf ile sunacak. Bunun yanı sıra, ana akım veri merkezleri için NVIDIA DGX Rubin NVL8 de kullanıma sunulacak.
Tüm bu ilerlemelerle birlikte NVIDIA Rubin, çıkarım token maliyetinde 10 kat, MoE modellerini eğitmek için gereken GPU sayısında ise Blackwell GB200'e kıyasla 4 kat azalma sağlıyor. Rubin ekosistemi, geniş bir iş ortağı ağı tarafından destekleniyor ve tam üretimde olup, müşteriler yılın ilerleyen aylarında ilk çiplerini teslim almaya başlayacak.