Yapay zeka alanında devrim yaratması beklenen NVIDIA'nın Rubin platformu resmen duyuruldu. Bu yeni platform, veri merkezlerinin kalbini oluşturacak ve mevcut Blackwell mimarisine kıyasla tam 5 kat daha yüksek performans sunacak.
NVIDIA Yapay Zeka Pazarlarını Rubin Platformu ile Fethetmeye Hazırlanıyor: Altı Çip, Tek Bir 50 PFLOP & HBM4 Destekli GPU, 88 Olympus Çekirdekli Vera CPU ve Blackwell Karşısında Etkileyici Yükselişler, Şimdi Tam Üretimde
NVIDIA, geleneksel etkinliklerini beklemeden, yapay zeka alanındaki heyecan verici gelişmeler ışığında göz kamaştırıcı Rubin platformunu erken duyurdu. Bu yeni platform, veri merkezleri için gelecek nesil çözümler sunmayı hedefliyor.
Rubin platformu, tamamı üretimden çıkan ve NVIDIA'nın laboratuvarlarında test edilen altı farklı çipten oluşuyor. Bu çipler şunları içeriyor:
- Rubin GPU (336 Milyar Transistörlü)
- Vera CPU (227 Milyar Transistörlü)
- NVLINK 6 Bağlantı Anahtarı
- CX9 & BF4 Ağ Kartları
- Spectrum-X 102.4T CPO (Silikon Fotonik)
Bu çiplerin bir araya gelmesiyle oluşan Rubin platformu, DGX, HGX ve MGX sistemlerinde hayat buluyor. Her veri merkezinin kalbinde, iki Rubin GPU, bir Vera CPU ve HBM4 ile LPDDR5x konfigürasyonlarında muazzam miktarda belleğe sahip NVIDIA Vera Rubin Superchip yer alıyor. NVIDIA Rubin teknolojisinin öne çıkan özellikleri arasında şunlar bulunuyor:
- 6. Nesil NVLink (3.6 TB/s Ölçeklendirme)
- Vera CPU (Özel Olympus Çekirdeği)
- Rubin CPU (50 PF NVFP4 Transformer Motoru)
- 3. Nesil Gizli Hesaplama (İlk Raf Ölçekli TEE)
- 2. Nesil RAS Motoru (Sıfır Kesinti Süreli Sağlık Kontrolleri)
Rubin GPU, yapay zeka yoğun iş yükleri için özel olarak tasarlanmış olup, her biri bol miktarda hesaplama ve tensör çekirdeği barındıran iki farklı kalıptan oluşuyor. Bu GPU, 50 FLOP NVFP4 Çıkarım ve 35 PFLOP NVFP4 Eğitim performansı sunarak, Blackwell'e kıyasla sırasıyla 5 kat ve 3.5 kat artış sağlıyor. Ayrıca, çip başına 22 TB/s'ye kadar bellek bant genişliği sunan HBM4 bellek ve çip başına 3.6 TB/s NVLink bant genişliği ile dikkat çekiyor.
Vera CPU için NVIDIA, Olympus kod adlı yeni nesil özel Arm mimarisini geliştirdi. Bu çip, 88 çekirdek, 176 iş parçacığı (NVIDIA Uzamsal Çoklu İşlem Teknolojisi ile), 1.8 TB/s NVLink-C2C uyumlu bellek bağlantısı, 1.5 TB sistem belleği (Grace'in 3 katı) ve 1.2 TB/s bellek bant genişliği ile SOCAMM LPDDR5X teknolojisini kullanıyor. Raf ölçekli gizli hesaplama yetenekleri sayesinde, Grace'e kıyasla 2 kat daha fazla veri işleme, sıkıştırma ve CI/CD performansı sunuyor.
NVLink 6 anahtarları, 400G SerDes, çip başına 3.6 TB/s ağ bağlantısı ve toplamda 28.8 TB/s bant genişliği ile Rubin platformunun ağ altyapısını oluşturuyor. Ayrıca, 14.4 TFLOPS FP8 hesaplama gücü ve tamamen sıvı soğutmalı tasarımı ile öne çıkıyor.
Ağ iletişimi, en yeni ConnectX-9 ve BlueField-4 modülleri tarafından destekleniyor. ConnectX-9 SuperNIC, 1.6 TB/s bant genişliği, programlanabilir RDMA ve veri yolu hızlandırıcıları, üst düzey güvenlik özellikleri ve devasa ölçekteki yapay zeka uygulamaları için optimize edilmiş yapısı ile öne çıkıyor.
BlueField-4 ise 800G DPU olarak hizmet veriyor ve SmartNIC ile depolama işlemcisi olarak kullanılıyor. Grace CPU ile entegre çalışarak, BlueField-3'e kıyasla 2 kat daha fazla ağ bağlantısı, 6 kat daha fazla işlem gücü ve 3 kat daha fazla bellek bant genişliği sunuyor.
Tüm bu bileşenler, Blackwell'e kıyasla etkileyici yükselişler sunan NVIDIA Vera Rubin NVL72 rafında bir araya geliyor:
- 5 kat daha fazla NVFP4 Çıkarım (3.6 EFLOPS)
- 3.5 kat daha fazla NVFP4 Eğitim (2.5 EFLOPS)
- 2.5 kat daha fazla LPDDR5x Kapasitesi (54 TB)
- 1.5 kat daha fazla HBM4 Kapasitesi (20.7 TB)
- 2.8 kat daha fazla HBM4 Bant Genişliği (1.6 PB/s)
- 2 kat daha fazla Ölçeklendirme Bant Genişliği (260 TB/s)
NVIDIA ayrıca, 102.4 Tb/s ölçekli anahtar altyapısı sunan Spectrum-X Ethernet Co-Packaged Optics çözümünü de tanıtıyor. Bu çözüm, etkili bant genişliğinin %95'ini ölçekte sunarken, 5 kat daha verimli, 10 kat daha güvenilir ve 5 kat daha yüksek uygulama çalışma süresi sağlıyor.
Rubin SuperPOD için NVIDIA, gigascaled çıkarım için tasarlanmış ve Dynamo, NIXL & DOCA gibi NVIDIA yazılım çözümleriyle tam entegre olan Çıkarım Bağlam Belleği Depolama platformunu da duyuruyor.
NVIDIA, Rubin platformunu en gelişmiş DGX SuperPOD sistemine, 8 adet Vera Rubin NVL72 raf ile entegre edecek. Bunun yanı sıra, ana akım veri merkezleri için NVIDIA DGX Rubin NVL8 de piyasaya sürülecek.
Tüm bu gelişmelerle birlikte NVIDIA Rubin, çıkarım jeton maliyetinde 10 kat, MoE modellerini eğitmek için gereken GPU sayısında ise Blackwell GB200'e kıyasla 4 kat azalma sunuyor. Rubin ekosistemi, çeşitli ortaklarla destekleniyor ve tam üretimde olup, müşteriler bu yılın sonlarına doğru ilk çiplerine kavuşacak.