Teknoloji dünyasının nabzını tutan CES 2026 fuarında yapay zeka rüzgarı esiyor ve bu alanda Nvidia'nın GPU'ları merkezi bir rol üstleniyor. Nvidia CEO'su Jensen Huang, şirketin yapay zeka alanındaki liderliğini sürdürme vizyonunu ve teknolojinin sohbet robotlarının ötesine geçerek robotik, otonom araçlar ve fiziksel dünya gibi alanlara yayılma potansiyelini paylaştı. Bu kapsamda, Nvidia'nın yeni nesil veri merkezi mimarisi Vera Rubin tanıtıldı.
Vera Rubin NVL72: Altı Çipin Gücü Bir Arada
Nvidia'nın "ekstrem eş tasarım" anlayışının bir ürünü olan Vera Rubin, altı farklı çip türünü bir araya getiriyor: Vera CPU, Rubin GPU, NVLink 6 anahtarı, ConnectX-9 SuperNIC, BlueField-4 veri işleme ünitesi (DPU) ve Spectrum-6 Ethernet anahtarı. Bu bileşenler, Vera Rubin NVL72 rafını oluşturan temel yapı taşlarıdır.
Performans ve Maliyet Avantajı
Yapay zeka hesaplama gücüne olan talep giderek artarken, her bir Rubin GPU, önceki nesil Blackwell GB200'e kıyasla 5 kat daha fazla çıkarım performansı (50 PFLOPS NVFP4 veri tipi ile) ve 3.5 kat daha fazla eğitim performansı (35 PFLOPS NVFP4 ile) sunuyor. Bu güçlü işlem gücünü beslemek için her Rubin GPU paketi, 288 GB kapasite ve 22 TB/s bant genişliği sunan sekiz HBM4 bellek yığınına sahip.
Gelişmiş Bağlantı ve Bellek Teknolojileri
Büyük dil modellerinin giderek daha karmaşık hale gelmesiyle birlikte, modeller arasındaki iletişim büyük bant genişliği gerektiriyor. Vera Rubin, GPU başına 3.6 TB/s (iki yönlü) fabrika bant genişliği sağlayan NVLink 6 ile bu ihtiyaca yanıt veriyor. Her NVLink 6 anahtarı 28 TB/s bant genişliğine sahipken, her Vera Rubin NVL72 rafı, toplam 260 TB/s'lik bir ölçeklendirme bant genişliği için dokuz anahtar barındırıyor.
Vera CPU, "uzamsal çoklu iş parçacığı" özelliğine sahip 88 özel Olympus Arm çekirdeği ile 176 iş parçacığına kadar destek sunuyor. Vera CPU ile Rubin GPU'larını birbirine bağlayan NVLink C2C ara bağlantısının bant genişliği iki katına çıkarak 1.8 TB/s'ye ulaştı. Her Vera CPU, 1.2 TB/s bellek bant genişliği ile 1.5 TB'a kadar SOCAMM LPDDR5X belleği adresleyebiliyor.
Ölçeklenebilirlik ve Ağ Yapısı
Vera Rubin NVL72 raflarını sekiz raf içeren DGX SuperPod'lara ölçeklendirmek için, Nvidia Spectrum-6 çipinden üretilen ve optik bileşenleri entegre edilmiş iki adet Spectrum-X Ethernet anahtarını piyasaya sürüyor. Her Spectrum-6 çipi 102.4 Tb/s bant genişliği sunarken, Nvidia bunu iki anahtar olarak sunuyor. SN688 modeli 409.6 Tb/s bant genişliği ile 512 adet 800G Ethernet veya 2048 adet 200G Ethernet portu sağlarken, SN6810 modeli 102.4 Tb/s bant genişliği ile 128 adet 800G veya 512 adet 200G Ethernet portu sunuyor. Bu anahtarlar sıvı soğutmalı olup, daha güç verimli, daha güvenilir ve daha iyi çalışma süresi vaat ediyor.
Bağlam Belleği ve Güvenlik
Yapay zeka modellerindeki bağlam pencereleri milyonlarca tokena ulaştıkça, modelle olan etkileşimlerin geçmişini tutan anahtar-değer önbelleğindeki işlemler, çıkarım performansını darboğaza neden oluyor. Bu sorunu çözmek için Nvidia, yeni nesil BlueField 4 DPU'larını kullanarak "Çıkarım Bağlam Belleği Depolama Platformu" adını verdiği yeni bir bellek katmanı oluşturuyor. Bu depolama katmanı, yapay zeka altyapısı genelinde anahtar-değer önbelleği verilerinin verimli bir şekilde paylaşılmasını ve yeniden kullanılmasını sağlayarak daha iyi yanıt verme süresi, daha yüksek verimlilik ve öngörülebilir, güç tasarruflu ajan yapay zeka mimarileri sunmayı hedefliyor.
Vera Rubin ile ilk kez Nvidia'nın güvenilir yürütme ortamı, çip, fabrika ve ağ seviyesinde güvenlik sağlayarak tüm rafa genişletiliyor. Bu, yapay zeka öncü laboratuvarlarının kritik modellerinin gizliliğini ve güvenliğini sağlamada önemli bir rol oynuyor.
Genel Performans ve Maliyet Etkinliği
Toplamda, her Vera Rubin NVL72 rafı 3.6 exaFLOPS NVFP4 çıkarım performansı, 2.5 exaFLOPS NVFP4 eğitim performansı, Vera CPU'lara bağlı 54 TB LPDDR5X bellek ve 1.6 PB/s bant genişliği sunan 20.7 TB HBM4 bellek sunuyor. Bu rafları verimli tutmak için Nvidia, kablosuz modüler tepsi tasarımı, sıfır kesintiyle bakım imkanı sunan gelişmiş NVLink dayanıklılığı ve sıfır kesintiyle sağlık kontrolü sağlayan ikinci nesil RAS motoru gibi güvenilirlik, kullanılabilirlik ve servis edilebilirlik (RAS) iyileştirmeleri vurguluyor.
Tüm bu üstün işlem gücü ve bant genişliği etkileyici olsa da, toplam sahip olma maliyeti yapay zeka alanındaki devasa yatırımları planlayan Nvidia ortakları için büyük önem taşıyor. Nvidia'ya göre, Vera Rubin ile MoE modellerini eğitmek için Blackwell'e kıyasla 4 kat daha az GPU gerekiyor ve Rubin, MoE çıkarımında token başına maliyeti 10 kata kadar azaltabiliyor. Bu, Rubin'in aynı raf alanında eğitim verimliliğini artırabileceği ve çok daha fazla token üretebileceği anlamına geliyor.
Nvidia, Vera Rubin NVL72 sistemlerini oluşturmak için ihtiyaç duyduğu altı çipin de fabrikalardan alındığını ve üzerinde çalışılan iş yüklerinde performansından memnun olduğunu belirtti. Şirket, Vera Rubin NVL72 sistemlerinin toplu üretimine 2026'nın ikinci yarısında başlanmasının beklendiğini ve bunun Rubin'in kullanılabilirliği ile ilgili önceki projeksiyonlarla tutarlı olduğunu ifade etti.