Yapay zeka (YZ) alanındaki baş döndürücü gelişmeler, bu devasa sistemleri çalıştıran donanımların da evrimleşmesine neden oluyor. Nvidia, bu evrimin en yeni hamlesini yeni Rubin CPX GPU'sunu duyurarak gösterdi. Bu yeni nesil GPU, özellikle uzun bağlamlı YZ iş yüklerinin taleplerini karşılamak üzere özel olarak tasarlandı.
Rubin CPX, yakında piyasaya sürülecek olan Vera Rubin NVL144 CPX rack'in çıkarım (inference) performansını en üst düzeye çıkarmayı hedefliyor. Nvidia'nın yeni çıkarım stratejisi, "bölünmüş çıkarım" (disaggregated inference) olarak adlandırılıyor ve en yüksek performansa ulaşmak için farklı türde GPU'ların bir arada çalışmasına dayanıyor. Bu yaklaşımda, işlem gücü odaklı GPU'lar "bağlam aşamasını" yönetirken, bellek bant genişliği odaklı farklı çipler ise yoğun "üretim aşamasını" üstleniyor.
Günümüzün en gelişmiş YZ iş yükleri, çok adımlı akıl yürütme ve kalıcı bellek gibi özellikler gerektiriyor. Yapay video üretimi veya ajan YZ gibi alanlarda, devasa miktarda bağlam bilgisine erişim büyük önem taşıyor. Bu tür büyük YZ modellerinin çıkarım süreci, model eğitimi kadar donanım geliştirmenin yeni cephesi haline gelmiş durumda.
Bu noktada Rubin CPX GPU, bölünmüş çıkarımın işlem gücü gerektiren bağlam aşamasında güçlü bir iş gücü olarak öne çıkıyor. Standart Rubin GPU ise bellek bant genişliği açısından daha kısıtlı olan üretim aşamasında görev alacak. Rubin CPX, şirketin yeni NVFP4 veri tipi üzerinde 30 petaFLOPS ham işlem gücü sunarken, 128 GB GDDR7 belleğe sahip. Karşılaştırma yapmak gerekirse, standart Rubin GPU, 50 PFLOPs FP4 işlem gücü ve 288 GB HBM4 bellekle gelecek.
Rubin CPX GPU'nun ilk örnek tasarımları tek yonga (single-die) bir GPU tasarımına sahip gibi görünüyor. Standart Rubin GPU ise iki yongalı (dual-die) bir çiplet tasarımı olacak. Bu durum, Rubin CPX'in tam ölçekli bir Rubin GPU'nun hiper optimize edilmiş tek bir dilimi olabileceği spekülasyonlarına yol açıyor.
Rubin CPX'in HBM4 yerine GDDR7 bellek kullanma tercihi de bir optimizasyon göstergesi. Bölünmüş çıkarım iş akışlarında, çıkarım süreci Rubin ve Rubin CPX GPU'ları arasında bölünecek. İşlem gücü odaklı Rubin CPX, bir görev için gerekli bağlamı oluşturduktan sonra (bu aşamada GDDR7'nin performans parametreleri yeterli olacaktır), topu yüksek bant genişlikli bellekten faydalanan üretim aşaması için bir Rubin GPU'ya devredecek.
Rubin CPX, Nvidia'nın 2026'da piyasaya sürmeyi planladığı Vera Rubin NVL144 CPX rack'inde yer alacak. Bu rack, 144 adet Rubin GPU, 144 adet Rubin CPX GPU, 36 adet Vera CPU, 100 TB yüksek hızlı bellek ve 1.7 PB/s bellek bant genişliği ile birlikte toplam 8 exaFLOPS NVFP4 performansıyla gelecek. Bu, mevcut nesil GB300 NVL72'ye göre 7.5 kat daha yüksek performans anlamına geliyor ve CPX olmadan temel Vera Rubin NVL144'ün 3.6 exaFLOPS'unu geride bırakıyor.
Nvidia, Rubin CPX içeren YZ sistemlerine yapılacak 100 milyon dolarlık yatırımın, 5 milyar dolarlık gelire dönüşebileceğini iddia ediyor. Yaklaşan Vera Rubin YZ platformu hakkında daha fazla bilgi için Nvidia'nın yol haritasına göz atılabilir. Rubin, Rubin CPX ve Vera Rubin'in tamamını Mart ayında GTC 2026'daki Nvidia sunumunda görmeyi bekliyoruz.