NVIDIA, milyonlarca tokenlık kodlama ve üretken yapay zeka (GenAI) gibi devasa ölçekli yapay zeka görevleri için tasarlanmış yeni nesil Rubin AI platformu hakkında yeni detayları paylaştı. Platform, 128 GB'a kadar GDDR7 bellek ve 30 PFLOPs (FP4) işlem gücüne sahip yeni Rubin CPX çipini içerecek.
NVIDIA'nın Rubin GPU'ları ve Vera CPU'ları ile desteklenen yeni platform, önceki nesillere kıyasla önemli ölçüde hız ve verimlilik artışı vadediyor. Rubin CPX GPU'ları, özellikle büyük bağlam pencerelerine sahip yapay zeka uygulamaları için optimize edildi.
Vera Rubin NVL 144 CPX platformu, NVIDIA'nın Grace CPU'sunun halefi olan Vera CPU'ları ile birlikte bu yeni Rubin CPX GPU'larını barındıracak. Bu sistem, önceki Grace Blackwell GB300 NVL72 platformuna göre 7.5 kat daha fazla (8 Exaflops'a kadar) yapay zeka işlem gücü sunacak. Sistem ayrıca 100 TB'a kadar hızlı bellek ve 1.7 Petabayt bellek bant genişliği sağlayacak. Bu, GB300 NVL72'ye kıyasla 3 kat daha yüksek dikkat (attention) performansı anlamına geliyor.
CPX olmayan Vera Rubin NVL144 platformu ise dört adet Rubin GPU, 2 adet Vera CPU ile 3.6 Exaflops NVFP4 işlem gücü, 1.4 PB/s HBM4 bant genişliği ve 75 TB bellek kapasitesi sunacak. Bu platformun 2026'nın ikinci yarısında kullanıma sunulması planlanıyor.
Rubin CPX platformunun öne çıkan özellikleri arasında:
- 8.0 Exaflops NVFP4 (CPX olmayan platformda 3.6 Exaflops)
- 1.7 PB/s Bellek Bant Genişliği (CPX olmayan platformda 1.4 PB/s)
- 100 TB Bellek Kapasitesi (CPX olmayan platformda 75 TB)
- 2026 sonu kullanılabilirlik (CPX olmayan platformda 2026'nın ikinci yarısı)
Her bir Rubin CPX GPU çipi, 30 PFLOPs NVFP4 yapay zeka işlem gücü ve 128 GB'a kadar GDDR7 bellek sunacak. NVIDIA, veri merkezi platformlarında GDDR7 belleği tercih etmelerinin maliyet etkinliği nedeniyle olduğunu belirtiyor. Ayrıca bu GPU'lar, GenAI görevlerinde büyük rol oynayacak 4 kat daha fazla NVENC ve NVDNC yeteneğine sahip.
Rubin platformu, iki retikül boyutunda GPU'lar kullanırken, Rubin Ultra dört retikül boyutunda GPU'lar içerecek. Rubin CPX çipinin ise tek bir kalıp ve monolitik bir yapıya sahip olması bekleniyor. Üretim teknolojisi henüz bilinmiyor, ancak TSMC'nin N3 veya N2 süreci olması muhtemel görünüyor.
Bu çip, tüketiciye yönelik GeForce ve PRO platformları için sunulacak Rubin çiplerine dair bir ön izleme niteliği taşıyor. CPX'in, Blackwell GB202'nin yerini alacak chip ile aynı veya benzer bir versiyon olabileceği düşünülüyor.
NVIDIA, ilk Rubin CPX sistemlerinin 2026'nın sonuna kadar hazır olmasını beklerken, Vera Rubin platformunun ise GTC 2026'da tam olarak tanıtılması planlanıyor ve üretimine yakında başlanacak.