NVIDIA'nın yeni nesil yapay zeka sistemi Vera Rubin tam üretim aşamasında ve şirket, sistemin raf mimarisi hakkında ayrıntılı bilgiler paylaşarak tek tek bileşenlerini incelememize olanak tanıdı.
NVIDIA Vera Rubin: Altı Yeni Yükseltilmiş Çip, Gelişmiş Sıvı Soğutma ve Üst Düzey NVLink 6 Spine Özellikleri
Raf nesilleri söz konusu olduğunda NVIDIA, Vera Rubin ile büyük yükseltmelere imza atmaya hazırlanıyor. Son zamanlarda yayımlanan bir videoda Vera Rubin mimarisine derinlemesine bir bakış atılırken, ana işlemci düğümünden ağ ve soğutma bileşenlerine kadar pek çok parçanın detayları görüldü. NVIDIA Altyapı Kıdemli Direktörü Dion Harris, Vera Rubin'i "dünyanın en karmaşık yapay zeka sistemlerinden biri" olarak tanımlayarak, NVIDIA'nın yaptığı işin benzersiz ve uygulaması zor olduğunu belirtti.
Rubin'in kısa süre içinde müşteri taahhütlerine ulaşması beklendiğinden, bir NVL72 rafının tam olarak nasıl göründüğünü anlamak önem taşıyor. Bu rafın en temel unsurlarından biri ise şüphesiz Vera Rubin SüperÇip'in kendisi. Rubin GPU ve Vera CPU konfigürasyonunun teknik açıdan nasıl göründüğü daha önce ele alınmış olsa da, önemli bir nokta, NVIDIA'nın GPU'ya HBM4 entegrasyonu ve özel SOCAMM modülleriyle büyük performans artışları sağlamasıdır. Bu sayede bellek bant genişliği inanılmaz bir seviyeye, yani 1.2 TB/s'ye ulaşıyor.
NVIDIA'nın Vera Rubin ile yaptığı bir diğer önemli yükseltme ise soğutma alanında gerçekleşiyor. Ekip, Rubin GPU ve Vera CPU gibi SüperÇip bileşenlerini özel soğutma plakaları aracılığıyla modüler sıvı soğutma tasarımlarıyla entegre etmeyi planlıyor. NVIDIA yöneticileri, Rubin'in dağıtımının, büyük veri merkezlerini (hyperscalers) yükseltilmiş sıvı soğutma sistemlerine geçmeye ikna edeceğini savunuyor. İlginç bir şekilde, mevcut uygulama, NVIDIA tarafından vurgulanan bir başka fayda olan su kullanımını da azaltıyor.
NVLink, Vera Rubin NVL72'nin önemli bir yönünü oluşturuyor ve "NVLink Spine" olarak da bilinen 6. nesil ara bağlantı yapısı ile NVIDIA, raf başına toplamda 260 TB/s toplu bant genişliği sunmayı hedefliyor. Harris, en son NVLink nesliyle modülerliği yepyeni bir seviyeye taşıdıklarını ve bu sayede NVLink 6 spine'ın sıfır kesinti süresiyle bakım ve raf düzeyinde RAS hizmetlerini desteklediğini belirtiyor.
Vera Rubin'in önemli bir fiyat artışıyla piyasaya sürüleceği tahmin edilse de, NVIDIA bu mimarinin çıkarım (inference) token maliyetinde 10 kat, MoE modellerini eğitmek için gereken GPU sayısında ise Blackwell GB200'e kıyasla 4 kat azalma sağladığını belirtiyor. Bu da NVIDIA CEO'sunun "ne kadar çok alırsanız, o kadar çok tasarruf edersiniz" kuralının hala geçerli olduğunu gösteriyor.