Yapay zeka ve yüksek performanslı hesaplama (HPC) alanında çığır açan gelişmeler yaşanmaya devam ediyor. Sektörün önde gelen analistlerinden J.P. Morgan'ın raporlarına göre, Nvidia önümüzdeki yıl piyasaya sürmeyi planladığı yeni Vera Rubin platformu ile yapay zeka donanım tedarik zincirinde köklü değişikliklere hazırlanıyor. Bu yeni strateji kapsamında Nvidia, sadece grafik işlem birimleri (GPU) ve bileşenlerini değil, tamamen monte edilmiş ve kullanıma hazır yapay zeka sunucuları satmayı hedefliyor.
Rapora göre, Nvidia'nın Level-10 (L10) VR200 olarak adlandırılan bu yeni sunucu tepsileri, tüm işlem donanımı, soğutma sistemleri ve arayüzleri önceden yüklenmiş olarak partnerlerine sunulacak. Bu durum, mevcut durumda büyük orijinal tasarım üreticilerinin (ODM) üstlendiği tasarım ve entegrasyon iş yükünü önemli ölçüde azaltacak. Bu hamle, partnerlerin işini kolaylaştırsa da, kar marjlarını Nvidia lehine daraltması bekleniyor. Mevcut bilgiler henüz resmiyet kazanmış değil.
Nvidia'nın bu yeni yaklaşımı, Vera Rubin platformu ile başlayacak. Şirket, hiper ölçekli veri merkezleri ve ODM partnerlerinin kendi anakartlarını ve soğutma çözümlerini üretmelerine izin vermek yerine, önceden monte edilmiş Vera CPU, Rubin GPU ve soğutma sistemini içeren tam L10 hesaplama tepsilerinin üretimini üstlenmeyi planlıyor. Daha önce de GB200 platformunda benzer bir adım atarak, temel bileşenleri önceden takılı olan Bianca kartını partnerlerine sunmuştu. Ancak o dönemki entegrasyon seviyesi L7-L8 olarak nitelendirilirken, şimdi şirketin tüm sunucu tepsisini - hızlandırıcılar, CPU, bellek, ağ arayüz kartları, güç dağıtım donanımı, ara bağlantı arayüzleri ve sıvı soğutma plakaları dahil - kullanıma hazır bir modül olarak satmaya hazırlandığı belirtiliyor.
Bu bilginin doğruluğu halinde, Nvidia'nın partnerlerine L10 hesaplama tepsilerini (ki bir sunucunun maliyetinin yaklaşık %90'ını oluşturduğu tahmin ediliyor) göndermesi, partnerlerin sadece raf düzeyinde entegrasyon yapmasına olanak tanıyacak. Bu, partnerlerin hala harici kasaları inşa etmesi, gereksinimlere göre güç kaynaklarını entegre etmesi, raf düzeyinde soğutma için yan üniteler veya CDU'lar kurması, kendi yönetim yazılımlarını eklemesi ve son montaj ile testleri yapması anlamına gelecek. Bu görevler operasyonel olarak önemli olsa da, donanım düzeyinde belirgin bir farklılık yaratmayacak.
Bu adımın, VR200'ün piyasaya sürülme süresini kısaltması ve Nvidia'nın doğrudan bir elektronik üretim hizmeti (EMS) sağlayıcısıyla (muhtemelen Foxconn, ardından Quanta ve Wistron gibi firmalarla) yapacağı toplu üretim anlaşmaları sayesinde üretim maliyetlerini düşürmesi öngörülüyor. Örneğin, Jensen Huang tarafından tanıtılan Vera Rubin Superchip kartının karmaşık tasarımı, kalın PCB'si ve sadece katı hal bileşenleri kullanması, bu tür kartların tasarımının zaman ve para gerektirdiğini gösteriyor. Bu nedenle, seçkin EMS sağlayıcıları tarafından üretilmesi oldukça mantıklı bir seçenek olarak görünüyor.
J.P. Morgan raporunda, bir Rubin GPU'nun güç tüketiminin Blackwell Ultra'daki 1.4 kW'tan R200'de 1.8 kW'a ve hatta duyurulmamış bir SKU için 2.3 kW'a yükselmesi ve artan soğutma gereksinimleri, tüm tepsiyi bileşenler yerine tedarik etme motivasyonlarından biri olarak gösteriliyor. Ancak, sektör kaynaklarından edinilen bilgilere göre, Microsoft gibi büyük veri merkezi operatörleri ve çeşitli OEM/ODM firmaları, daldırma soğutma ve gömülü soğutma gibi ileri düzey soğutma sistemlerini deniyorlar, bu da onların bu konudaki deneyimlerini ortaya koyuyor.
Bu stratejik değişimle birlikte, Nvidia'nın partnerleri sistem tasarımcıları olmaktan çıkıp, sistem entegratörleri, kurulumcuları ve destek sağlayıcıları konumuna yükselecekler. Kurumsal özellikler, servis sözleşmeleri, firmware ekosistem çalışmaları ve dağıtım lojistiği gibi alanlarda rol oynamaya devam edecekler. Ancak sunucunun 'kalbi' olarak kabul edilen işlem birimi, artık OEM'ler veya ODM'ler tarafından değil, Nvidia tarafından standartlaştırılmış ve üretilmiş olacak.
Ayrıca, Rubin Ultra platformuna dayanan ve megawatt sınıfı rafları mümkün kılacak 800V veri merkezi mimarisiyle birlikte piyasaya sürülmesi beklenen Nvidia'nın Kyber NVL576 raf ölçekli çözümüyle ne olacağı da merak konusu. Bu gelişmeler ışığında, Nvidia'nın tedarik zincirindeki payını raf düzeyinde entegrasyona kadar daha da artırıp artırmayacağı ise şimdiden konuşulmaya başlandı.