NVIDIA'nın Blackwell GPU'ları, yapay zeka çıkarım performansında zirveye yerleşerek, bu teknolojiyi kullanan firmalar için rakiplerine kıyasla daha yüksek kar marjları sağlıyor.
NVIDIA'nın Tam Yığın Yapay Zeka Yazılımı ve Optimizasyonları Blackwell GPU Mimarisinde Üstün Çıkarım Performansı Sağlıyor, AMD'nin Hala Yakalaması Gerekiyor
Morgan Stanley Araştırma'nın yayımladığı yeni verilere göre, firma çıkarım iş yüklerinde işlem maliyetlerini ve kar marjlarını karşılaştırıyor. Yapay zeka çıkarımı için çok sayıda çip kullanan yapay zeka "fabrikalarının" veya firmaların yüzde 50'nin üzerinde kar marjlarından keyif aldığı ve NVIDIA'nın bu alanda lider olduğu ortaya çıkıyor.
Değerlendirme için, farklı satıcıların sunucu raflarından oluşan 100 MW'lık bir dizi yapay zeka fabrikası seçildi. Bunlar arasında NVIDIA, Google, AMD, AWS ve Huawei platformları bulunuyor. Bunlardan NVIDIA'nın GB200 NVL72 "Blackwell" GPU platformu, tahmini 3500 milyon ABD Doları kar ile yüzde 77,6 kar marjıyla en yüksek kar marjını sunuyor.
Google, TPU v6e pod'u ile yüzde 74,9 kar marjı ile ikinci sırada yer alırken, üçüncü sırada AWS Trn2 Ultraserver yüzde 62,5 kar marjı ile bulunuyor. Diğer çözümlerin kar marjları ise yaklaşık yüzde 40-50 civarında seyrediyor. Ancak en ilgi çekici olanı, AMD'nin rakamlarının henüz yapması gereken çok iş olduğunu göstermesi.
AMD'nin en yeni MI355X platformu, yapay zeka çıkarımında eksi yüzde 28,2 kar marjı sağlarken, eski MI300X platformu eksi yüzde 64,0 kar marjı sağlıyor. Firma ayrıca çip başına saatlik gelir ve kiralama fiyatlarını da (ortalama 10,5 $) ayrıntılı olarak paylaşıyor.
NVIDIA'nın GB200 NVL72 çipi, saatte 7,5 ABD Doları gelir sağlarken, ikinci sırada NVIDIA'nın HGX H200'ü saatte 3,7 ABD Doları gelir ile yer alıyor. AMD ise MI355X platformu ile saatte 1,7 ABD Doları gelir elde ediyor. Diğer çiplerin çoğu ise saatte 0,5-2,0 ABD Doları arasında gelir sağladığından, NVIDIA'nın tamamen farklı bir ligde olduğu görülüyor.
NVIDIA'nın yapay zeka çıkarımındaki devasa liderliği, FP4 desteği ve CUDA yapay zeka yığınındaki sürekli optimizasyonlara bağlanıyor. Şirket, Hopper ve hatta Blackwell gibi eski GPU'ları için düzenli olarak performans artışları görmeye devam eden "Fine Wine" uygulamasını gösterdi.
AMD'nin MI300 ve MI350 platformları da donanım açısından harika ve şirket kendi tarafında yoğun yazılım optimizasyonları yapıyor, ancak AMD'nin üzerinde çalışması gereken alanlar olduğu anlaşılıyor ve yapay zeka çıkarımı bunlardan biri.
Morgan Stanley tarafından vurgulanan bir diğer nokta ise MI300X platformlarının toplam sahip olma maliyetinin (TCO) 744 milyon ABD Doları gibi yüksek bir seviyede olması ve bu rakamın, yaklaşık 800 milyon ABD Doları civarında olan NVIDIA'nın GB200 platformunun maliyetine denk gelmesidir. Bu durumda maliyet faktörü AMD'nin lehine görünmüyor.
Daha yeni MI355X sunucularının TCO'su ise 588 milyon ABD Doları olarak tahmin ediliyor ve bu rakam Huawei'nin CloudMatrix 384'ü ile aynı seviyede. Daha yüksek başlangıç maliyeti, NVIDIA'nın bu kadar popüler olmasının nedeni olabilir, çünkü yatırım maliyetleri açısından AMD ile aynı seviyede olabilirler ancak çok daha yüksek yapay zeka çıkarım performansı sunarlar, ki bu da önümüzdeki yıllarda yapay zeka pazarının %85'ini oluşturacağı söyleniyor.
NVIDIA ve AMD, birbirleriyle rekabet halinde kalmak için yıllık bir hızlandırmaya odaklanıyorlar. NVIDIA, bu yıl Blackwell GB200'e göre %50'lik bir artış sunan Blackwell Ultra GPU platformunu piyasaya sürecek ve bunu gelecek yıl Rubin platformu izleyecek. Rubin platformu 2026'nın ilk yarısında üretime girecek. Onu Rubin Ultra ve Feynman takip edecek. AMD ise gelecek yıl Rubin'e rakip olacak MI400'ü piyasaya sürecek ve MI400 için yapay zeka çıkarımına yönelik çeşitli optimizasyonlar da bekleyebiliriz, bu nedenle yapay zeka segmenti için ilgi çekici bir yıl olacak.