Ara

NVIDIA Blackwell Ultra, MLPerf’te Tüm Yapay Zeka Eğitim Benchmark’larında Zirvede: GB200 NVL72 Llama 405B’yi 10 Dakikada Eğitti!

NVIDIA, Blackwell Ultra tabanlı GB300 NVL72 platformuyla en yoğun yapay zeka eğitim görevlerinde lider performansı kanıtladı. Şirket, MLPerf yapay zeka eğitim testlerinin tamamında birincilik elde ederek bu alandaki iddiasını pekiştirdi.

NVIDIA GB300 NVL72 ile Yapay Zeka Eğitiminde Yeni Rekorlar Kırdı

Yapay zeka alanında sunduğu üstün performansla tanınan NVIDIA, en yeni GB300 NVL72 platformuyla bir kez daha dikkatleri üzerine çekti. Blackwell mimarisine sahip bu yeni nesil veri merkezi GPU'ları, yoğun yapay zeka iş yükleri için en uygun seçenek olduğunu MLPerf testlerinde gösterdi.

NVIDIA'dan yapılan duyuruya göre, Blackwell Ultra destekli yapay zeka GPU'ları, MLPerf eğitim benchmark'larının tamamında birinci sırayı alarak GB300 NVL72'nin rakipsizliğini kanıtladı. Şirket, MLPerf testlerine katılan tek oyuncu olduğunu ve rakipleriyle arasındaki performans farkını önemli ölçüde açtığını belirtti. Paylaşılan verilere göre, NVIDIA'nın GB200 ve GB300 platformları, yalnızca 2025 yılında yüzlerce MLPerf Eğitim ve Çıkarım (Inference) zaferi elde etti. En dikkat çekici sonuçlardan bazıları şunlar:

  1. Llama 3.1 405B: 10 dakika
  2. Llama 2 70B LoRA: 0.4 dakika
  3. Llama 3.1 8B: 5.2 dakika
  4. FLUX.1: 12.5 dakika
  5. DLRM-dcnv2: 0.71 dakika
  6. R-GAT: 1.1 dakika
  7. RetinaNet: 1.4 dakika

Benchmark sonuçları, NVIDIA'nın GB300 GPU'ları ile Hopper tabanlı GPU'lara kıyasla aynı sayıda GPU ile önemli ölçüde daha yüksek performans elde ettiğini gösteriyor. Llama 3.1 40B ön eğitiminde, GB300 GPU'ları H100'e göre 4 katından fazla, Blackwell GB200'e göre ise neredeyse 2 katı performans sundu. Benzer şekilde, Llama 2 70B ince ayarında, 8 adet GB300 GPU, H100'e göre 5 kat daha fazla performans sağladı.

NVIDIA ayrıca, rakiplerine karşı büyük bir avantaj sağlayan CUDA ekosisteminden de övgüyle bahsetti. CUDA yazılım yığınının üstünlüğü dışında, sistemin kendisi ve 800 GB/s hızındaki Quantum-X800 InfiniBand ağ bağlantısı da eşsiz bir performans sunuyor. GB300 NVL72, GPU başına 279 GB HBM3e bellek ve GPU ile CPU belleği toplamında inanılmaz bir 40 TB kapasite sunuyor. Bu devasa bellek yapılandırması, yapay zeka iş yüklerini hızlandırırken, eğitim için FP4 hassasiyetinin kullanılması da olağanüstü performansın anahtarı olarak öne çıkıyor.

NVIDIA, LLM eğitiminde FP4 hassasiyetinin her katmanda benimsenmesini sağlayarak hesaplama hızını FP8'e kıyasla iki katına çıkardığını belirtti. Blackwell Ultra, bu hızı 3 katına kadar çıkararak, GPU sayısını artırmadan rakiplerini geride bırakmayı ve önemli ölçüde daha üstün bir performans sunmayı başardı. Haziran ayındaki gönderimine kıyasla elde edilen yeni sonuçlar, 5.120 Blackwell GPU kullanılarak elde edildi ve Llama 3.1 405B parametresini eğitmek yalnızca 10 dakika sürdü.

Önceki Haber
ChatGPT Artık Daha Akıllı ve Sohbetçi: GPT-5.1 Modelleri Yayında!
Sıradaki Haber
Steam Machine'in Tasarım Sırrı Ortaya Çıktı: GameCube Benzerliği Sadece Bir Tesadüf Mü?

Benzer Haberler: