Ara

NVIDIA’dan Yapay Zeka Hızında Yeni Rekor: Blackwell GPU’lar 1000 Token/Saniye Barajını Aştı

NVIDIA, Blackwell mimarisiyle yapay zeka performansında yeni bir çığır açtığını duyurdu. Bu başarının arkasında hem donanım gücü hem de kapsamlı yazılım optimizasyonları yatıyor.

Blackwell GPU'lar, Büyük Dil Modelleri İçin Optimize Edildi: Token Üretim Hızında Rekor

Yapay zeka alanındaki çalışmalarıyla bilinen NVIDIA, Blackwell tabanlı çözümleriyle bu alandaki iddiasını güçlendiriyor. Şirketten yapılan son açıklamaya göre, Blackwell mimarisi kullanılarak 1000 token/saniye hızına ulaşıldı. Bu hız, sekiz adet NVIDIA Blackwell GPU barındıran tek bir DGX B200 düğümü ile Meta'nın 400 milyar parametreli devasa dil modeli Llama 4 Maverick üzerinde elde edildi. Bu sonuç, NVIDIA'nın yapay zeka ekosisteminin alana büyük bir etki yaptığını gösteriyor.

Bu yapılandırmayla birlikte, bir Blackwell sunucusu teorik olarak 72.000 token/saniye hızına ulaşabiliyor. Şirket, yapay zeka alanındaki ilerlemesini donanımlarının token üretim hızlarıyla sergilemeye odaklanmış durumda. Bu etkileyici TP/s (Token Per Second) hızına ulaşılmasında en önemli faktörlerin başında kapsamlı yazılım optimizasyonları geliyor. TensorRT-LLM ve spekülatif çözümleme gibi teknikler kullanılarak performansta 4 kata kadar hızlanma sağlandığı belirtiliyor.

Spekülatif çözümleme, daha küçük ve hızlı bir "taslak" modelin birkaç token ileriyi tahmin ettiği, ana (daha büyük) modelin ise bu tahminleri paralel olarak doğruladığı bir tekniktir. Bu yöntem, dil modelinin yanıt üretme sürecini önemli ölçüde hızlandırır.

NVIDIA, bu başarıda EAGLE3 tabanlı mimari gibi yazılım düzeyindeki yapıların da rol oynadığını ifade ediyor. EAGLE3, GPU donanım mimarisinden ziyade büyük dil modeli çıkarımını hızlandırmayı hedefleyen bir yazılım mimarisidir. Şirket, bu sonuçla yapay zeka segmentindeki liderliğini pekiştirdiğini ve Blackwell'in Llama 4 Maverick gibi büyük dil modelleri için tam optimize edildiğini gösterdiğini vurguluyor. Bu gelişme, yapay zeka etkileşimlerini daha akıcı ve hızlı hale getirme yolunda atılmış önemli bir adım olarak değerlendiriliyor.

Önceki Haber
Elden Ring Nightreign Geliyor: İki Kişilik Mod ve PvP Hakkında Bilmeniz Gerekenler
Sıradaki Haber
Ozempic ve Benzeri Kilo İlaçları Alkolden Soğutuyor mu? Bilim Dünyası Araştırıyor

Benzer Haberler: