DeepSeek V4, 1.6 trilyon parametreye varan model boyutları ve önemli optimizasyonlarıyla dikkat çekiyor. NVIDIA ise bu yeniliği, Blackwell GPU'ları ve NVFP4 teknolojisiyle gün-0 desteği sunarak karşılıyor.
NVIDIA Blackwell NVFP4 Mimarisi DeepSeek V4'te Büyük Hız Artışları Sunuyor ve Daha Fazla Optimizasyon Yolda
DeepSeek V4'ün piyasaya sürülmesiyle birlikte, hesaplama ve bellek gereksinimlerinde önemli optimizasyonlar gözlemleniyor. Güncellenen yapay zeka modeli, bir milyon token'lık bir bağlam penceresi çalıştırırken tek token çıkarım FLOP'larının yalnızca %27'sini ve KV önbelleğinin %10'unu kullanıyor. Ayrıca, 1.6 trilyon parametre boyutunda bir Pro modeli ve 284 milyar parametre boyutunda bir Flash versiyonu olmak üzere iki yeni model tanıtıldı.
Bu lansmanla birlikte NVIDIA, DeepSeek V4'teki Blackwell GPU'larının gün-0 desteğini ve performansını sergiliyor. Şirket, Blackwell GPU'larının V4'ün sunduğu 1 milyon uzun-bağlam çıkarımı ve trilyonlarca parametreli yapay zeka modellerini çalıştırmak için gereken ölçek ve düşük gecikme süresi performansını sağladığını belirtiyor.
Performans karşılaştırmasında NVIDIA, GPU başına neredeyse 3500 TPS (işlemci başına saniye) iletim hızı sergiliyor. Bunlar, ko-tasarım yığınında yapılacak ek optimizasyonlarla artması beklenen öncü rakamlar. NVIDIA Blackwell yığını, NVFP4, Dynamo, Optimize Edilmiş CUDA Çekirdekleri, gelişmiş paralelleştirme teknikleri ve daha fazlasını içeren V4 gibi modeller için özel olarak tasarlanmış bir dizi teknoloji sunuyor.
DeepSeek V4'ün temelinde, hem dağıtımları hem de çıkarım geçişlerini hızlandırmak için kullanılan FP4 (MXFP4) kuantizasyonun uygulanması yatıyor. FP4 DeepSeek ile V4 modelleri, bellek trafiğini ve örnekleme gecikmesini azaltıyor.
Vurgulanması gereken bir diğer önemli nokta ise, Huawei'nin en yeni Ascend çiplerinin (Ascend 950PR ve Ascend 950DT), 2026'da piyasaya sürülmesi planlanan bu çiplerin MXFP4 komutlarını içermesi. Bu durum, DeepSeek V4'ün Çin'in yerli yapay zeka çipleriyle de tam uyumlu olacağını gösteriyor.
NVIDIA'nın sürekli devam eden optimizasyon çalışmaları sayesinde, gelecekteki modeller için kutudan çıktığı haliyle güçlü bir ekosistem desteği bekleniyor.