NVIDIA, yapay zeka destekli renderlama ve oyun teknolojilerinde çığır açan yeniliklerini Blackwell RTX GPU'ları ile bir kez daha gözler önüne serdi. Özellikle RTX 5090 ve RTX PRO 6000 gibi üst düzey kartlar, yapay zeka sayesinde görsel kalitede yeni bir dönemin kapılarını aralıyor.
NVIDIA'nın Sıkı Toplantıları Blackwell RTX, Yapay Zeka Renderlama ve Oyunlardaki Yeniliklerine Odaklanıyor
NVIDIA'nın Blackwell RTX mimarisi bu yılın başlarında tanıtıldı ve o günden bu yana sunduğu yenilikler hakkında birçok detaya ulaştık. Yapay zeka, Blackwell'in temel taşı olurken, tüm bu yeniliklerin kökeni şirketin hızlandırılmış hesaplama ve yapay zeka için evrensel yazılım mimarisi olan CUDA'nın 2006'daki lansmanına kadar uzanıyor.
Şirket, hesaplama yoğunluğunun Moore Yasası'nın ölçeklenmesini aştığını belirtiyor. Bu başarı, özel işlem birimleri, yeni komut setleri, daha düşük hassasiyetli formatlar ve mimari verimlilik üzerindeki titiz çalışmalar sayesinde mümkün oldu. 2018'de NVIDIA gerçek zamanlı ışın izlemeyi (ray tracing) ve sadece bir yıl sonra da DLSS teknolojisini kullanıma sundu.
Bu gelişmeler, RT çekirdekleri ve Tensör çekirdekleri gibi yeni teknolojilerin bir kombinasyonu ile gerçekleştirildi. Bugün Blackwell, bu teknolojilerin en gelişmiş versiyonunu ve daha fazlasını sunuyor.
Veri merkezi tarafında NVIDIA, FP4 hassasiyetini tanıttı. Bu yenilik, yoğun ölçekli iş yüklerinde 4 kat iyileştirme sağladı. NVIDIA CEO'sunun yapay zekayı grafiklerin doğal evine, yani grafiklere geri getirme isteğiyle Blackwell RTX ile yapay zeka renderlama ve grafik çağına geçildi. Şirkete göre RTX, simülasyon, içerik üretimi ve oyun markasıdır. Bu nedenle veri merkezlerinde yapılan tüm bu işlemlerin tüketici RTX GPU'larına ölçeklenmesi hedefleniyor.
Peki Blackwell neler sunuyor? DLSS 4, MFG (AI destekli çerçeve oluşturma), ACE (yapay zeka karakter motoru), ışın izleme (path tracing) ve daha birçok teknoloji daha hızlı performans ve çarpıcı görseller vadediyor. NVIDIA'nın kendi ifadesine göre Blackwell RTX ile "performans, bellek kullanımı ve tasarım döngüsünde 10 kat artış" sağlanıyor. DLSS 4 ayrıca yapay zekayı kullanarak ilk çerçeveden sonra işlenen piksellerin %100'ünü oluşturuyor, bu da daha kısa işlenme süreleri ve mobil platformlarda daha uzun pil ömrü anlamına geliyor.
RTX Blackwell'in temel tasarım prensipleri şunlardır:
- Yeni Yapay Zeka İş Yükleri İçin Optimizasyon
- Bellek Kullanımının Azaltılması
- Yapay Zeka ve Grafiklerin Kalite Servisi
- Ölçeklenebilir Enerji Verimliliği
En üst düzeyde RTX Blackwell, 4000 Yapay Zeka TOPS (Saniyedeki Trilyon İşlem) ve 5. Nesil Tensör Çekirdekleri sayesinde Yüksek Hızlı FP4 desteğiyle mühendislik harikası olarak öne çıkıyor. Dördüncü Nesil RT Çekirdekleri ile Dev Geometri için 360 RT TFLOPs'a kadar performans sunuyor. Yapay Zeka Yönetim Süreci (AMP), yapay zeka modellerini ve grafikleri aynı anda işleyebiliyor. Blackwell Akıllı İşlem Birimleri (SM) içinde 125 TFLOPS'a kadar hesaplama gücü ve iki kat MaxQ güç verimliliği sunarken, 30 Gbps GDDR7 bellek ile dünyanın en hızlı bellek çözümünü barındırıyor. Mimari aynı zamanda DP2.1 UHBR20, PCIe Gen5, 4x NVDEC/NVENC (4:2:2 ile) gibi ekran ve video yeniliklerini de içeriyor.
NVIDIA, daha önceki Ada SM'lerdeki ayrı tasarımların aksine FP32/INT32 birimlerini birleştiren Blackwell RTX SM'ini detaylandırıyor.
RTX Blackwell ayrıca Shader Execution Reordering (SER) teknolojisinde 2 kata kadar iyileştirme sunuyor.
Beşinci Nesil Tensör Çekirdekleri, FP4 desteği ekleyerek DLSS 4'teki MFG modunu etkinleştiriyor ve GPU'nun yapay zeka desteğiyle dört çerçeveyi işlemesine olanak tanıyor.
DLSS 4 ile Çerçeve Oluşturma, her bir çerçeveyi işleme süresini kısaltıyor ve 10 kat daha hızlı çekirdek ray geçitleme, 100 kat daha hızlı DRAM'den kendi kendine yenileme oranları sağlıyor. Mobil platformlarda ise pil ömrü için GPU gücünde 2 kata kadar azalma görülüyor.
GDDR7 bellek ile RTX Blackwell, NVIDIA'nın 30 Gbps hızlara ulaşarak GDDR6'nın iki katı veri aktarım hızları sunmasını sağlıyor. Mobil platformlarda aynı bellek standardı, iki kat daha fazla verimlilik sağlıyor.
NVIDIA'nın AMP birimi, yapay zeka ve grafik iş yüklerinin aynı anda işlenmesini sağlıyor. Bu, daha akıcı ve dengeli çerçeveler ile daha hızlı model yanıtları sağlıyor.
RTX Blackwell'in oyun tarafındaki yeniliklerinden profesyonel (PRO) tarafına geçiş yapan NVIDIA, RTX PRO 6000 gibi GPU'larda yer alan Evrensel MIG (Multi-Instance GPU) gibi en yeni özelliklerini sergiliyor. Bu teknoloji sayesinde kullanıcılar, her biri 24 GB VRAM'e sahip ve çekirdek/donanım birimlerinin alt kümesini içeren dört adede kadar RTX PRO GPU örneğini, tahmin edilebilir gecikme ve işlem hızı ile paralel olarak çalıştırabiliyor.
NVIDIA, MIG kullanarak RTX PRO 6000'in ölçeklenme yeteneklerini gösteren etkileyici bir demo paylaştı. Kullanılan iş yükü, maksimum ayarlarda 1080p çözünürlükte çalışan Cyberpunk 2077'nin dört farklı örneğiydi. Bu, RTX PRO 6000 gibi güçlü bir ekran kartı için nispeten düşük bir grafik iş yükü.
Standart zaman dilimli bir örnek, temel olarak kullanıldı ve MIG 2x ve 4x modlarıyla karşılaştırıldı. Bu modlar, %60'a kadar daha yüksek ölçeklenme sağlıyor. Yani, aynı anda dört adet Cyberpunk 2077 örneğini çalıştırmak istiyorsanız, RTX PRO 6000 Blackwell GPU bu görev için harika bir seçenek olacaktır.
Genel olarak, NVIDIA'nın RTX Blackwell GPU mimarisi birkaç aydır piyasada ve tüketici ve profesyonel uygulamalar için daha da optimize ediliyor. Yaklaşan birçok oyun ve içerik üretici uygulaması, RTX Blackwell'in devasa yapay zeka ve neural (yapay zeka destekli) geliştirmelerinden yararlanmaya başladı. Önümüzdeki yıllarda geliştiricilerin bu özelliklerle uygulamalarını nasıl daha da ileriye taşıyacağını görmek için sabırsızlanıyoruz.