Ara

Nvidia’dan Çığır Açan Teknoloji: RTX Neural Texture Compression VRAM İhtiyacını %80’e Kadar Azaltıyor!

Teknoloji dünyası, Nvidia'nın geliştirdiği yeni yapay zeka destekli RTX Neural Texture Compression (NTC) ile çığır açmaya hazırlanıyor. Tensor Çekirdekleri'ni kullanarak veriyi sıkıştıran ve açan bu teknoloji, ekran kartlarının bellek (VRAM) kullanımını %80'in üzerinde azaltma potansiyeli taşıyor.

Nvidia'nın en yeni RTX 50 serisi ekran kartlarının tanıtımıyla birlikte duyurulan bu yenilikçi teknoloji, materyal temsillerini iyileştiriyor, doku sıkıştırmasını daha verimli hale getiriyor ve dolaylı ışığın kalitesini artırıyor.

Bu gelişmeler, neural shading olarak adlandırılan ve gerçek zamanlı grafiklerde yeni bir dönemi başlatan bir yaklaşımın parçası. Bu sayede grafik işleme hattının bir kısmı eğitilebilir hale geliyor. Küçük yapay zeka ağları, shader'lar içinde çalışarak ve donanım hızlandırmasından yararlanarak verimli gerçek zamanlı performans sağlıyor.

Geliştiricilerin karmaşık shader kodları yazmak yerine, geleneksel yöntemlerle çözülmesi zor olan renderlama zorluklarını ele almak için yapay zeka modellerini eğitebileceği bu sistem, karmaşık grafik işleme süreçlerini basitleştiriyor.

Bugün ise bu teknolojilerden RTX Neural Texture Compression yakından incelenecek. NTC'nin nasıl çalıştığına dair detaylar ve farklı ekran kartlarındaki performans testleri paylaşılacak.

RTX Neural Texture Compression Nedir?

RTX Neural Texture Compression (NTC), doku sıkıştırma ve açma için makine öğrenimi tabanlı bir yöntemdir. DirectX 12'de Inference on Load, Inference on Sample ve Inference on Feedback olmak üzere üç farklı modda çalışabilir. Vulkan'da ise Inference on Feedback modu desteklenmediği için sadece Inference on Load ve Inference on Sample modları kullanılabilir.

Sıkıştırma aşamasında, orijinal dokular küçük bir yapay zeka ağının ağırlıkları ve gizli özelliklerin birleşimi haline getirilir. Inference on Sample modunda, açma aşaması gizli veriyi okuyarak ve sıkıştırma aşamasında belirlenen ağırlıklara sahip küçük bir Multi-Layer Perceptron (MLP) ağından geçirerek bir çıkarım işlemi gerçekleştirir. Her texel gerektiğinde açılır. NTC, üretken olmayan, deterministik bir yapıdadır.

Görsel hataları azaltmak için rastgelelik katan ve filtrelenmiş dokular elde eden Stochastic Texture Filtering (STF) kullanılır. Blackwell ekran kartları, doku filtreleme hızında 2 kat iyileştirme sunarak bu teknolojiyi bu kartlarda özellikle hızlı hale getirir.

Yukarıda bahsedilen açma tekniği, genellikle sinirsel doku sıkıştırma denildiğinde akla gelen Inference on Sample modudur. Bu mod, VRAM kullanımında en büyük azaltmayı sağlarken, performans maliyeti nedeniyle bazı ekran kartlarında pratik olmayabilir. Neyse ki, daha düşük seviye donanımlar için de çözümler mevcuttur.

Inference on Load modu, oyun veya harita yüklenirken NTC dokularını açar ve aynı zamanda bunları blok sıkıştırılmış formatlara (BCn) dönüştürür. Bu açma işlemi tamamen ekran kartı üzerinde yapılır. Pratikte bu, blok sıkıştırılmış dokularla aynı performans seviyesini korur, dolayısıyla herhangi bir performans cezası olmaz. Ayrıca diskteki doku boyutunda ve PCIe trafiğinde önemli azalmalar sağlar. Dezavantajı ise blok sıkıştırılmış dokulara kıyasla VRAM kullanımında bir azalma sağlamamasıdır.

Inference on Feedback modu ise Sampler Feedback'i kullanır ve yalnızca mevcut görünümü oluşturmak için gereken doku döşemelerini açar. Bu mod, önceki iki mod arasında bir denge sunar. Inference on Sample kadar olmasa da VRAM kullanımında büyük bir azalma sağlar. Çünkü Sampler Feedback ek bellek alanı tahsisi gerektirir. Performansı genellikle Inference on Load ile Inference on Sample arasında yer alır.

Vulkan ve Direct3D 12 için Cooperative Vector uzantıları sayesinde, piksel shader'ları modern ekran kartlarındaki yapay zeka hızlandırma birimlerinden (Nvidia Tensor Çekirdekleri, AMD Yapay Zeka Hızlandırıcıları veya Intel XMX motorları) donanım hızlandırmasından yararlanabilir. Bu, NTC'nin çıkarım çıktısında önemli bir iyileşme için bu donanım hızlandırmadan faydalanmasını sağlar.

Neden Sinirsel Doku Sıkıştırma?

Sinirsel Doku Sıkıştırma, BCn gibi diğer formatlardan daha yüksek sıkıştırma oranları elde eder. Ayrıca yüksek kanallı materyalleri destekler; tek seferde 16 kanala kadar çalışabilir. Blok sıkıştırma ise yalnızca 1-4 kanallı görüntüler üzerinde çalışır.

Aşağıdaki veriler, Intel Sponza taban sahnesi ve Renkli Perdeler paketi ile GitHub'daki RTX Neural Texture Compression örneği çalıştırılırken elde edilmiştir.

NTC Inference on Load moduna kıyasla (doku sıkıştırması için blok sıkıştırılmış formata dönüştüren), Inference on Sample modu gerekli doku belleğinde %85'lik devasa bir azalma sağlar.

Inference on Sample sadece VRAM'de büyük bir azalma sağlamakla kalmaz, aynı zamanda BCn dönüştürülmüş dokulara göre referanslara daha yakın bir görüntü kalitesi sunar. Inference on Sample modundaki dokular, referans dokularla neredeyse mükemmel bir eşleşme sunar.

Ancak, bazı sorunları da yok değil. Görüntüler DLSS etkinleştirilmişken çekilmiştir. NTC'de rastgelelik katarak filtrelenmiş dokular elde etmek için Stochastic Texture Filtering (STF) kullanılır. Sonuç olarak, herhangi bir anti-aliasing olmadan STF etkinleştirmek bol miktarda gürültüye sahip bir görüntü oluşturabilir. Bu gürültü DLSS tarafından tamamen temizlenir. TAA görüntüyü büyük ölçüde temizler, ancak tamamen değil. Inference on Sample modu STF kullanımını gerektirir ve bu nedenle devre dışı bırakılamaz. Bu nedenle, bu modun en iyi şekilde görünmesi için anti-aliasing, tercihen DLSS kullanımı gerekir.

Geçen yıl, Vulkanised 2025'te RTX Neural Texture Compression üzerine yapılan bir sunumda, Nvidia, doku belleğini azaltmanın yanı sıra, NTC'nin aynı bellek kısıtlamaları altında bile daha üstün doku kalitesi sağlayabileceğini belirtmişti.

Yukarıdaki sahnede, BCn ve NTC için aynı miktarda VRAM kullanılmasına rağmen, NTC daha fazla doku detayı ve görsel sadakat koruyabiliyor. Performans testlerine geçmeden önce, bir Nvidia teknisyeni tarafından NTC hakkındaki ek ayrıntıları okumayı unutmayın.

Performansı Nasıl?

Teknolojinin faydaları açık, peki performansı nasıl? NTC'nin RTX Neural Texture Compression örneğinde nasıl ele alındığını birkaç ekran kartı üzerinden inceleyeceğiz.

Inference on Load, oyun veya harita yüklenmesi sırasında NTC dokularını BCn'ye dönüştürür, bu nedenle blok sıkıştırmaya kıyasla sıfır performans ek yükü vardır. Diğer yandan, Inference on Sample, tüm ekran kartlarında performans maliyeti oluşturur çünkü örnekleme sırasında anında sinirsel kod çözme işlemi gerçekleştirir. İdeal olarak, pratik olabilmesi için performans maliyetinin minimum olması gerekir.

Örnek, daha zorlu bir oyun iş yükünü simüle etmek için Intel Sponza taban sahnesi ve Renkli Perdeler paketi kullanılarak test edilecektir. Ancak, Intel Sponza taban sahnesinin basit varsayılan modelden daha gerçekçi olduğunu belirtmek önemlidir, ancak örnek hala yalnızca temel bir ileri geçiş ve TAA/DLSS'ye sahiptir.

Bir oyunda bu örnekten çok daha fazla render geçişi olacaktır ve bu geçişlerin çoğu NTC'den etkilenmeyecektir. Bu nedenle, gerçek bir oyundaki göreli kare süresi maliyeti bu örnektekinden daha düşük olabilir. Bu aynı zamanda neden performansı kare süresi cinsinden ölçtüğümüzün de nedenidir. Bir oyundaki diğer render geçişlerinin çoğunun NTC'den etkilenmeyeceği göz önüne alındığında, bu örnekte eklediği milisaniye sayısı, gerçek bir oyundaki mutlak kare süresi maliyeti hakkında bize daha iyi bir fikir verebilir.

Testlerin odak noktası, her ekran kartı için en uygun olan çözünürlük olacaktır.

DirectX 12'deki Cooperative Vector uygulaması, Shader Model 6.9 işlevselliği için Microsoft DirectX 12 Agility SDK 1.717.x-preview ve Nvidia Developer Driver 590.26 gerektirir. Bu nedenle, makale boyunca test edilen tüm senaryolar için bu sürücü kullanılmıştır.

NTC on Feedback, DirectX 12 Sampler Feedback'in Vulkan eşdeğerinin olmaması nedeniyle yalnızca DirectX 12'de mevcuttur.

Test Sistemi

  • AMD Ryzen 7 9800X3D
  • 64 GB (2x32 GB) G.Skill Flare X5 DDR5 @ 6200 MHz CL30
  • Crucial T700 Gen5 SSD
  • Asus ROG STRIX B850-F Gaming WiFi
  • Corsair Nautilus 360 RS AIO Soğutucu
  • HAGS etkin
  • Windows 11 25H2 (Yapı 26200.8117)
  • Nvidia Developer Driver 590.26

RTX 5090 ile ilk testler yapıldığında, 4K çözünürlükte bile, Inference on Sample modunun TAA kullanılırken kare süresi maliyetinin Inference on Load'daki BC dönüştürülmüş dokulara kıyasla oldukça düşük olduğu görülüyor. DLSS'yi etkinleştirmek, Tensor çekirdeklerine daha fazla yük bindirdiği için ek bir maliyet getirir. Ancak, daha fazla render geçişinin olduğu ve ekranda daha çok şeyin gerçekleştiği gerçek bir oyunda, DLSS kullanımıyla daha düşük bir çözünürlükte renderlama performansı hala fayda sağlayacaktır.

1440p'de RTX 5070'de, Inference on Sample modunun BCn dönüştürülmüş dokulara kıyasla maliyeti senaryoya bağlı olarak yaklaşık 0.50-0.70 ms civarındadır. 1 ms içinde kalıyoruz. Gerçek oyunların birçok render geçişi içerdiğini ve hepsinin NTC'den etkilenmediğini ve tipik olarak bu örnekten önemli ölçüde daha yüksek genel kare sürelerine sahip olduğunu unutmayın. Sonuç olarak, NTC'nin göreli performans maliyetinin pratikte çok daha kabul edilebilir olması muhtemeldir.

4K'da maliyet yaklaşık 1.20 ms'dir.

1080p'de RTX 5060'da, Inference on Sample modunun performans maliyeti senaryoya bağlı olarak 0.60-0.70 ms arasındadır. Bu ekran kartı için uygun bir çözünürlükte, yine 1 ms içindeyiz.

Ancak 5060, daha yüksek çözünürlüklerde zorlanıyor. 1440p'de maliyet 1 ms'nin üzerinde ve 4K'da maliyet 2 ms'ye yaklaşıyor, ancak bu seviyedeki bir ekran kartı için beklenmelidir.

Şimdi daha düşük uç sistemlere göz atalım: RTX 4060 Mobil GPU'lu bir dizüstü bilgisayar.

Mobil Test Sistemi

  • RTX 4060 Dizüstü Bilgisayar GPU'su
  • Intel Core i7-13620H
  • Gen4 SSD
  • 16 GB DDR5
  • HAGS etkin
  • Windows 11 25H2 (Yapı 26200.8117)
  • Nvidia Developer Driver 590.26

4060 Dizüstü Bilgisayar GPU'sunda 1080p'de Inference on Sample modunun performans maliyeti, senaryoya bağlı olarak yaklaşık 0.70-0.85 ms'dir.

4060 için maliyet 1 ms'ye yaklaşıyor. 8 GB frame buffer'a sahip 4060'ın Inference on Sample'dan faydalanabileceği senaryolar hala olabilir. Eğer VRAM ana sınırlayıcı faktörse, bu modu kullanmak değerli olabilir. Alexey Panteleev'in aşağıda belirttiği gibi, eğer bir oyun doku kalitesi ayarını düşürmenizi gerektiriyorsa çünkü aksi takdirde VRAM'e sığmayacaktır, ancak bunu yaptığınızda yeterince hızlı çalışıyorsa, Inference on Sample net bir fayda sağlayabilir.

Nvidia'dan Bir Sinirsel Doku Sıkıştırma Geliştiricisinden İçgörü

Compusemble YouTube kanalında Ekim 2025'te birkaç NTC videosu yüklediğimde, Nvidia'da Seçkin DevTech Mühendisi ve NTC geliştiricisi Alexey Panteleev yorum bölümüne katılarak ek bilgiler paylaştı ve izleyici sorularını yanıtladı.

Her Mod İçin Hangi Ekran Kartları Önerilir?

Alexey Panteleev: Inference on Sample yalnızca en hızlı ekran kartlarında geçerlidir ve bu nedenle BCn'ye dönüştüren ve yalnızca disk boyutu veya indirme boyutu azaltması sağlayan, VRAM faydası sağlamayan Inference On Load modunu da sunuyoruz.

Bir ekran kartının örnekleme için yeterince hızlı olup olmayacağı çoğunlukla bir oyundaki özel uygulamaya bağlıdır. Örneğin, materyal dokularını G-buffer dışındaki herhangi bir geçişte kullanıp kullanmadıkları, materyal modellerinin ne kadar karmaşık olduğu ve shader'ların ne kadar büyük olduğu vb. Ve çıkarım verimliliğini artırmak için çalışıyoruz.

NTC Oyunlarda İyi Bir Deneyim Sağlamak İçin Nasıl Uygulanabilir?

Alexey Panteleev: Düşüncemiz şu ki, oyunlar NTC dokularıyla gelebilir ve Yükleme/Geri Bildirim'e Karşı Örnekleme gibi bir mod seçimi sunabilir ve kullanıcılar makinelerindeki oyun performansına göre hangisini kullanacaklarını seçebilirler. Sanırım kural şu olmalı: Eğer bir oyun, doku kalitesi ayarını düşürmenizi gerektiriyorsa çünkü aksi takdirde VRAM'e sığmayacaktı, ancak bunu yaptığınızda yeterince hızlı çalışıyorsa, o zaman NTC On Sample için iyi bir aday olmalıdır.

Bir diğer önemli şey - oyunların tüm dokularında NTC kullanmak zorunda değiller, bu doku başına bir karar olabilir. Örneğin, bir şey kabul edilemez bir kalite kaybına uğrarsa, onu NTC olmayan bir doku olarak tutabilirsiniz. Veya bir doku bir materyaldeki diğer dokulardan ayrı olarak kullanılıyorsa, örneğin bir yer değiştirme haritası gibi, muhtemelen bağımsız bir NTC olmayan doku olarak tutulmalıdır.

NTC Bir Oyunda Nasıl Performans Gösterir?

Alexey Panteleev: On Sample modu, sıfır maliyeti olan On Load'dan fark edilir derecede daha yavaştır. Ancak, gerçek bir oyunda burada sahip olduğumuz temel ileri geçiş ve TAA/DLSS'den çok daha fazla render geçişi olacağını ve çoğunun etkilenmeyeceğini, bu da genel kare süresi farkının o kadar da yüksek olmayacağını unutmayın. Aynı ekran kartı ailesi içinde On Load ve On Sample arasındaki göreli performans farkı benzer olmalıdır. Bir ekran kartı VRAM'i tükenirse, On Load hiç yardımcı olmaz, çünkü çalışma kümesi boyutunu azaltmaz ve PCIe üzerinden yüklemeler yalnızca yeni dokular veya döşemeler akışla aktarıldığında gerçekleşir.

Görüntü Üzerindeki Stokastik Doku Filtreleme (STF) Etkisi

Geçen yıl NTC örneği ilk yayınlandığında bazı kişiler, anti-aliasing kapalıyken görüntüde bol miktarda gürültü olduğunu fark etti. Bu gürültü DLSS kullanıldığında tamamen temizlendi ve TAA kullanıldığında büyük ölçüde temizlendi, ancak tamamen değil. Bunun nedeni STF'nin kullanımıdır. STF devre dışı bırakıldığında, AA devre dışı bırakılmış görüntüde artık herhangi bir gürültü fark etmedik. Ancak, Inference on Sample için STF gereklidir.

Alexey Panteleev: Ayrıca STF'nin (Stokastik Doku Filtreleme) perdeler gibi ayrıntılı yansıtıcı yüzeylerin görünümünde büyük bir rol oynadığını da unutmayın. Burada, Referans ve Yükleme modlarında STF'yi açıp kapatabilirsiniz, ancak Örnekte değil - o STF gerektirir ve her zaman açıktır. Daha doğrudan bir karşılaştırma yapmak için STF tüm modlarda varsayılan olarak açıktır.

Renderlemenin Geleceğine Bir Bakış

Burada test edilen örnek, grafik renderlemenin geleceğine büyüleyici bir bakış sunuyor. Neural Texture Compression (NTC), görüntü kalitesinden ödün vermeden son derece yüksek sıkıştırma oranları sunabilir ve hatta bazı senaryolarda blok sıkıştırılmış formatlardan daha iyi görüntü kalitesi sunabilir.

Inference on Sample modunun, doku belleğini %85 azaltırken Intel Sponza taban sahnesinde BCn dönüştürülmüş dokulardan biraz daha iyi görüntü kalitesi üretmesi oldukça etkileyici. Inference on Sample modu, referans (sıkıştırılmamış) materyallerle neredeyse mükemmel bir eşleşmeydi.

Bununla birlikte, bazı uyarılar devam ediyor. Stokastik Doku Filtreleme (STF), anti-aliasing tamamen devre dışı bırakıldığında görünür gürültü ekler ve Temporal Anti-Aliasing (TAA) kullanıldığında bile bazı artık gürültü görünebilir. NTC, Inference on Sample için zorunlu olan STF'yi kullanırken en iyi şekilde görünmek için şu anda DLSS gerektiriyor.

Bu teknolojinin geniş bir yelpazedeki ekran kartlarıyla uyumluluğu da dikkat çekiciydi. Geliştiriciler NTC kullanarak dokuları sıkıştırabilir, ancak aynı zamanda oyun veya harita yüklenirken NTC dokularını BCn'ye dönüştüren bir Inference on Load modu da sunabilirler. Bu VRAM kullanımını azaltmasa da, performansa sıfır maliyet getirir ve oyunların diskteki boyutunu büyük ölçüde düşürür. Teknoloji ayrıca AMD ve Intel ekran kartlarında da destekleniyor.

Neural Texture Compression, gerçek zamanlı grafiklerin geleceğinde önemli bir rol oynamaya hazırlanıyor ve zamanla nasıl gelişip olgunlaştığını görmek heyecan verici olacak.

Önceki Haber
Artemis II Tamamlandı: NASA'nın Ay'a Dönüş Yolculuğunda Sonraki Adımlar Neler?
Sıradaki Haber
Oyuncular Hava Trafik Kontrolörü Olmaya Çağrılıyor: 3 Yılda 155 Bin Dolar Maaş Fırsatı!

Benzer Haberler: