Teknoloji dünyası, oyun geliştiricileri için devrim niteliğinde bir gelişmeye tanıklık ediyor. Intel, oyunlarda kullanılan doku boyutlarını inanılmaz ölçüde azaltan yeni bir yapay zeka tabanlı sıkıştırma teknolojisi olan Texture Set Neural Compression (TSNC) SDK'yı tanıttı. Bu yenilikçi çözüm, grafik mühendislerinin uzun süredir karşılaştığı depolama ve bellek sorunlarına çare olmayı hedefliyor.
Geleneksel grafik işlem birimi (GPU) sıkıştırma formatları, sabit matematiksel kurallar kullanarak doku boyutlarını küçültür. Ancak bu yöntemler, potansiyel sıkıştırmanın önemli bir kısmını göz ardı eder. TSNC ise bambaşka bir yol izliyor: Belirli doku setlerini kodlamak ve çözmek için makine öğrenmesi modellerini kullanıyor. Sonuç olarak, küçük bir yapay sinir ağı, orijinal doku verilerini (renk, parlaklık, pürüzlülük gibi) çalışma zamanında yeniden oluşturabilen kompakt bir temsil sağlıyor.
Bu teknolojinin temelinde yatan fikir, bir materyale ait tüm PBR haritalarını içeren doku setlerinin, kanalları arasında büyük bir yapısal tekrar barındırması. TSNC, bu paylaşılan yapıyı, genel blok sıkıştırma yöntemlerinin yapamayacağı şekillerde değerlendiriyor.
Özellik Piramitleri: İki Farklı Katman
TSNC sıkıştırma sisteminin merkezinde, farklı çözünürlük konfigürasyonlarında düzenlenmiş dört adet BC1 sıkıştırılmış gizli alan dokusundan oluşan özellik piramidi yer alıyor. Intel, farklı kalite ve sıkıştırma dengeleri sunan iki ana varyant sunuyor:
- Varyant A: Bu seçenek, iki tam çözünürlüklü ve iki yarı çözünürlüklü gizli alan görüntüsü kullanıyor. 4K çözünürlükteki dokular için bu, 26.8 MB civarında bir boyuta karşılık gelirken, sıkıştırılmamış bitmap'lerin orijinal boyutu 256 MB'ı bulabiliyor. Bu da %900'den fazla sıkıştırma anlamına geliyor. Standart BC sıkıştırmasıyla elde edilen %480'lik sıkıştırmanın neredeyse iki katı. Algısal kalite kaybı, ölçümlere göre yaklaşık %5 seviyesinde, bu da genellikle normal haritalarda küçük hassasiyet kayıpları olarak kendini gösteriyor.
- Varyant B: Daha agresif bir seçenek olan bu varyant, gizli alan görüntülerini orijinal çözünürlüğün 1/2, 1/4 ve 1/8'ine düşürüyor. Bu sayede %1700'den fazla sıkıştırma oranına ulaşılıyor. Ancak, kalite üzerinde daha belirgin bir etki gözlemleniyor: Normal haritalarda ve AO/pürüzlülük kanallarında BC1 blok artefaktları görülmeye başlanıyor ve algısal hata oranı %6-7 seviyesine çıkıyor. Bu durum, Intel'in de kabul ettiği gibi, kullanıcı tarafından fark edilebilir düzeyde olabiliyor. Dolayısıyla, Varyant B'nin, kalite kaybının daha az dikkat çekeceği uzak veya ikincil materyaller için daha uygun olması bekleniyor.
Geçen yılki PyTorch tabanlı prototipten bu yana, TSNC sıkıştırıcısı baştan aşağı Slang işlem çekirdekleri kullanılarak yeniden yazıldı. Geliştiriciler, Unreal Engine, özel motorlar veya CPU üzerinde sıkıştırma çözme gibi farklı senaryolarda, aynı çözücü kodunu farklı arka uçlara hedefleyebilecek.
GPU tarafında Intel, XMX matris çekirdeklerini kullanarak donanım hızlandırmalı matris çıkarımı için Microsoft'un DirectX 12 Kooperatif Vektörleri API'sini destekliyor. XMX desteği olmayan donanımlar için ise CPU'lar ve Intel dışı GPU'larda standart FMA (birleşik çarpma-toplama) desteği bulunuyor.
Intel yetkilileri, disk alanı tasarrufu ve bellek kullanımı arasında farklı ödünleşimler sunan dört farklı dağıtım stratejisini detaylandırdı:
- Kurulum Sırasında: Sıkıştırılmış olarak dağıtılır ve kurulum sırasında yerel olarak çözülür. Dokular kullanıcının sürücüsünde sıkıştırılmamış halde saklanır. Temel tasarruf dağıtım band genişliğindedir.
- Yükleme Sırasında: Dokular diskte sıkıştırılmış kalır; oyun yüklenirken VRAM'e çözülür. Hem kurulum boyutunu hem de yükleme sırasındaki VRAM baskısını azaltır.
- Akış Sırasında: Doku akışı ile birleştirilerek, dokular talep üzerine çözülür. Disk ve bellek için en iyi dengeyi sunar, ancak çalışma zamanında çıkarım yükü ekler.
- Örnekleme Sırasında: Dokular VRAM'de kalıcı olarak sıkıştırılmış kalır ve her piksel için shader'da çözülür. VRAM azaltımı için en agresif seçenek olup, sürekli bir çıkarım maliyeti vardır.
Geliştiriciler, özel kullanım senaryolarına ve alty öğrenme motorlarına bağlı olarak bu stratejilerden birini seçmek durumunda kalacaklar.
Intel, bir Panther Lake dizüstü bilgisayarında B390 entegre grafikleri üzerinde yapılan çıkarım testlerini paylaştı. 1080p tam işlem çekirdeği iş yükünde elde edilen sonuçlar şu şekilde:
- FMA yolu: piksel başına 0.661 nanosaniye
- XMX lineer cebir yolu: piksel başına 0.194 nanosaniye
Bu sonuçlar, donanım hızlandırmalı matris matematiğinin 3.4 kat hızlanma sağladığını gösteriyor. Bu değerlerin entegre grafiklerde bile elde edilmesi, piksel başına örnekleme zamanı dağıtım senaryosunu daha uygulanabilir hale getiriyor. Ayrık GPU'larda bu ek yük daha da düşük olacaktır. Intel, bu yılın ilerleyen dönemlerinde Texture Set Neural Compression SDK'sının bir Alpha sürümünü piyasaya sürmeyi planlıyor, ardından beta ve genel sürüm sürümleri gelecek. Ancak bu tarihler henüz kesinleşmiş değil.