NVIDIA, veri merkezlerindeki yapay zeka grafik işlem birimlerinin (GPU) konumunu gerçek zamanlı olarak takip eden yeni bir yazılım hizmetini kullanıma sunuyor. Şirket, bu yeni teknoloji sayesinde GPU'ların kaçakçılığı ve yasa dışı yollarla sevk edilmesi gibi durumların önüne geçmeyi hedefliyor.
NVIDIA, Veri Merkezi Müşterilerinin Tüm Yapay Zeka GPU Filolarını Yeni Konum Takip Hizmetiyle İzlemesine Olanak Tanıyor, 'Kapatma Tuşu' İddialarını Reddetti
Son dönemde, NVIDIA'nın yüksek talep gören yapay zeka GPU'larının ABD'nin ihracat kontrol yasağı kapsamındaki bölgelere yasa dışı yollarla kaçırıldığına dair çeşitli haberler kamuoyuna yansıdı. Bu yasa dışı sevkiyatlar sonucunda Çin'e ulaşan bu çipler, Birleşik Devletler hükümetinin daha önce NVIDIA'nın eski nesil Hopper H200 GPU'larının satışına onay verdiği bölgeler olsa da, Blackwell mimarisine dayalı daha yeni GPU'lar da Çinli kurumlar tarafından ediniliyor.
Bu yasa dışı faaliyetlerle mücadele etmek amacıyla NVIDIA, resmi bir açıklama ile doğruladığı yeni bir yazılım hizmeti geliştirdi. Bu yeni 'konum doğrulama teknolojisi', GPU'nun hangi ülkede çalıştığına dair bilgi sağlıyor. Şirket, bu teknolojiyi özel olarak geliştirdiğini ve denediğini belirtirken, mevcut piyasa koşullarının bu teknolojinin müşterilere yönelik ilk dağıtımını başlatmalarını teşvik ettiğini ifade etti.
Müşteriler, bu yazılım seçeneğini yükleyerek sadece bir değil, tüm yapay zeka GPU filolarını takip edebilecekler. Bu yeni yazılım ajanı, GPU telemetrisini kullanarak sağlık durumu, bütünlük ve envanter gibi çeşitli istatistikleri izliyor. Böylece müşteriler, GPU'larının nerede ve hangi durumda kullanıldığını öğrenebilecekler.
NVIDIA'nın resmi blogunda paylaşılan bilgilere göre, bu hizmet veri merkezi operatörlerine şu olanakları sunacak:
- Enerji bütçeleri dahilinde kalırken watt başına performansı en üst düzeye çıkarmak için güç tüketimindeki ani artışları takip edebilme.
- Filo genelindeki kullanım oranlarını, bellek bant genişliğini ve ara bağlantı sağlığını izleyebilme.
- Termal kısıtlamayı ve bileşenlerin erken yaşlanmasını önlemek için sıcak noktaları ve hava akışı sorunlarını erken tespit edebilme.
- Tekrarlanabilir sonuçlar ve güvenilir operasyon sağlamak için tutarlı yazılım yapılandırmalarını ve ayarlarını doğrulayabilme.
- Hataları ve anormallikleri tespit ederek arızalanan parçaları erken belirleyebilme.
Toplanan veriler, NVIDIA'nın NGC (GPU Cloud) portalında barındırılacak. Yazılım hizmetine kaydolan müşteriler, GPU'larını takip etmek için çeşitli metrikleri bu portal üzerinden görüntüleyebilecekler.
Bu yazılım hizmeti öncelikle büyük talep gören Blackwell GPU'larında sunulacak. ABD, bu GPU'ların Çin ve ihracat kontrolü altındaki bölgelere satışına henüz onay vermedi.
NVIDIA ayrıca, kullanıcıların bir GPU'yu manuel olarak tespit edip devre dışı bırakmasına olanak tanıyan bir 'Kapatma Tuşu'nun yazılımda yer almadığını yineledi. NVIDIA'nın yapay zeka GPU'larında böyle bir donanım özelliği bulunmuyor.