Yapay zeka alanında hızla yükselen Çinli şirket DeepSeek'in, yeni nesil büyük dil modelini eğitmek amacıyla binlerce Nvidia Blackwell GPU'sunu yasa dışı yollarla elde ettiği ve kullandığına dair iddialar gündeme bomba gibi düştü. Konuya yakın kaynaklar, DeepSeek'in, ABD'nin yeni nesil yapay zeka çiplerine uyguladığı yaptırımları delmek için sahte veri merkezlerini kullanarak yüksek performanslı sunucuları Çin'e kaçırdığı karmaşık bir kaçakçılık ağının içinde yer aldığını öne sürüyor.
İddialara göre, bu kaçakçılık ağı, Güneydoğu Asya'da veri merkezleri kuran paravan şirketler aracılığıyla çalışıyor. Bu şirketler, tam donanımlı veri merkezleri kurup Nvidia'nın OEM ortaklarından denetimden geçiriyor. Denetimlerin ardından, veri merkezi ekipmanları parçalanarak GPU sunucularının bavullarla Çin anakarasına taşındığı belirtiliyor. Kaynaklar, bu operasyonlarda 8 GPU'lu HGX B200 gibi daha kompakt modellerin, GB200 NVL72'ye kıyasla gizli taşımacılığın kolaylığı nedeniyle tercih edildiğini vurguluyor.
Bu iddialar üzerine Nvidia'dan bir açıklama geldi. Şirket sözcüsü, kendilerini ve OEM ortaklarını kandırmak amacıyla inşa edilip sonra parçalanıp başka bir yere kaçırılan 'hayalet veri merkezleri'ne dair herhangi bir kanıt veya ihbar almadıklarını belirtti. Sözcü, bu tür kaçakçılığın uzak bir ihtimal gibi göründüğünü ancak aldıkları her ihbarı titizlikle incelediklerini ifade etti.
DeepSeek'in Nvidia GPU İhtiyacı
Özellikle ABD'de büyük ilgi gören R1 büyük dil modeli ile tanınan DeepSeek, daha önce de Nvidia GPU'ları ile anılmıştı. Şirketin duyurduğu R1 modelinin, Batılı rakiplerine kıyasla çok daha az ve verimli sayıda Nvidia H800 ile eğitildiği biliniyor. O zamandan beri DeepSeek'in sürekli olarak elde edebildiği kadar Nvidia GPU'sunu stokladığı ve satın aldığı yönünde raporlar dolaşıyor.
DeepSeek'in en yeni yapay zeka modelleri için Nvidia çiplerini kullanmayı planladığına dair iç raporlar da dikkat çekici. 2 Aralık'ta yayımlanan bir teknik raporda, şirketin performans darboğazının öncü modellerle aynı seviyede olduğunu ve gelecekte bu bilgi boşluğunu kapatmak için daha fazla hesaplama gücü kullanmayı planladıklarını belirtiyor. Yapay zeka modellerinin ön eğitimi için gereken yüksek hesaplama gücünde Nvidia GPU'ları ve CUDA yazılımının üstünlüğü göz önüne alındığında, bu durum DeepSeek mühendislerinin yüksek kaliteli hesaplama gücüne erişimde bir gelişme beklediğini gösteriyor.
DeepSeek'in geçmişi, Nvidia'nın ön eğitim yeteneklerinin Çin'deki yerel ürünlerin karşılayamadığı bir boşluğu doldurduğunu kanıtlıyor. Ağustos ayında çıkan haberlerde, Huawei'nin Ascend GPU sunucularının gerekli eğitim iş yüklerini karşılayamadığı ve bu nedenle R2 eğitim sürecinde tekrar Nvidia donanımına dönüldüğü iddia edilmişti. Bu durum, hükümetin DeepSeek'i yerel Çin ürünlerini kullanmaya teşvik etmesine rağmen yaşanmıştı.
Çin'de Nvidia'nın Geleceği
ABD yönetiminin kısa süre önce Nvidia H200 GPU'sunun Çin'e yönelik kısıtlamalarını kaldırma planı, ülkedeki Nvidia satışlarının önünü açabilir. Uzmanlar, bu politikanın, ABD'nin Çin'e teknoloji ihracatını tamamen kesme yönündeki eğiliminden bir geri adım olduğunu ve Huawei'nin yeni Ascend çiplerine yönelik artan endişelerden kaynaklandığını düşünüyor. Bu çiplerin bazı performans metriklerinde H200 ve GB200 NVL72 ile rekabet edebildiği yönündeki iddialar, ABD hükümetinin H200'ü Çin'e sunmasına neden olmuş olabilir.
Bu yeni politika, Çin'e kolay erişilebilir Amerikan teknolojisi sunma ile tamamen yasaklama arasında bir denge kurma çabası olarak görülüyor. Bu yaklaşımın, Çin'in teknolojik ihtiyaçlarını karşılayarak Huawei gibi şirketlerin kendi Nvidia rakiplerini geliştirme motivasyonunu azaltması umuluyor. Nvidia'nın lobi faaliyetlerinin de etkili olduğu bu doktrin değişikliği, Pekin ve Washington arasındaki "Çip Savaşı"nda önemli bir dönüm noktası olarak değerlendiriliyor. Bu savaş, artık Çin'in yeni nesil teknolojiye erişimini engellemekten, Çin'in teknolojik gücünün Batı'nın teknolojik hakimiyetine tehdit oluşturmasını yavaşlatmaya odaklanmış durumda.
Trump yönetiminin Çin'in asla Nvidia Blackwell donanımını görmeyeceği konusundaki ısrarına rağmen, ihracat istisnalarının H200 gibi Hopper nesli donanımla sınırlı kalıp kalmayacağı zamanla görülecek. Eğer DeepSeek gerçekten de hayalet veri merkezleri komplosuna karışmışsa, ABD'nin izinlerine gerek kalmadan Blackwell'e erişim sağlamış olabilir.