Ara

Yapay Zeka Dünyasında Çin’in Donanım Savaşı: DeepSeek’in Nvidia ve Huawei Arasındaki Tercihi

Yapay zeka alanında çalışmalarını sürdüren DeepSeek'in, yetkililerin yönlendirmesiyle Nvidia yerine Huawei donanımlarını kullanma denemelerinin birtakım zorluklarla karşılaştığı öne sürülüyor. Edinilen bilgilere göre, ilk başarılı modeli R1'i Nvidia donanımlarıyla eğiten şirket, bir sonraki modeli olan R2'yi Huawei'nin Ascend tabanlı donanımlarıyla geliştirmeye yönlendirildi. Ancak bu geçişin, modelin tanıtımını geciktiren ciddi donanım sorunlarına yol açtığı belirtiliyor.

Rapora göre, DeepSeek'in R2 modelinin eğitim süreci Huawei donanımlarında istikrarsızlık, yavaş çip bağlantıları ve Huawei'nin CANN yazılım aracındaki sınırlamalar gibi pek çok sorunla karşılaştı. Bu aksaklıklar nedeniyle, şirketin R2 eğitiminde yeniden Nvidia'nın çipleriyle çalışmaya başlamak zorunda kaldığı ancak çıkarım (inference) aşamasında Huawei donanımlarını kullanmaya devam ettiği aktarılıyor. Bu durum, tercih yerine bir zorunluluktan doğan bir uzlaşma olarak görülüyor.

Çin'deki Nvidia işlemci kıtlığı göz önüne alındığında, DeepSeek'in yeni yapay zeka modelinin Huawei donanımlarında çalışmasını sağlamanın stratejik bir öneme sahip olduğu vurgulanıyor. Zira DeepSeek müşterilerinin önemli bir kısmı R2'yi bu tür yerel platformlarda kullanacak.

Huawei'nin, eğitim sorunlarını çözmek amacıyla mühendislerden oluşan bir ekibi DeepSeek'in veri merkezlerine gönderdiği ancak Ascend platformunda tam anlamıyla başarılı bir eğitim gerçekleştiremediği belirtiliyor. Mevcut çabaların, yeni modelin Ascend ile çıkarım amaçlı uyumluluğunu artırmaya yönelik olduğu ifade ediliyor.

R2'nin planlanan Mayıs ayı lansmanının ertelenmesinde, Ascend'de eğitim sürecinin tamamlanamaması önemli bir etken olarak gösteriliyor. Ayrıca, Çin'deki yüksek performanslı Nvidia GPU'larının tedarikindeki zorlukların da R2'nin geliştirme takvimini etkilediği daha önceki raporlarda yer almıştı. R2'nin henüz tam olarak eğitilip eğitilmediği ise henüz bilinmiyor.

DeepSeek'in R1 modelini, yatırımcısı High-Flyer Capital Management aracılığıyla temin ettiği 50.000 Hopper serisi GPU (30.000 HGX H20, 10.000 H800 ve 10.000 H100) ile eğittiği biliniyor. R2'nin eğitim için çok daha güçlü bir küme gerektirmesi bekleniyor.

Ayrıca, DeepSeek'in yapay zeka platformunun Nvidia donanımlarına özgü olarak ayarlanmış olması, şirketi Nvidia GPU'larının bulunabilirliğine karşı savunmasız bırakıyor ve müşterilerini de Nvidia gibi hızlandırıcıların tedarikine bağımlı hale getiriyor. Bu bağlamda, DeepSeek için R2 çıkarımının Huawei Ascend gibi yerel donanım platformlarında çalışmasını sağlamak büyük önem taşıyor.

Önceki Haber
Samsung S25 Serisinde Kendi Ürettiği RAM'lere Ağırlık Veriyor: Micron'un Payı Azalıyor
Sıradaki Haber
Neredeyse 30 Yıl Sonra: Efsanevi The Settlers II Amiga Sahnesine Dönüyor!

Benzer Haberler: