Çinli yapay zeka şirketi DeepSeek, yeni modelinin eğitimini Huawei'nin çiplerini kullanarak tamamlayamaması nedeniyle lansmanını ertelemek zorunda kaldı. Bu durum, Pekin'in ABD teknolojisine alternatif bulma çabalarının mevcut sınırlarını gözler önüne seriyor.
Edinilen bilgilere göre, DeepSeek şirketi, R1 modelini Ocak ayında piyasaya sürdükten sonra yetkililerin teşvikiyle Nvidia yerine Huawei'nin Ascend işlemcilerini kullanmaya yönlendirildi. Ancak, R2 modelinin eğitim sürecinde Ascend çipleriyle yaşanan teknik sorunlar, şirketi eğitim aşamasında Nvidia'ya, çıkarım (inference) aşamasında ise Huawei'ye yönelmeye zorladı.
Sektör kaynaklarına göre, yaşanan teknik aksaklıklar, modelin Mayıs ayında yapılması planlanan lansmanının gecikmesine neden oldu ve şirketin rakipleri karşısında avantaj kaybetmesine yol açtı. Eğitim süreci, modelin geniş veri setlerinden öğrenmesini ifade ederken, çıkarım ise eğitilmiş bir modelin tahminler yapmak veya bir chatbot sorgusuna yanıt üretmek gibi adımlarda kullanılmasını kapsıyor.
DeepSeek'in yaşadığı zorluklar, Çin'in ürettiği çiplerin hala kritik görevlerde ABD'li rakiplerinin gerisinde kaldığını ve ülkenin teknolojik olarak kendi kendine yeterli olma hedeflerinin önündeki zorlukları vurguluyor. Geçtiğimiz günlerde çıkan haberlerde, Pekin yönetiminin Çinli teknoloji şirketlerinden Nvidia'nın H20 çiplerine olan taleplerini gerekçelendirmelerini istediği, böylece Huawei ve Cambricon gibi yerli üreticilerin desteklenmesini amaçladığı belirtilmişti.
Sektör analistleri, Çin üretimi çiplerin kararlılık sorunları, yavaş veri aktarımı ve Nvidia ürünlerine kıyasla daha zayıf yazılım desteği gibi dezavantajlara sahip olduğunu ifade ediyor. İki farklı kaynağa göre, Huawei, DeepSeek'in ofisine mühendislerden oluşan bir ekip göndererek R2 modelinin geliştirilmesinde Ascend çipinin kullanımına yardımcı olmaya çalıştı. Buna rağmen, saha ekibine rağmen DeepSeek, Ascend çipiyle başarılı bir eğitim gerçekleştiremedi.
Şirket kaynakları, DeepSeek'in şu anda modeli çıkarım için Ascend ile uyumlu hale getirme çalışmaları yürüttüğünü belirtiyor. Şirketin kurucusu Liang Wenfeng'in, R2'nin ilerleyişinden memnuniyetsizliğini dile getirdiği ve şirketin yapay zeka alanındaki liderliğini sürdürebilecek gelişmiş bir model oluşturmak için daha fazla zaman harcanması yönünde baskı yaptığı da edinilen bilgiler arasında.
Başka bir kaynağın belirttiğine göre, R2'nin lansmanındaki gecikmenin bir diğer nedeni de güncellenen model için beklenenden uzun süren veri etiketleme süreci oldu. Çin medyasındaki haberler, modelin önümüzdeki haftalarda piyasaya sürülebileceğini ima ediyor.
Bu alanda çalışan bir yapay zeka araştırmacısı, modelin birer ticari ürün olduğunu ve kolayca değiştirilebildiğini belirterek, birçok geliştiricinin güçlü ve esnek olan Alibaba'nın Qwen3 modelini kullandığını ifade etti. Araştırmacı ayrıca, Qwen3'nin DeepSeek'in akıl yürütme yeteneği sağlayan eğitim algoritması gibi temel konseptlerini benimsediğini, ancak bunları daha verimli hale getirdiğini sözlerine ekledi.
Huawei'nin yapay zeka ekosistemini takip eden araştırmacı, şirketin Ascend çiplerinin eğitimi için kullanımında 'büyüme sancıları' yaşadığını ancak Çin'in ulusal şampiyonu olarak nihayetinde uyum sağlayacağını öngördüğünü belirtti. Araştırmacı, "Bugün önde gelen modellerin Huawei ile eğitildiğini görmüyor olmamız, gelecekte bunun olmayacağı anlamına gelmez. Bu sadece zaman meselesi" dedi.
Pekin ve Washington arasındaki jeopolitik mücadelenin merkezinde yer alan çip üreticisi Nvidia, geçtiğimiz günlerde Çin'e H20 çipi satışlarını sürdürebilmek için ABD hükümetine gelirlerinden pay vermeyi kabul etti.
Nvidia, konuyla ilgili olarak, "Geliştiriciler, kazanan yapay zeka ekosistemini kurmada kritik bir rol oynayacak. Bütün pazarları ve geliştiricileri teslim etmek, yalnızca Amerikan ekonomik ve ulusal güvenliğine zarar verir" açıklamasında bulundu.
DeepSeek ve Huawei, konuyla ilgili yorum taleplerine yanıt vermedi.