Çinli yapay zeka firması DeepSeek, son büyük dil modeli DeepSeek-V3.2-Exp'yi piyasaya sürdü. Bu yeni model, ilk günden itibaren Huawei'nin Ascend donanımları ve CANN yazılım yığını için optimize edilmiş durumda. Bu gelişme, yapay zeka modellerinin Nvidia'nın CUDA ekosistemine güvenmek yerine yerli hızlandırıcılarda çalıştırılmasına öncelik verilmesi gerektiğini gösteriyor.
DeepSeek, V3.2-Exp modelini 29 Eylül'de duyurmuş, kod ve kontrol noktalarını teknik bir raporla birlikte Hugging Face'de paylaşmıştı. Şirket, V3.2-Exp'yi "gelecek nesil mimarimize doğru atılmış ara bir adım" olarak tanımlıyor ve özellikle uzun bağlamlı çıkarımlarda maliyeti düşürmeyi hedefliyor. Modelde yer alan seyrek dikkat mekanizması, çıktı kalitesinden ödün vermeden bellek ve hesaplama gereksinimlerini azaltıyor.
Huawei'nin Ascend ekibi ve vLLM-Ascend topluluğu, DeepSeek-V3.2-Exp'yi hızla entegre etti. vLLM-Ascend deposunda yer alan özel operatör kurulum adımları ve Ascend NPU'ları için çekirdek paketleme işlemleri, V3.2-Exp'yi desteklemek üzere güncellendi. CANN ekibi de bir çıkarım tarifi yayımlayarak, modelin Huawei donanımlarında anında dağıtıma hazır hale gelmesini sağladı.
Bu hamleye diğer Çinli çip üreticileri de katıldı. Cambricon, vLLM-MLU çatallamasına V3.2-Exp uyumluluğu getiren bir güncelleme yayımlayarak, kendi çıkarım motoru ve modelin seyrek dikkat mekanizmasının birleşiminin uzun dizileri işlemede maliyeti düşürdüğünü iddia etti. Hygon da DCU hızlandırıcılarının, DTK yazılım yığını aracılığıyla "sıfır bekleme süresi" ile kullanıma hazır hale getirildiğini duyurdu.
Bu hızlı benimseme, Çin'in yapay zeka ekosisteminin, Nvidia donanımına erişimin garanti olmayacağı bir geleceğe hazırlanmakta olduğunu açıkça gösteriyor. Nvidia'nın CUDA'sı hem eğitim hem de çıkarım süreçlerinde baskınlığını sürdürse de, DeepSeek'in son sürümü, büyük bir Çinli firmanın ilk günden itibaren CUDA dışı yığınlar için optimize edilmiş olarak gelmesi açısından dikkat çekiyor.
Ascend, Cambricon ve Hygon arasındaki koordineli çaba, Çinli firmaların yapay zeka egemenliği konusundaki talepleri ciddiye aldığının en net göstergesi. Bu firmalar sadece donanımlarını uyumlu hale getirmekle kalmıyor, aynı zamanda yerli platformları birinci sınıf hedefler olarak konumlandırıyor.