Çin merkezli teknoloji firması DeepSeek'in yeni yapay zeka modeli "DeepSeek R2" hakkında internette heyecan verici söylentiler dolaşmaya başladı.
DeepSeek R2, Yapay Zeka Pazarını Yeniden Şekillendirebilir: Huawei Çipleriyle Eğitildiği İddia Ediliyor
DeepSeek'in ilk ana akım modeli R1, Çin'in yüksek seviye yapay zeka modelleri geliştirmede geri kalmadığını tüm dünyaya göstermişti. R1'in piyasaya sürülmesi, ABD borsalarında bile yankı bulmuştu. Aynı zamanda, yapay zeka modeli geliştirmenin OpenAI gibi şirketlerin açıkladığı kadar yüksek maliyetli olmayabileceğini ortaya koymuştu.
Şimdi ise Çin medya kaynakları, DeepSeek'in bir sonraki modeli R2 hakkındaki söylentileri gündeme taşıyor. Eğer iddialar doğruysa, Batı yapay zeka pazarı Çin'den gelen bir başka sürprizle karşı karşıya kalabilir.
Detaylara geçmeden önce bu bilgilerin henüz DeepSeek tarafından resmi olarak doğrulanmadığını ve söylenti aşamasında olduğunu belirtmekte fayda var. Çin kaynakları, R2 modelinin hibrit bir MoE (Uzmanlar Karışımı) mimarisi benimseyeceğini iddia ediyor. Bu mimarinin, mevcut MoE uygulamalarının gelişmiş bir versiyonu olacağı, gelişmiş geçitleme mekanizmaları veya MoE ve yoğun katmanların birleşimi gibi özelliklerle yüksek iş yüklerini optimize edeceği söyleniyor. Bu mimariyle birlikte DeepSeek R2'nin, R1'in iki katı parametreye sahip olacağı ve 1.2 trilyon parametreye ulaşacağı konuşuluyor.
Bu parametre sayısı bile R2'nin GPT-4 Turbo ve Google'ın Gemini 2.0 Pro gibi modellerle rekabet edeceğini gösteriyor ancak DeepSeek'in fark yaratmayı planladığı tek alan bu değil. İddialara göre DeepSeek R2 ile token başına birim maliyetler, GPT-4'e kıyasla %97.4 oranında daha düşük olacak. Bu, OpenAI'nin fiyatlandırmasıyla karşılaştırıldığında DeepSeek R2 modelini işletmeler için çok daha uygun hale getirebilir ve onu en maliyet-etkin model yapabilir. Bu çıkış, yapay zeka ve çevresindeki ekonomi için belirleyici bir an olabilir.
DeepSeek R2 hakkında ortaya çıkan bir diğer ilginç bilgi ise modelin Huawei'nin Ascend 910B çip kümesinin %82 oranında kullanım verimliliğine ulaşacağı yönündeki iddia. FP16 hassasiyetinde 512 PetaFLOPS hesaplama gücüne sahip olduğu belirtilen bu bilgi, DeepSeek'in bir sonraki ana akım modeli için kendi iç kaynaklarını kullanmaya karar verdiğini gösteriyor. Çinli yapay zeka firmasının Huawei'nin yapay zeka çiplerine yoğun ilgi gösterdiği biliniyordu ve R2'yi kendi ekipmanlarıyla eğiterek DeepSeek'in yapay zeka tedarik zincirini "dikey olarak entegre" ettiği söylenebilir.
Tekrar belirtmek gerekirse, DeepSeek R2 hakkındaki gelişmeler spekülatif niteliktedir ve nihai model farklı olabilir. Ancak Çin medya kaynaklarının bildirdiklerine göre R2, ana akım yapay zeka şirketlerini şaşırtacak bir başka gelişme gibi görünüyor.