Yapay zeka dünyasında önemli bir gelişme yaşanıyor. OpenAI, açık ağırlıklı modellerini (open-weight models) yayınlayarak, Çinli yapay zeka modellerinin hakim olduğu bir alana ilk kez adım attı. Bu hamle, ABD'nin bu alandaki rekabet gücünü artırmayı hedefliyor.
OpenAI'nin İlk Yaygın Açık Ağırlıklı Modelleri Bazı Alanlarda Çin Alternatiflerini Geride Bıraktı
Amerikalı yapay zeka şirketleri, yıllardır Çinli muadillerinin yaptığı gibi, büyük dil modellerini (LLM) açık kaynak ekosistemiyle entegre etmeye başladı. Dikkat çekici bir şekilde, ABD'nin teknoloji liderliğini pekiştirmeyi amaçlayan bir planda açık kaynaklı yapay zeka modellerine öncelik verildi. OpenAI, bu doğrultuda GPT-OSS modellerini piyasaya sürerek bu önceliği hayata geçirdi. GPT-2'den bu yana ilk açık ağırlıklı modellerini piyasaya süren OpenAI, bu modelleri iki farklı konfigürasyonda sunuyor: GPT-OSS-20B ve GPT-OSS-120B.
OpenAI'nin en yeni açık ağırlıklı modellerinin detaylarına bakıldığında, GPT-OSS-20B modeli 21 milyar parametreye sahip ve bir MoE transformatörü kullanıyor. Daha da önemlisi, 131.072 token'a kadar bağlam penceresi sunuyor ve 16GB VRAM'e sahip platformlarda etkin bir şekilde çalışabiliyor. Bu da, günümüzdeki çoğu tüketici sınıfı ekran kartının bu modeli yerel olarak rahatlıkla çalıştırabileceği anlamına geliyor. Diğer yandan, GPT-OSS-120B daha büyük bir açık ağırlıklı model olup, 117 milyar parametreye sahip ve güçlü akıl yürütme performansı sergiliyor. Bu modeli çalıştırmak için ise en azından tek bir NVIDIA H100 platformuna ihtiyaç duyuluyor.
Daha da önemlisi, bu modellerin Apache 2.0 lisansı altında yayınlanması, ticari kullanıma, değiştirmeye ve yeniden dağıtıma izin veren esnek bir lisans olması. Bu durum, Çinli muadillerine benzer şekilde onlara tamamen açık kaynaklı bir doğa kazandırıyor. OpenAI için bu sürüm, türünün ilk örneği ve muhtemelen Çin'deki gelişmeleri hedefliyor. Zira DeepSeek, Alibaba ve diğer birçok Çinli yapay zeka firması yıllardır açık kaynaklı bir ortam işletirken, ABD'de Meta'nın LLaMA'sı dışında bu ekosisteme ulaşan çok fazla yaygın model bulunmuyor.
OpenAI'nin açık ağırlıklı modelleri dahil etme kararıyla birlikte, bu firmadan da yeni sürümler bekleyebiliriz. Ancak şimdilik, GPT-OSS'i Çinli alternatiflerle karşılaştıralım. Parametre sayısını bir ölçüt olarak aldığımızda, DeepSeek V2, Qwen 3 gibi modellerin daha yüksek rakamlara sahip olmasıyla Çinli alternatifler, OpenAI'nin seçeneklerini büyük bir farkla geride bırakıyor. Çin'in DeepSeek ve Alibaba'dan gelen en iyi yapay zeka modellerini göz önünde bulundurduğumuzda, durum şu şekilde:
Parametre sayısı, bir modelin üstün olup olmadığını belirleyen tek faktör değil. Ancak halkla ilişkiler açısından bakıldığında, Çinli modellerin şu anda OpenAI'ye göre önemli bir avantaja sahip olduğu görülüyor. Bunun temel nedeni, bu alanda birkaç yıldır aktif olmaları. Şimdi ise, gerçek zamanlı performansı çeşitli bilinen iş yükleri üzerinden değerlendirelim. Bu iş yükleri arasında MMLU (Massive Multitask Language Understanding) ve AIME Math (American Invitational Mathematics Exam) gibi testler bulunuyor.
Bu karşılaştırmalar, GPT-OSS'in akıl yürütme iş yüklerinde ve matematiksel işlemlerde rakiplerini büyük bir farkla geride bıraktığını gösteriyor. Ayrıca, birçok yoğun modele göre daha az aktif parametreye sahip olması, yapay zeka modelini yerel olarak kullanmak isteyenler için daha uygun maliyetli seçenekler sunuyor. Bununla birlikte, karşılaştırmalar, ajans tabanlı iş yükleri ve çok dilli yetenekler söz konusu olduğunda GPT-OSS-120B'nin Çinli alternatiflerin gerisinde kaldığını gösterse de, yine de bu ekosistem için üst düzey bir seçenek olarak öne çıkıyor.
Açık ağırlıklı modeller, yapay zeka endüstrisi için geleceğin yolu olarak görülüyor, çünkü genel ekosisteme çeşitli faydalar getiriyorlar. OpenAI'nin bu alandaki çabaları, daha önce Çinli yapay zeka şirketleri tarafından domine edilen bu segmentte ABD'nin konumunu kesinlikle güçlendirecektir. Bu sonuçlardan memnuniyet duyacakları aşikar.