Ara

OpenAI’den Sürpriz: Yerel Kullanım İçin Açık Kaynaklı Yapay Zeka Modelleri Yayınlandı!

Yapay zeka alanında önemli bir gelişme yaşanıyor. OpenAI, bugün itibarıyla yeni nesil üretken yapay zeka modellerini duyurdu. Şirket, daha önce 2019'da GPT-2 ile başlattığı açık kaynaklı model geleneğini sürdürerek, iki yeni modeli daha erişilebilir hale getirdi: gpt-oss-120b ve gpt-oss-20b. Bu modeller, kullanıcıların kendi donanımlarında çalıştırabilmelerine olanak tanıyor ve simüle edilmiş akıl yürütme, araç kullanımı ve derinlemesine özelleştirme gibi özellikler sunuyor.

Bulut tabanlı OpenAI modelleri, genellikle güçlü sunucu altyapıları üzerinde çalışırken, bu yeni modeller farklı donanım yapılandırmalarında çalışacak şekilde iki farklı varyantla geliyor. Her iki model de yapılandırılabilir zincirleme düşünce (CoT) özelliğine sahip transformatör mimarisini kullanıyor. CoT ayarları, sistem komutunda tek bir satır ile düşük, orta ve yüksek seviyelerde ayarlanabiliyor. Düşük ayarlar daha hızlı çalışıp daha az kaynak tüketirken, yüksek ayarlar daha iyi çıktı kalitesi sunuyor.

Daha küçük olan gpt-oss-20b modeli, toplamda 21 milyar parametreye sahip ve uzman karışımı (MoE) mimarisi sayesinde her token için 3.6 milyar parametreye düşüyor. gpt-oss-120b modelinde ise 117 milyar parametre bulunuyor ve MoE ile bu sayı token başına 5.1 milyar parametreye iniyor. Şirketin belirttiğine göre, 20 milyar parametreli model, 16GB veya daha fazla belleğe sahip tüketici düzeyindeki bilgisayarlarda çalışabiliyor. 120 milyar parametreli model için ise 80GB bellek gerekiyor ki bu da ortalama bir bilgisayarda bulunandan daha yüksek bir değer. Ancak bu model, Nvidia H100 gibi tek bir yapay zeka hızlandırıcı GPU'ya sığabilir. Her iki modelin de 128.000 token'lık bir bağlam penceresi bulunuyor.

Kullanıcılar, bu açık kaynaklı modellerle, OpenAI'nin bulut tabanlı modellerine benzer performanslar bekleyebilirler. Özellikle gpt-oss-120b, birçok testte OpenAI'nin o3 ve o4-mini modelleri arasında bir performans sergiliyor. Daha küçük olan 20 milyar parametreli model ise biraz daha geride kalıyor. Matematik ve kodlama görevlerinde bu modellerin performansı daha da öne çıkıyor. Örneğin, bilgi tabanlı "Humanity's Last Exam" testinde, o3 modeli araçlarla birlikte %24.9'luk bir başarı gösterirken, gpt-oss-120b %19'luk bir sonuç elde ediyor. Kıyaslama yapmak gerekirse, Google'ın Gemini Deep Think modeli aynı testte %34.8 başarıya ulaşıyor.

Kötülük Yapmaya Pek Yatkın Değil

OpenAI, bu yeni açık kaynak modellerin, şirket içi özel modellerin yerini almasını hedeflemediğini belirtiyor. Bu modellerle öncelikli olarak GPT'nin ana sürümlerinin yeteneklerini tekrarlamak amaçlanmamış ve bazı önemli kısıtlamalar mevcut. Örneğin, gpt-oss-120b ve gpt-oss-20b modelleri yalnızca metin tabanlıdır ve kutudan çıktığı haliyle çok modluluğa sahip değildir. Ancak şirket, büyük bulut tabanlı yapay zeka çözümlerine her zaman güvenmek istemeyen kullanıcılar için yerel olarak yönetilen yapay zekanın daha düşük gecikme süresi, daha fazla özelleştirme imkanı ve hassas verilerin yerinde güvenli bir şekilde saklanması gibi avantajlar sunduğunun farkında.

OpenAI, şirket içi özel modelleri kullanan birçok firmanın aynı zamanda bu nedenlerle açık kaynaklı modellerden de faydalandığını biliyor. Şu anda bu firmalar yerel yapay zeka için OpenAI dışı ürünler kullansa da, şirket, gpt-oss modellerini özel GPT modelleriyle entegre olacak şekilde tasarlamış durumda. Bu sayede müşteriler, bazı verileri yerel olarak işlemek zorunda kaldıklarında bile uçtan uca OpenAI ürünlerini kullanabilecekler.

Bu modellerin tamamen açık olması ve Apache 2.0 lisansı ile yönetilmesi, geliştiricilerin onları belirli kullanım durumları için optimize edebileceği anlamına geliyor. Diğer tüm yapay zeka şirketleri gibi OpenAI de modellerine kötü niyetli davranışları sınırlamak için kontroller ekliyor. Ancak şirket, açık kaynaklı bir model yayınlayalı birkaç yıl olduğu ve gpt-oss modellerinin 2019'daki GPT-2'den çok daha güçlü olduğu belirtiliyor.

Güvenlik konusunda elinden gelenin en iyisini yaptığına emin olmak için OpenAI, gpt-oss modellerini kötü niyetli olacak şekilde ayarlayarak bazı en kötü senaryoları test etmeye karar verdi. Geliştiriciler, modeli kötü davranmaya ikna etmeye çalışsalar bile, şirketin Hazırlık Çerçevesi'ne (Preparedness Framework) göre kötü şeyler yapma konusunda yüksek bir kalite seviyesine hiçbir zaman ulaşamadığını belirtiyorlar. OpenAI, bu durumun, kullanılan kararlı hizalama ve talimat hiyerarşisinin açık modellerin ciddi şekilde kötüye kullanılmasını engelleyeceğini iddia ediyor.

Bu iddiayı kendiniz test etmek isterseniz, gpt-oss-120b ve gpt-oss-20b modelleri bugün HuggingFace üzerinden indirilebilir durumda. Ayrıca inceleyebileceğiniz GitHub depoları da mevcut. OpenAI, test amaçlı modellerin standart sürümlerini kendi altyapısında da barındıracak. Daha fazla teknik detaya ilgi duyanlar için şirket, bir model kartı ve bir araştırma blog yazısı da yayınlamış durumda.

Önceki Haber
Huawei'den Yapay Zeka Alanında Dev Hamle: Ascend GPU Yazılımı Açık Kaynak Oluyor!
Sıradaki Haber
Intel'in Yeni Üretim Sürecinde Zorluklar: 18A'da Verimlilik Düşük, İstihdam Kesintileri ve Projeler İptal Ediliyor

Benzer Haberler: