Ara

OpenAI’den Sürpriz Hamle: GPT-5.2 Geldi! Rekabette ‘Kırmızı Kod’ Alarmı mı?

Yapay zeka devi OpenAI, ChatGPT için geliştirdiği en yeni yapay zeka model ailesi GPT-5.2'yi duyurdu. Dün yapılan duyuruyla birlikte Instant, Thinking ve Pro olmak üzere üç farklı versiyonu kullanıcılara sunulan GPT-5.2, özellikle yapay zeka dünyasında son dönemde yaşanan rekabetçi gelişmelere bir yanıt niteliği taşıyor. OpenAI CEO'sunun ay başında ekip içinde kullandığı ve "kırmızı kod" uyarısı olarak nitelendirilen dahili notun ardından gelen bu sürüm, ChatGPT'nin performansını artırmaya odaklanmış durumda.

OpenAI Ürün Direktörü Fidji Simo, dün gazetecilerle gerçekleştirdiği bir basın toplantısında, "5.2'yi insanların ekonomik değerini daha da artırmak için tasarladık. Tablolar oluşturma, sunum hazırlama, kod yazma, görüntü algılama, uzun bağlamları anlama, araçları kullanma ve karmaşık, çok adımlı projeleri birbirine bağlama konularında daha iyi bir performans sergiliyor." açıklamasında bulundu.

Önceki GPT-5 sürümlerinde olduğu gibi, üç model katmanı farklı amaçlara hizmet ediyor: Instant, yazma ve çeviri gibi daha hızlı görevleri yönetiyor. Thinking, kodlama ve matematik gibi daha karmaşık işleri ele almak amacıyla simüle edilmiş muhakeme "düşünme" metinleri üretiyor. Pro ise en zor problemler için en yüksek doğruluk performansını sunma hedefiyle daha da gelişmiş simüle edilmiş muhakeme metinleri sağlıyor.

GPT-5.2, aynı anda yüzlerce belgeyi işleyebilen 400.000 token'lık bir bağlam penceresine sahip ve bilgi kesim tarihi 31 Ağustos 2025 olarak belirlenmiş.

GPT-5.2, Perşembe gününden itibaren ücretli ChatGPT abonelerine sunulmaya başlandı. Geliştiriciler için API erişimi de mevcut. API'deki standart modelin girdi token'ı başına maliyeti, GPT-5.1'e göre yüzde 40 artışla milyon token başına 1,75 dolar olarak açıklandı. OpenAI, ücretli kullanıcılar için eski GPT-5.1 sürümünün üç ay boyunca eski modeller menüsü altında ChatGPT'de erişilebilir olacağını belirtti.

Google ile Yarışta Geri Kalmamak İçin

Bu sürüm, OpenAI için oldukça hareketli bir ayın ardından geldi. Aralık ayının başlarında, Google'ın Gemini 3 modelinin yapay zeka benchmark'larında öne geçmesi ve pazar payı kazanmasının ardından CEO Sam Altman, dahili bir "kırmızı kod" direktifi yayınlamıştı. Bu notta, ChatGPT'nin reklam planları da dahil olmak üzere diğer girişimlerin ertelenerek sohbet botunun temel deneyimini iyileştirmeye odaklanılması çağrısı yapılmıştı.

OpenAI için riskler oldukça büyük. Şirket, önümüzdeki yıllarda yapay zeka altyapısı geliştirmeleri için toplam 1,4 trilyon dolarlık taahhütte bulundu. Bu yatırımlar, yapay zeka şirketleri arasındaki teknoloji liderliğinin daha belirgin olduğu dönemde yapılmıştı. Google'ın Gemini uygulaması şu anda ayda 650 milyondan fazla aktif kullanıcıya sahipken, OpenAI, ChatGPT için haftalık 800 milyon aktif kullanıcı bildirdi.

Rekabette önde kalma (veya geride kalmama) çabasıyla model sürümleri istikrarlı bir hızda ilerliyor: GPT-5.2, OpenAI'nin Ağustos ayından bu yana üçüncü büyük model sürümü oldu. GPT-5, o ay yeni bir yönlendirme sistemiyle piyasaya sürülmüştü ve anında yanıt ile simüle edilmiş muhakeme modları arasında geçiş yapıyordu. Ancak kullanıcılar soğuk ve klinik hissettiren yanıtlar hakkında şikayetlerde bulunmuştu. Kasım ayındaki GPT-5.1 güncellemesi ise sekiz adet hazır "kişilik" seçeneği eklemiş ve sistemi daha konuşkan hale getirmeye odaklanmıştı.

Sayılar Artıyor

İlginç bir şekilde, GPT-5.2 modelinin duyurulmasının Gemini 3'ün performansına bir tepki olmasına rağmen, OpenAI tanıtım web sitesinde iki modeli karşılaştıran herhangi bir benchmark listelemedi. Bunun yerine, resmi blog yazısı GPT-5.2'nin önceki sürümlerine göre iyileştirmelerine ve 44 meslekte profesyonel bilgi işi görevlerini ölçmeyi amaçlayan OpenAI'nin yeni GDPval benchmark'ındaki performansına odaklandı.

Basın toplantısı sırasında OpenAI, Gemini 3 Pro ve Claude Opus 4.5'i içeren bazı rekabet karşılaştırma benchmark'larını paylaştı, ancak GPT-5.2'nin Google'a yanıt olarak aceleyle piyasaya sürüldüğü anlatısını reddetti. Simo gazetecilere, "Bunun uzun aylar boyunca üzerinde çalışıldığını belirtmek önemlidir" dedi, ancak ne zaman yayınlanacağını seçmenin stratejik bir karar olduğunu da ekledi.

Paylaşılan sayılara göre, GPT-5.2 Thinking, bir yazılım mühendisliği benchmark'ı olan SWE-Bench Pro'da yüzde 55,6 oranında performans gösterdi. Bu oran Gemini 3 Pro için yüzde 43,3, Claude Opus 4.5 için ise yüzde 52,0 olarak gerçekleşti. Lisansüstü düzeyde bir bilimsel benchmark olan GPQA Diamond'da ise GPT-5.2, Gemini 3 Pro'nun %91,9'una karşılık %92,4 puan aldı.

OpenAI, GPT-5.2 Thinking'in GDPval benchmark'ındaki görevlerin %70,9'unda "insan profesyonelleri"nizi yendiğini veya onlarla eşit performans gösterdiğini belirtiyor (Gemini 3 Pro için bu oran %53,3). Şirket ayrıca, modelin bu görevleri insan uzmanların maliyetinin %1'inden azı ve hızının 11 katından fazlasıyla tamamladığını iddia ediyor.

OpenAI'nin eğitim sonrası lideri Max Schwarzer'ın da belirttiği gibi, GPT-5.2 Thinking'in GPT-5.1'e göre %38 daha az yanıltıcı bilgi ürettiği rapor ediliyor. Schwarzer, modelin önceki sürümüne göre "önemli ölçüde daha az halüsinasyon gördüğünü" ifade etti.

Ancak, yapay zeka performansını objektif olarak ölçme bilimi henüz şirketlerin insan benzeri yapay zeka yetenekleri için satış konuşmalarıyla tam olarak başa çıkamamışken, benchmark sonuçlarını bir şirkete olumlu yansıtacak şekilde sunmanın kolay olduğunu da göz önünde bulundurmak gerekir.

OpenAI dışındaki araştırmacılardan bağımsız benchmark sonuçlarının gelmesi zaman alacaktır. Bu arada, iş görevleriniz için ChatGPT'yi kullanıyorsanız, artırılmış performanslı ve biraz daha iyi kodlama yeteneği sunan yetkin modellerle karşılaşmayı bekleyebilirsiniz.

Önceki Haber
NVIDIA GPU'ları OpenAI'nin GPT-5.2'sini Eğitti: Blackwell ve Hopper Sahneye Damga Vurdu!
Sıradaki Haber
Runway'dan Şaşırtıcı İddia: Yapay Zeka "Dünya Modelleri" Dakikalarca Tutarlılığını Koruyor

Benzer Haberler: