Geçtiğimiz ay Anthropic'in tanıttığı ve siber güvenlik alanında büyük bir tehdit oluşturduğu iddia edilen Mythos Preview modelinin ardından, Birleşik Krallık Yapay Zeka Güvenlik Enstitüsü (AISI) tarafından yapılan yeni araştırmalar, OpenAI'nin geçtiğimiz hafta kamuoyuna duyurduğu GPT-5.5'in de bu alanda benzer bir performans sergilediğini ortaya koyuyor. Mythos Preview, başlangıçta sadece "kritik sektör ortaklarına" açık olarak sunulmuştu.
AISI, 2023'ten bu yana çeşitli gelişmiş yapay zeka modellerini, tersine mühendislik, web zafiyetleri ve kriptografi gibi siber güvenlik görevlerini test etmek üzere tasarlanmış 95 farklı Capture the Flag (CTF) mücadelesine tabi tutuyor. En üst düzey "Uzman" seviyesindeki görevlerde GPT-5.5, ortalama %71.4 başarı göstererek, Mythos Preview'in %68.6'lık performansını geride bıraktı (aradaki fark istatistiksel olarak kabul edilebilir sınırlar dahilinde). Özellikle zorlayıcı bir görevde, Rust ikili dosyasını çözmek için bir disassembler oluşturma gerektiren senaryoda, AISI'nin raporuna göre GPT-5.5 bu mücadeleyi sadece 10 dakika 22 saniyede ve API çağrıları için sadece 1.73 dolarlık bir maliyetle, hiçbir insan müdahalesi olmadan tamamladı.
GPT-5.5 ayrıca, kurumsal bir ağa yönelik 32 adımlı bir veri çıkarma saldırısını simüle eden AISI'nin "The Last Ones" (TLO) test serisinde de Mythos Preview ile benzer bir ilerleme kaydetti. TLO'da 10 denemeden 3'ünde başarılı olan GPT-5.5, Mythos Preview'in 10 denemede 2 başarı elde ettiği bu testte de öne çıktı. Bugüne kadar hiçbir yapay zeka modeli bu testte bir kez bile başarılı olamamıştı. Ancak, her iki model de, daha önce test edilen tüm yapay zeka modelleri gibi, bir enerji santralinin kontrol yazılımını kesintiye uğratma girişimini simüle eden AISI'nin daha zorlu "Cooling Tower" simülasyonunda başarısız oldu.
Sadece "Korkuya Dayalı Pazarlama" mı?
GPT-5.5 için elde edilen bu yeni sonuçlar, siber güvenlik riski söz konusu olduğunda, Mythos Preview'in muhtemelen "tek bir modele özgü bir atılım" olmadığını, daha çok "uzun vadeli otonomi, akıl yürütme ve kodlama alanındaki daha genel gelişmelerin bir yan ürünü" olduğunu gösteriyor. AISI, bu noktada bazı yapay zeka modellerinin potansiyel tehlikelerinin abartılarak, "korkuya dayalı pazarlama" stratejisiyle sınırlandırıldığını ima ediyor.
Yapay zeka modellerinin sınırlı sürümlerini tanıtırken kullanılan "korkuya dayalı pazarlama" eleştirilerine değinen OpenAI CEO'su, Mythos modelinin siber güvenlik için harika bir model olduğundan emin olduğunu ancak "bir bomba ürettik, onu kafanıza atacağız ve size 100 milyon dolara bir sığınak satacağız" demenin açıkça inanılmaz bir pazarlama olduğunu belirtti. CEO, piyasaya sürülmesi tehlikeli modellerle ilgili daha fazla söylem olacağını ve tehlikeli modellerin farklı yollarla piyasaya sürüleceğini de sözlerine ekledi.
OpenAI, Şubat ayında Güvenilir Erişim{"https://openai.com/index/trusted-access-for-cyber/"} programını başlatarak, güvenlik araştırmacılarının ve işletmelerin kimliklerini doğrulamalarına ve OpenAI'nin gelişmiş modellerini "meşru savunma çalışmaları" için inceleme ilgilerini kaydetmelerine olanak tanımıştı. Geçen ay OpenAI, bu güvenilir erişim listesini kullanarak, "ek siber yetenekler için bilinçli olarak ince ayarlanmış ve daha az yetenek kısıtlamasına sahip" bir model varyantı olan GPT-5.4-Cyber'ın sınırlı lansmanını kontrol ettiğini duyurdu. Perşembe günü ise OpenAI CEO'su, GPT-5.5-Cyber'ın ilk sürümünün de benzer şekilde "önümüzdeki birkaç gün içinde kritik siber savunucularla" sınırlı olacağını sosyal medya üzerinden duyurdu.