Yazılım geliştirme dünyasında yapay zeka destekli kodlama araçlarının popülerliği artarken, bu teknolojilerin kendilerini iyileştirme süreci de hızlanıyor. OpenAI, kendi yapay zeka kodlama aracı Codex'i, aracın geliştirilmesi ve iyileştirilmesi için yoğun bir şekilde kullanıyor.
OpenAI yetkilileri, Codex'in geliştirilmesinin büyük ölçüde yine Codex tarafından yapıldığını belirtiyor. Mayıs 2025'te araştırma ön izlemesi olarak sunulan Codex, bulut tabanlı bir yazılım mühendisliği aracı olarak öne çıkıyor. Bu araç, yeni özellikler yazma, hataları giderme ve kod önerileri sunma gibi çeşitli görevleri yerine getirebiliyor.
Codex, kullanıcıların kod depolarına bağlı güvenli ortamlarda çalışıyor ve birden fazla görevi eş zamanlı olarak yürütebiliyor. OpenAI, Codex'i ChatGPT'nin web arayüzü, komut satırı arayüzü (CLI) ve VS Code gibi geliştirme ortamları için eklentiler aracılığıyla kullanıcılara sunuyor.
Codex ismi, 2021'de GPT-3 tabanlı ve GitHub Copilot'un kod tamamlama özelliğini destekleyen bir OpenAI modeline dayanıyor. Bazı OpenAI çalışanları tarafından ismin, "code execution" (kod yürütme) kısaltması olduğu düşünülüyor. Bu ismin seçilmesindeki amaç, yeni ajanı bu erken döneme bağlamak olarak açıklandı.
OpenAI'nin geliştirdiği bu araç, piyasadaki benzer araçlarla rekabet ediyor. Özellikle Anthropic'in Claude Code gibi araçlarının tasarımından etkilenip etkilenmediği sorulduğunda, bu rekabetçi dinamik kabul edildi. Ancak OpenAI, web tabanlı Codex özelliklerini kendi içinde geliştirdiğini ve CLI sürümünün Anthropic'in aracından sonra geldiğini belirtti.
Harici geliştiriciler arasında Codex kullanımı, interaktif CLI uzantısının GPT-5 ile birlikte ağustos 2025'te sunulmasından sonra 20 kat arttı. 15 Eylül'de OpenAI, ajans kodlama için optimize edilmiş özel bir GPT-5 sürümü olan GPT-5 Codex'i piyasaya sürdü. Bu gelişme, aracın benimsenmesini daha da hızlandırdı.
OpenAI mühendislerinin de büyük çoğunluğu artık Codex'i düzenli olarak kullanıyor. Şirket, dış geliştiricilerin indirebileceği, katkıda bulunabileceği ve değiştirebileceği açık kaynaklı CLI sürümünü kendi içlerinde de kullanıyor. Bu durum, Codex'in sürekli bir gelişim döngüsü içinde olduğunu gösteriyor.
Codex'in bu döngüsel geliştirme yapısı, basit kod üretiminin ötesine geçiyor. Codex, kendi eğitim süreçlerini izleyebiliyor ve kullanıcı geri bildirimlerini analiz ederek bir sonraki adımı "karar verebiliyor". Ayrıca, Codex'in eğitim süreçleri için araştırma araçları yazması ve kendi eğitim süreçlerini izlemesi gibi deneyler de yapılıyor. OpenAI çalışanları, proje yönetim araçları aracılığıyla Codex'e görevler atayabiliyor, tıpkı bir insan meslektaşa iş verir gibi.
Bu tür geri beslemeli döngüler, bilgisayar tarihinde köklü bir yere sahip. İlk entegre devreler elle tasarlanırken, bu devreler daha karmaşık tasarımlara olanak tanıyan yazılımları çalıştırdı. OpenAI'nin Codex'i Codex'i geliştirmek için kullanması da bu örüntüyü takip ediyor: aracın her yeni nesli, bir sonraki neslin yeteneklerini besliyor.
Ancak Codex'in tam olarak ne yaptığını açıklamak dilsel bir zorluk sunuyor. Yapay zeka modellerini insanlaştırmadan, okuyucular için anlaşılır benzetmelerle açıklamak önem taşıyor. Codex ile insanlar gibi iletişim kurulabiliyor olsa da, bu durum aracın bilinçli bir varlık olduğu anlamına gelmiyor.
Sistem, birçok süreci otonom olarak yürütüyor, geri bildirimlere yanıt veriyor, alt süreçler başlatıp yönetiyor ve gerçek ürünlerde kullanılan kodlar üretiyor. OpenAI çalışanları buna "ekip arkadaşı" diyor ve görevleri insan meslektaşlarına atadıkları araçlarla atıyorlar. Codex'in üstlendiği görevlerin "kararlar" mı yoksa sinir ağları aracılığıyla karmaşık koşullu mantık mı olduğu, bilgisayar bilimcileri ve filozoflar tarafından hala tartışılıyor.
"Yapay Zeka Ekip Arkadaşları" ile Daha Hızlı Geliştirme
Görüşmelere göre, Codex'in iç etkisinin en çarpıcı örneği OpenAI'nin Sora Android uygulamasının geliştirilmesi oldu. Bu geliştirme aracı sayesinde şirket, uygulamayı rekor sürede tamamladı.
Sora Android uygulaması, sadece dört mühendis tarafından sıfırdan geliştirildi ve 18 günde tamamlanarak 28 gün içinde uygulama mağazasına yüklendi. Mühendisler daha önce iOS uygulamasını ve sunucu tarafı bileşenlerini hazır buldukları için Android istemcisine odaklandılar. Mimariyi planlamak, farklı bileşenler için alt planlar oluşturmak ve bu bileşenleri uygulamak için Codex'ten yardım aldılar.
OpenAI'nin Codex ile iç başarı iddialarına rağmen, bağımsız araştırmalar yapay zeka kodlama verimliliği konusunda karışık sonuçlar gösteriyor. Yapılan bir çalışma, deneyimli açık kaynak geliştiricilerin karmaşık ve olgun kod tabanlarında yapay zeka araçları kullanırken aslında %19 daha yavaş olduklarını ortaya koydu. Araştırmacılar, yapay zekanın daha basit projelerde daha iyi performans gösterebileceğini belirtti.
Codex ekibinden bir tasarımcı olan Ed Bayes, aracın kendi iş akışını nasıl değiştirdiğini anlattı. Bayes'e göre Codex, Linear gibi proje yönetim araçları ve Slack gibi iletişim platformlarıyla entegre olarak, ekip üyelerinin kodlama görevlerini doğrudan yapay zeka aracına atamasını sağlıyor. "Codex'i ekleyebiliyorsunuz ve artık sorunları Codex'e atayabiliyorsunuz," diyen Bayes, "Codex adeta çalışma alanınızdaki bir ekip arkadaşı gibi" diye ekliyor.
Bu entegrasyon, Slack kanalında birisi geri bildirim yayınladığında, Codex'i etiketleyip sorunu çözmesini isteyebileceği anlamına geliyor. Araç bir kod çekme isteği (pull request) oluşturacak ve ekip üyeleri aynı konuşma dizisi üzerinden değişiklikleri gözden geçirebilecek ve yineleyebilecek.
Bayes için, Codex'in arayüzlerinin görsel tasarımı ve etkileşim kalıpları üzerinde çalışan bu araç, spesifikasyonları mühendislere devretmek yerine doğrudan kod katkısı yapmasına olanak tanımış. "Bu size daha fazla etki gücü veriyor. Yığının tamamında çalışmanıza ve daha fazla şey yapabilmenize olanak tanıyor," diyor. OpenAI'deki tasarımcıların artık özellikleri doğrudan oluşturarak, Codex'i uygulama detaylarını halletmek için kullandığını belirtti.
OpenAI'nin yaklaşımı, Codex'i Bayes'in "çavuş bir geliştirici" olarak adlandırdığı bir araç olarak ele alıyor ve şirketin zamanla bir kıdemli geliştiriciye dönüşmesini umuyor. Bayes, "Bir çavuş geliştiriciyi işe alsaydınız, onu nasıl işe alırdınız? Ona bir Slack hesabı verirsiniz, bir Linear hesabı verirsiniz," diyor. "Bu sadece terminalde gittiğiniz bir araç değil, aynı zamanda size gelen ve ekibinizde yer alan bir şey."
Bu ekip arkadaşı yaklaşımıyla, insanlar için ne kalacak? Bu soruya yanıt veren Embiricos, geliştiricilerin yapay zeka tarafından üretilen kodu yakından incelemeden kabul ettiği "vibe coding" (vibe kodlama) ile yapay zeka araştırmacısı Simon Willison'ın bahsettiği, insanların döngüde kaldığı "vibe engineering" (vibe mühendisliği) arasında bir ayrım yaptı. "Kod tabanımızda çok daha fazla vibe engineering görüyoruz," dedi. "Codex'ten bu konuda çalışmasını istersiniz, belki önce bir plan istersiniz. Plan üzerinde gidip gelir, yineleme yaparsınız ve sonra modelle birlikte döngüde olursunuz ve kodunu dikkatlice incelersiniz."
Atılacak prototipler ve geçici araçlar için vibe kodlamanın hala bir yeri olduğunu ekledi. "Vibe kodlamanın harika olduğunu düşünüyorum," dedi. "Şimdi bir insan olarak koda ne kadar dikkat etmek istediğiniz konusunda takdir hakkınız var."
İleriye Bakış
Geçtiğimiz yıl boyunca, GPT-4.5 gibi "monolitik" büyük dil modelleri (LLM'ler), yapay zeka şirketlerinin simüle edilmiş akıl yürütme modellerine ve paralel çalışan birden fazla yapay zeka modelinden oluşan ajan sistemlerine yönelmesiyle sınır benchmark ilerlemesi açısından bir çıkmaz haline gelmiş gibi görünüyor. Embiricos'a, Codex gibi ajanların mevcut LLM teknolojisinden fayda sağlamanın en iyi yolu olup olmadığını sorduk.
Yapay zeka yeteneklerinin plato çizdiği yönündeki endişeleri reddetti. "Plato çizmekten çok uzağız," dedi. "Araştırma ekibimizdeki hızı görürseniz, neredeyse her hafta veya iki haftada bir model gönderiyoruz." GPT-5-Codex'in selefine göre %30 daha hızlı görevleri tamamladığına dair raporlara işaret etti. Testler sırasında şirketin, modelin karmaşık görevler üzerinde 24 saat boyunca bağımsız çalıştığını gördüğünü belirtti.
OpenAI, yapay zeka kodlama pazarında çok yönlü rekabetle karşı karşıya. Anthropic'in Claude Code ve Google'ın Gemini CLI'ı benzer terminal tabanlı ajans kodlama deneyimleri sunuyor. Bu hafta Mistral AI, Devstral 2'yi Mistral Vibe adlı bir CLI aracıyla birlikte piyasaya sürdü. Bu sırada, Cursor gibi girişimler yapay zeka kodlaması etrafında özel IDE'ler geliştirerek yıllık 300 milyon dolarlık gelir elde ettiklerini bildirdi.
İnsanlar yapay zeka modellerini gerçek kaynaklar olarak kullanmaya çalıştıklarında ortaya çıkan uydurma sorunlarıyla bilinen confabulation sorunları göz önüne alındığında, kodlamanın LLM'ler için "öldürücü uygulama" haline gelmiş olabileceği söylenebilir mi? OpenAI'nin, örneğin yapay zeka dil modellerini yazmak veya duygusal eşlikçi olarak kullanmaktan daha az tehlikeli, kodlamanın bugünün yapay zeka modelleri için açık bir iş kullanımı alanı olduğunu fark edip etmediğini merak ettik.
"Kodlamanın, ajanların çok hızlı bir şekilde iyileşeceği ve büyük ekonomik değer yaratacağı bir yer olduğunu kesinlikle fark ettik," dedi Embiricos. "Codex'e odaklanmak, misyonumuzla çok uyumlu hissediyoruz. Geliştiricilere büyük değer sağlayabiliyoruz. Ayrıca, geliştiriciler başkaları için bir şeyler inşa ederler, bu yüzden aslında onlarla ölçekleniyoruz."
Ancak Codex gibi araçlar yazılım geliştirici işlerini tehdit edecek mi? Bayes endişeleri kabul etti, ancak Codex'in OpenAI'de personel sayısını azaltmadığını ve "her zaman bir insan döngüde kalır çünkü insan kodu gerçekten okuyabilir" dedi. Benzer şekilde, her iki adam da Codex'in bir tür insan gözetimi olmadan kendi başına çalışacağı bir gelecek öngörmüyor. Aracın, insan potansiyelini değiştirmek yerine güçlendiren bir araç olduğunu düşünüyorlar.
Codex gibi ajanların pratik etkileri OpenAI'nin duvarlarının ötesine uzanıyor. Embiricos, şirketin uzun vadeli vizyonunun, kodlama ajanlarını programlama deneyimi olmayan insanlar için de kullanışlı hale getirmeyi içerdiğini söyledi. "Tüm insanlık bir IDE açmayacak veya bir terminalin ne olduğunu bile bilmeyecek," dedi. "Şu anda sadece yazılım mühendisleri için bir kodlama ajanı inşa ediyoruz, ancak inşa ettiğimiz şeyin şeklini, daha genel bir ajan olmaya gerçekten faydalı olacak bir şey olarak görüyoruz."