Yapay Zeka Kodlama Asistanları Minesweeper’ı Yeniden İnşa Etti: Sonuçlar Şaşırttı!

Yapay zekanın bilgisayar programcılığına yardımcı olma fikri son zamanlarda oldukça tartışmalı bir konu haline geldi. Bir yandan, kodlama asistanları korkunç hatalar yapabiliyor ve bu hataların düzeltilmesi için verimsiz insan denetimi gerektiriyor, bu da birçok geliştiricinin konsept hakkındaki güvenini yitirmesine neden oluyor. Diğer yandan, bazı kodlayıcılar yapay zeka kodlama asistanlarının güçlü araçlar olabileceğini ve en yeni modellerin geçmişteki yaygın sorunları aşan şekillerde kodlamada hızla geliştiğini savunuyor.

Bu modern yapay zeka kodlama araçlarının ne kadar etkili hale geldiğini görmek için, dört büyük modeli basit bir görevle test etmeye karar verdik: klasik Windows oyunu Minesweeper'ı yeniden yaratmak. LLM'ler gibi örüntü eşleştirme sistemlerinin, ünlü oyunları yeniden yaratmak için mevcut kodlardan yararlanması nispeten kolay olduğundan, bu teste bir yenilik unsuru da ekledik.

Dört ana yapay zeka kodlama aracını (OpenAI'nin GPT-5 tabanlı Codex'i, Anthropic'in Opus 4.5 ile Claude Code'u, Google'ın Gemini CLI'ı ve Mistral Vibe'ı) terminal uygulamaları aracılığıyla bu görev için kullandık. Yapay zeka ajanları, komutu yorumlayan ve görevleri yerine getirebilen LLM'lere atayan yönlendirici bir yapay zeka modeli tarafından yönlendirilerek doğrudan HTML ve betik dosyaları üzerinde çalıştı. Tüm yapay zeka planları özel olarak finanse edildi ve ilgili şirketlerden herhangi bir özel veya ayrıcalıklı erişim sağlanmadı.

Daha sonra, bu yapay zeka tarafından oluşturulan Minesweeper klonlarının, her birinin nasıl çalıştığını ve hangi özelliklere sahip olduğunu inceledik.

Mistral Vibe Değerlendirmesi

Bu versiyon, ileri düzey Minesweeper oyuncularının kullandığı, bir sayının etrafındaki kalan boşlukları hızlıca temizlemeye yarayan "chording" özelliğini uygulamadığı için puan kaybetti. Bu özellik olmadan, oyun oynaması biraz hantal hissettiriyor. Ayrıca, "Custom" (Özel) zorluk düğmesinin aslında hiçbir işe yaramaması da şaşırtıcı. Mobil cihazlarda oyun iyi çalışsa da, bir kareyi bayrakla işaretlemek küçük bir kareye uzun basmayı gerektiriyor ve bu da seçici tutamaçları tetikleyerek temizlenmesini zorlaştırıyor.

Sunum açısından, test ettiğimiz tek çalışan versiyondu ve ses efektleri içermiyordu. Oyunun yeniden başlatılması için kullanılan siyah "gülümseyen yüz" düğmesi de tanıdık sarı versiyona kıyasla biraz itici. Yeni bir oyun başlatması dışında fazladan bir "New Game" (Yeni Oyun) düğmesi bulunması da gereksizdi. "Eğlenceli" yeni özellik olarak ise, oyunu tamamladığınızda ızgarada bir gökkuşağı arka plan deseni eklenmesi görülüyor. Genel olarak, bu versiyon birçok temeli doğru yapsa da, chording özelliğini atlamış ve küçük sunum ve "eğlenceli" dokunuşlarda iyi performans göstermemiş.

OpenAI Codex Değerlendirmesi

Bu ajan, yalnızca kritik "chording" özelliğini içermekle kalmamış, aynı zamanda hem PC hem de mobil tarayıcılar için kullanım talimatlarını da eklemiş. Kareleri bayraklarla işaretlerken "?" işaretleri arasında geçiş yapma seçeneği de etkileyiciydi. Mobil cihazlarda, bir kareye parmağınızı basılı tutarak bayrak işaretleme seçeneği, bu versiyonu test ettiğimiz en keyifli elde taşınır versiyon haline getiriyor.

Sunumda, eski tarz ifadeli gülen yüz düğmesi oldukça sevimli. "Bomba" gösterimi için basit bir "*" ve işaretlenmiş kareler için çirkin kırmızı bir "F" kullanılması daha az etkileyiciydi. Ses efektleri eski bilgisayarları anımsatıyor ve kapatma seçeneğinin olması güzel. "Eğlenceli" özellik olarak, "Sürpriz: Şanslı Temizleme Bonusu" köşede gösteriliyor ve mevcut olduğunda ücretsiz bir güvenli kare veriyor. Ancak, bu bonusun yalnızca büyük ve seri güvenli kareler bulduktan sonra verilmesi biraz garip. Genel olarak, uygulama chording ve sevimli sunum dokunuşları nedeniyle listenin başında yer alıyor.

Anthropic Claude Code Değerlendirmesi

Bu versiyon, tüm temel oyun mekaniklerini doğru bir şekilde uyguluyor ancak gerçekten verimli Minesweeper oyunu için gerekli olan kritik chording özelliğinden yoksun. Mobil versiyondaki "bayrak modu" değiştiricisi işlevsel olsa da, kullanımı biraz hantal ve daha büyük oyun boyutlarında tahtanın bir kısmını görsel olarak kesiyor.

Sunum açısından, test ettiğimiz versiyonlar arasında en cilalı olanı diyebiliriz. "Yüz" düğmesi için sevimli emojiler, güzel görünen bomba ve bayrak grafikleri ve basit ama etkili ses efektleri profesyonel bir görünüm sunuyor. "Power Mode" (Güç Modu) düğmesi, bazı eğlenceli güçlendirmeler sunuyor ancak bunların dengesi tam olarak oturmamış. "Shield" (Kalkan) ve "Blast" (Patlama) güçleri iyi olsa da, "X-Ray" (X-Işını) güçlendirmesi kolayca istismar edilebilir. Diğer modellere kıyasla en hızlı kodlama deneyimini sunması ve iyi bir sunuma sahip olması nedeniyle geçerli bir puan alıyor.

Google Gemini CLI Değerlendirmesi

Gemini CLI bize tıklanabilir birkaç gri kutu sunsa da, oyun alanları eksikti. Yapay zeka ile etkileşimli sorun giderme bu sorunu çözebilse de, "tek seferlik" bir test olarak model tamamen başarısız oldu. Yapay zeka, her denemede yaklaşık bir saat süren kod üretmede çok yavaştı ve WAV dosyası ses efektleri oluşturmaya çalışarak takılıyordu. Bu test için "tamamlanmamış" kabul edilebilir.

Sonuç

OpenAI Codex, chording özelliğini içermesi nedeniyle bu yarışmayı kazandı. Claude Code ise güçlü sunumu ve hızlı kodlama süresiyle öne çıktı. Mistral Vibe bir adım gerideyken, Google Gemini tabanlı CLI tek seferlik testimizde tamamen başarısız oldu. Bu sonuçlar, yapay zeka kodlama ajanlarının, özellikle insan becerilerini destekleyen interaktif araçlar olarak ne kadar yetenekli olabileceğini gösteriyor.

Mistral Vibe Değerlendirmesi

OpenAI Codex Değerlendirmesi

Anthropic Claude Code Değerlendirmesi

Google Gemini CLI Değerlendirmesi

Sonuç

İlker Özgül

macOS Tahoe Kullanıcıları Ekran Titremesi Sorunuyla Karşı Karşıya!

DRAM Tedarikçileri Yeni 'Noel Baba' mı Oldu? Kapasite Dağıtımı Seçici Davranışla Yapılıyor

Son Haberler

KATEGORİLER

BAĞLANTILAR

Ara

Yapay Zeka Kodlama Asistanları Minesweeper’ı Yeniden İnşa Etti: Sonuçlar Şaşırttı!

Mistral Vibe Değerlendirmesi

OpenAI Codex Değerlendirmesi

Anthropic Claude Code Değerlendirmesi

Google Gemini CLI Değerlendirmesi

Sonuç

İlker Özgül

macOS Tahoe Kullanıcıları Ekran Titremesi Sorunuyla Karşı Karşıya!

DRAM Tedarikçileri Yeni 'Noel Baba' mı Oldu? Kapasite Dağıtımı Seçici Davranışla Yapılıyor

Benzer Haberler:

Son Haberler

KATEGORİLER

BAĞLANTILAR