Teknoloji devi Google, üretken yapay zeka modelleri geliştirmeye büyük yatırımlar yapıyor. Metin mesajlarını düzenleyebilen ve web özetleri oluşturabilen Google'ın yapay zekası, gerçek zeka kapasitesini kanıtlama yolunda önemli adımlar atıyor. Uluslararası Üniversite Programlama Yarışması (ICPC) bu noktada önemli bir rol oynuyor. Google, Gemini 2.5'in 2025 ICPC Dünya Finalleri'ne katıldığını ve altın madalya kazandığını duyurdu. Google'a göre bu başarı, 'yapay genel zekaya giden yolda önemli bir adım' olarak nitelendiriliyor.
Her yıl binlerce üniversite düzeyindeki programcı, ICPC etkinliğinde beş saat boyunca karmaşık kodlama ve algoritma problemleriyle mücadele ediyor. Bu, türünün en büyük ve en uzun soluklu yarışması. Google, Gemini 2.5 Deep Think'i ICPC tarafından onaylanmış çevrimiçi bir ortama bağlayarak yarışmaya katıldı. İnsan yarışmacılara 10 dakikalık bir başlangıç hakkı tanındıktan sonra Gemini "düşünmeye" başladı.
Google'dan yapılan açıklamaya göre, bu yılın başlarında Uluslararası Matematik Olimpiyatı (IMO) için oluşturulan özel bir modelin aksine, ICPC için özel olarak eğitilmiş yeni bir model kullanılmadı. Yarışmaya katılan Gemini 2.5 AI, diğer Gemini uygulamalarında gördüğümüz genel modelle aynıydı. Ancak, yarışmanın beş saatlik süresi boyunca çözümler aramak için düşünme token'larını işlemeye yönelik olarak "geliştirildi".
Süre sonunda Gemini, 12 sorudan 10'una doğru cevap vererek altın madalyayı kazanmayı başardı. 139 insan takımından yalnızca dördü bu başarıyı tekrarlayabildi. ICPC direktörü Bill Poucher, "ICPC her zaman problem çözmede en yüksek standartları belirlemeyle ilgili olmuştur. Gemini'nin bu arenaya başarılı bir şekilde katılması ve altın düzeyde sonuçlar elde etmesi, gelecek nesil için gereken yapay zeka araçlarını ve akademik standartları tanımlamada önemli bir anı işaret ediyor" dedi.
İnsandan Fazlası
ICPC'de puan kazanmak için yalnızca doğru çözümler kabul ediliyor ve çözüm bulma süresi nihai skoru etkiliyor. Gemini, sekiz problemi yalnızca 45 dakikada doğru bir şekilde tamamlayarak üst sıralara hızla yükseldi. 677 dakika sonunda Gemini 2.5 Deep Think, 10 doğru cevapla üniversite takımları arasında ikinciliğe yerleşti.
Gemini'nin tüm çözümlerini GitHub üzerinden inceleyebilirsiniz. Ancak Google, özellikle Problem C'yi oldukça etkileyici olarak vurguluyor. Bu soru, hayali "flubber" depolama ve boşaltma oranlarıyla ilgili çok boyutlu bir optimizasyon problemiydi ve tüm insan takımlarını zorladı. Ama Gemini'yi değil.
Google'a göre, flubber rezervuarlarının sonsuz sayıda olası konfigürasyonu bulunuyor, bu da optimum kurulumu bulmayı zorlaştırıyor. Gemini, her rezervuarın bir öncelik değerine sahip olduğunu varsayarak probleme yaklaştı ve bu sayede dinamik programlama algoritmasını kullanarak en verimli konfigürasyonu bulabildi. Bu problem üzerinde 30 dakika çalıştıktan sonra Deep Think, doğru değerleri belirlemek için iç içe geçmiş ternary arama yöntemini kullandı.
Bu yılki ICPC'deki Gemini'nin çözümleri yarışma koordinatörleri tarafından puanlandı. Ancak Google, Gemini 2.5'i önceki ICPC problemlerine de uyguladı. Şirket, yaptığı dahili analizlerin Gemini'nin 2023 ve 2024 soru setleri için de altın madalya statüsüne ulaştığını gösterdiğini bildirdi.
Google, Gemini'nin bu tür ileri akademik yarışmalarda başarılı olma yeteneğinin, yarı iletken mühendisliği ve biyoteknoloji gibi sektörlerde yapay zekanın geleceğini öngördüğüne inanıyor. Çok adımlı mantıkla karmaşık bir problemi çözme yeteneği, Gemini 2.5 gibi yapay zeka modellerini bu alanlarda çalışan insanlar için paha biçilmez hale getirebilir. Şirket, en üst sıralardaki üniversite takımlarının zekasını Gemini'ninkiyle birleştirirseniz, 12 ICPC probleminin tamamına doğru cevaplar elde edeceğinizi belirtiyor.
Elbette, beş saat boyunca inanılmaz bir hızda çalışan çıkarım işlemi maliyetsiz değil. Google, bir yapay zeka modelinin ICPC'de rekabet etmesi için ne kadar güç harcadığını açıklamadı, ancak bunun oldukça fazla olduğunu güvenle varsayabiliriz. Daha basit tüketiciye yönelik modeller bile şu anda kâr etmeyecek kadar pahalı olsa da, daha önce çözülemeyen problemleri çözebilen yapay zeka, teknolojinin yüksek maliyetini haklı çıkarabilir.