Google'ın yapay zeka alanındaki güçlü modelleri Gemini, her geçen gün gelişim gösteriyor. Ancak Gemini'nin kullanım şartları zaman zaman geliştiriciler için kısıtlayıcı olabiliyordu. Bu noktada Google'ın Gemma açık ağırlık modelleri daha fazla özgürlük sunuyordu. Bir yılı aşkın süre önce tanıtılan Gemma 3'ün yerini ise artık Gemma 4 alıyor. Geliştiriciler, yerel kullanıma özel olarak optimize edilmiş dört farklı boyutta sunulan Gemma 4 ile çalışmaya başlayabiliyor. Ayrıca Google, yapay zeka lisanslamaları konusundaki geliştirici endişelerini dikkate alarak Gemma'nın özel lisansından vazgeçtiğini duyurdu.
Google, açık ağırlık modellerinin önceki sürümlerinde olduğu gibi, Gemma 4'ü de yerel makinelerde kullanılabilir şekilde tasarladı. Gemma 4'ün iki büyük varyantı olan 26B Mixture of Experts ve 31B Dense, 80GB'lık tek bir Nvidia H100 GPU üzerinde bfloat16 formatında, sıkıştırılmamış olarak çalışmak üzere optimize edildi. Elbette bu, oldukça yüksek maliyetli bir donanım anlamına gelse de, yine de yerel bir çözüm olarak dikkat çekiyor. Daha düşük hassasiyetle çalışacak şekilde sıkıştırıldığında ise bu büyük modeller, tüketici düzeyindeki GPU'lara sığabilecek hale geliyor.
Google ayrıca Gemma'nın yerel işlem gücünden tam olarak faydalanmak için gecikme süresini azaltmaya odaklandığını belirtiyor. 26B Mixture of Experts modeli, çıkarım modunda 26 milyar parametresinin sadece 3.8 milyarını aktif hale getirerek, benzer boyutlardaki modellere göre çok daha yüksek belirteç başına saniye hızı sunuyor. 31B Dense modeli ise hızdan ziyade kaliteye odaklanıyor ve Google, geliştiricilerin bu modeli özel kullanımlar için ince ayardan geçireceğini öngörüyor.
Gemma 4'ün diğer iki modeli olan Effective 2B (E2B) ve Effective 4B (E4B) ise mobil cihazları hedefliyor. Bu modeller, 2 milyar veya 4 milyar etkili parametre ile çalışarak çıkarım sırasında düşük bellek kullanımı sağlayacak şekilde tasarlandı. Google, Pixel ekibinin Qualcomm ve MediaTek ile yakın işbirliği içinde bu modelleri akıllı telefonlar, Raspberry Pi ve Jetson Nano gibi cihazlar için optimize ettiğini açıklıyor. Bu modellerin Gemma 3'e kıyasla daha az bellek ve pil tüketmesinin yanı sıra, Google "neredeyse sıfır gecikme" iddiasında bulunuyor.
Daha Güçlü, Daha Açık Bir Yapay Zeka Deneyimi
Tüm yeni Gemma 4 modelleri, geliştiricilere göre Gemma 3'ü geride bırakacak. Google, bu yeni modellerin yerel donanımda çalıştırılabilen en yetenekli modeller olduğunu iddia ediyor. Google'ın açıklamasına göre, 31B Gemma modeli, açık kaynaklı yapay zeka modelleri sıralamasında üçüncü sıraya yerleşecek. Ancak, en büyük Gemma 4 varyantı bile bu modellere kıyasla oldukça küçük kalıyor, bu da teorik olarak çalıştırmanın çok daha uygun maliyetli olacağı anlamına geliyor.
Google'ın kapalı kaynaklı Gemini 3 modelleriyle aynı temel teknolojiyi paylaşan Gemma 4, gelişmiş akıl yürütme, matematiksel işlem ve komut takip yetenekleri sunuyor. Yapay zeka alanındaki son gelişmeler doğrultusunda ajan benzeri iş akışı yönetimi de ön plana çıkarken, Gemma 4 bu değişime yerel fonksiyon çağırma, yapılandırılmış JSON çıktıları ve yaygın araçlar ile API'ler için yerel komutlar desteğiyle hazır.
Üretken yapay zekanın temel uygulamalarından biri olarak kod üretimi de öne çıkıyor ve Google, Gemma 4'ün bu alanda da optimize edildiğini belirtiyor. Yapay zeka sistemleriyle yetkin kodlar üretmek mümkün olsa da, Gemini Pro ve Claude Code gibi güçlü performans gösteren çözümler genellikle bulut tabanlı hizmetler.
Google'a göre, Gemma 4, uygun donanıma sahip olduğunuz takdirde, çevrimdışı bir ortamda benzer kalitede kod üretebilir. Aynı şekilde, Google, Gemma 4'ün görsel girdi işlemede daha iyi olduğunu ve OCR ve grafik anlama gibi görevleri yerel sistemlerde daha güvenilir hale getirdiğini ifade ediyor. Verimli E2B ve E4B modelleri ayrıca konuşma tanıma için yerel destek sunuyor. Gemma 3 ailesinde de bu özellik bulunuyordu, ancak Google Gemma 4'ün bu konuda daha gelişmiş olduğunu ima ediyor.
Tüm bu özellikler 140'tan fazla dilde çalışabiliyor ve hangi dil kullanılırsa kullanılsın, Gemma 4 çok geniş metinleri işleyebiliyor. Kenar modeller için bağlam penceresi artık 128 bin jeton, 26B ve 31B modeller ise 256 bin jeton sunuyor. Bu, yerel bir model için oldukça iyi bir değer olsa da, bulut tabanlı Gemini modelleri 1 milyon jetonluk bağlam penceresiyle çok daha geniş bir kapasite sunuyor.
Tüm bu performans artışları önemli olsa da, lisans anlaşmasındaki değişiklik, Gemma için en önemli gelişme olabilir. Google'ın önceki açık modelleri, birçok geliştiricinin kısıtlayıcı bulduğu özel bir Google lisansıyla geliyordu. Gemma 3 lisansı, Google'ın tek taraflı olarak güncelleyebileceği ve geliştiricilerin Gemma tabanlı tüm projelerde Google'ın kurallarını uygulamalarını zorunlu kılan katı bir yasaklı kullanım politikasına sahipti. Hatta bu lisansın, Gemma ile üretilen sentetik verilerle oluşturulan diğer yapay zeka modellerine lisansı devredebileceği şeklinde yorumlanabiliyordu. Bu durum, birçok geliştiriciyi Google'ın açık modelleriyle çalışmaktan çekindirmişti.
Buna karşılık Apache 2.0 lisansı, aşırı kullanım şartları veya ticari kısıtlamalar olmadan çok daha esnek bir yapı sunuyor. Geliştiriciler Apache lisansına aşina ve rahatlar ve Google'ın bu lisansın gelecekte farklı çalışacağına dair tek taraflı karar vermesi mümkün değil. Google, geliştiricilere verileri ve dağıtım planları üzerinde daha fazla kontrol vererek, Gemma'yı daha fazla projede kullanmalarını ve şirketin "Gemmaverse" olarak adlandırmayı sürdürdüğü ekosistemi genişletmelerini teşvik edeceğine inanıyor.
Yeni Nano Modeli Geliyor
E2B ve E4B modellerinin piyasaya sürülmesi, Google'ın akıllı telefon yapay zeka çabalarındaki yönünü de gösteriyor. Google Pixel ve bazı diğer akıllı telefonlar, Gemini Nano olarak bilinen yerel yapay zeka modellerini çalıştırıyor. Bu sayede Android telefonlar, verilerini buluta göndermeden telefon ve metin dolandırıcılıklarını tespit edebiliyor, notları özetleyebiliyor veya telefon görüşmesi özetleri oluşturabiliyor. Google'dan bir temsilci, Gemini Nano'nun her zaman Gemma modellerinden türetildiğini belirtiyor, ancak bu durum özellikle yeni nesil Gemini Nano 4 güncellemesi için daha da geçerli.
Bu, Google'ın akıllı telefon tabanlı minimal yapay zeka modelinin güncellenmiş bir sürümünün geleceğini doğruladığı ilk sefer. Pixel telefonlarda çalışan mevcut Gemini Nano 3, Gemma 3n'e dayanıyor, ancak Google, bir sonraki nesil Nano 4'ün Gemma 4 E2B ve E4B'ye dayanan 2B ve 4B varyantlarına sahip olacağını doğruladı.
Şirket, geliştiricileri AI Core Geliştirici Önizlemesi'nde Gemma E2B ve E4B ile ajan benzeri iş akışlarını prototiplemeye davet ediyor. Bu yeni modellerle tasarlanan sistemler, piyasaya sürüldüğünde Gemini Nano 4 ile ileriye dönük uyumlu olacak. Bu konuda birkaç hafta içinde I/O etkinliğinde daha fazla bilgi duyulabilir.
Yeni Gemma modellerini AI Studio (31B ve 26B MoE) ve AI Edge Gallery (E4B ve E2B) üzerinde hemen inceleyebilirsiniz. Model ağırlıklarını Hugging Face, Kaggle ve Ollama'dan tam olarak indirebilirsiniz. Modeller yerel işlem gücü için optimize edilmiş olsa da, Google bunları Google Cloud üzerinde ücretli olarak çalıştırmaktan da memnuniyet duyuyor.