Yapay zeka destekli görüntü düzenleme dünyasında heyecan verici bir gelişme yaşanıyor. LMArena liderlik tablosunda üst sıralara yerleşen etkileyici yetenekleriyle dikkat çeken "nano muz" olarak bilinen yeni bir modelin adı dolaşıyordu. Şimdi ise Google, nano muz'un kendi bünyesindeki Google DeepMind'ın bir yeniliği olduğunu duyurdu ve bu yeniliğin bugün Gemini uygulamasına entegre edildiğini açıkladı.
Yapay zeka görüntü düzenleme, Photoshop gibi karmaşık programlarla uğraşmak yerine metin komutlarıyla görselleri değiştirmenize olanak tanıyor. Google, Gemini'ye ilk olarak bu yılın başlarında görüntü düzenleme özellikleri eklemişti ve o dönemdeki modeli oldukça yetenekliydi. Ancak tüm üretken sistemlerde olduğu gibi, bu modellerin deterministik olmayan doğası gereği, görsellerdeki öğeler sık sık öngörülemeyen şekillerde değişebiliyordu. Google'ın belirttiğine göre, "nano muz" (teknik olarak Gemini 2.5 Flash Image), düzenlemeler arasında rakipsiz bir tutarlılık sağlıyor; yani her değişiklikte zar atmak yerine detayları hatırlayabiliyor.
Bu yenilik, yapay zeka ile görüntü düzenlemenin birçok ilginç kullanım alanının kapısını aralıyor. Google, bir kişinin fotoğrafını yükleyerek stilini veya kıyafetini değiştirmeyi öneriyor. Örneğin, bir kişiyi matador veya 90'lar sitcom karakteri olarak yeniden hayal edebilirsiniz. "Nano muz" modeli, düzenlemeler boyunca tutarlılığı koruyabildiği için, sonuçların orijinal kaynak görselindeki kişiye benzemesi bekleniyor. Bu durum, arka arkaya birden fazla düzenleme yapıldığında da geçerli. Google, ilerleyen aşamalarda bile sonuçların orijinal kaynak materyaline benzeyeceğini belirtiyor.
Gemini'nin geliştirilmiş görüntü düzenleme yetenekleri, birden fazla görseli birleştirerek bunları yeni bir görsel oluşturmak için kullanmanıza da imkan tanıyor. Google'ın aşağıdaki örneği, bir kadın ve bir köpeğin ayrı ayrı görsellerini alarak, köpeğin sevildiği yeni bir anlık görüntü oluşturmak için kullanıyor; belki de üretken yapay zekanın şu ana kadarki en iyi kullanımı budur. Gemini'nin görüntü düzenleme özelliği, daha soyut şekillerde de birleştirme yapabilir ve modelin güvenlik duvarlarını ihlal etmeyen her şeyi oluşturmak için komutlarınızı takip eder.
Diğer Google yapay zeka görüntü oluşturma modellerinde olduğu gibi, Gemini 2.5 Flash Image'ın çıktıları da her zaman köşede görünür bir "AI" filigranıyla birlikte geliyor. Görüntü ayrıca, orta düzeyde bir değişikliğin ardından bile tespit edilebilen görünmez bir SynthID dijital filigranına da sahip.
Bu yeni yerel görüntü düzenleme özelliğini bugün Gemini uygulamasında deneyebilirsiniz. Google, yeni görüntü modelinin yakında Gemini API, AI Studio ve Vertex AI'de geliştiriciler için de kullanıma sunulacağını belirtiyor.