Üretken yapay zekanın hızla yayılması, Google ve diğer teknoloji devlerinin ürün tasarlama biçimini değiştirdi. Ancak kullandığınız yapay zeka özelliklerinin çoğu, yoğun işlem gücüne sahip uzak sunucularda çalışıyor.
Telefonunuzun işlem gücü çok daha kısıtlı olsa da, Google geliştiricilere önemli yeni mobil yapay zeka araçları sunmaya hazırlanıyor. Gelecek hafta düzenlenecek Google I/O etkinliğinde, geliştiricilerin cihaz içi yapay zeka için Gemini Nano'nun yeteneklerinden yararlanmasını sağlayacak yeni bir dizi API'nin duyurulması bekleniyor.
Google, geliştiricilere yönelik büyük yeni yapay zeka özellikleri hakkında belgeler yayınladı. ML Kit SDK'sına yapılacak bir güncellemenin, Gemini Nano aracılığıyla cihaz içi üretken yapay zeka özellikleri için API desteği ekleyeceği belirtiliyor. Bu altyapı, AI Core üzerine kurulu ve önceden tanımlanmış özellikler içeren mevcut bir modelle entegre çalışarak geliştiriciler için uygulamayı kolaylaştırmayı hedefliyor.
Google'a göre, ML Kit'in GenAI API'leri, uygulamaların veriyi buluta göndermeden özetleme, düzeltme, yeniden yazma ve görüntü tanımlama gibi işlemleri yapmasına olanak tanıyacak. Ancak Gemini Nano'nun cihaz içi versiyonu, bulut tabanlı versiyon kadar güçlü değil, bu nedenle bazı sınırlamalar bekleniyor. Örneğin, Google, özetlerin maksimum üç madde işareti içerebileceğini ve görüntü tanımlamalarının yalnızca İngilizce olarak sunulacağını belirtiyor. Çıktıların kalitesi de telefondaki Gemini Nano sürümüne bağlı olarak değişebilir. Standart sürüm (Gemini Nano XS) yaklaşık 100 MB boyutundayken, Gemini Nano XXS sürümü bunun dörtte biri boyutunda, yalnızca metin tabanlı ve çok daha küçük bir bağlam penceresine sahip.
Bu adım Android ekosistemi için genel olarak faydalı, çünkü ML Kit, Google'ın Pixel serisi dışındaki cihazlarda da çalışıyor. Pixel cihazlar Gemini Nano'yu yoğun olarak kullanırken, Gemini Nano'yu destekleme kapasitesine sahip diğer Android telefonlarda da çalışabilecek. Daha fazla telefon Google'ın yapay zeka modeline destek ekledikçe, geliştiriciler üretken yapay zeka özellikleriyle bu cihazları hedefleyebilecek.
Belgeler şu anda geliştiricilerin incelemesi için mevcut, ancak Google I/O'da API kapılarını tamamen açmasını bekliyoruz. Şirket, I/O'da "Gemini Nano on Android: Cihaz İçi Üretken Yapay Zeka ile Geliştirme" başlıklı bir oturumu zaten doğruladı. Oturum açıklaması, "metni özetlemek, düzeltmek ve yeniden yazmak, ayrıca görüntü açıklamaları oluşturmak" için yeni API'ler vaat ediyor, bu da yeni ML Kit API'lerinin yapabilecekleriyle tam olarak örtüşüyor.
Yapay Zeka Bulmacasının Önemli Bir Parçası
Android'de cihaz içi üretken yapay zeka özellikleri eklemek isteyen uygulama geliştiricileri şu anda zor bir durumda. Google, modelleri çalıştırmak için NPU donanımına erişim sağlayabilen AI Edge SDK'yı sunuyor, ancak bu araçlar deneysel ve şu anda yalnızca belirli cihazlarda çalışıyor, ayrıca metinle sınırlı. Hem Qualcomm hem de MediaTek, yapay zeka iş yüklerini çalıştırmak için API'ler sunuyor, ancak özellikler ve işlevsellik cihaza göre değişiyor, bu da uzun vadeli bir proje için bunlara güvenmeyi riskli hale getiriyor. Kendi modelinizi çalıştırmak ise üretken yapay zeka sistemleri hakkında derin bilgi gerektiriyor. Yeni API'ler, yerel yapay zekayı uygulamayı nispeten hızlı ve kolay hale getirmeli.
Cihaz içi bir modelin sınırlı işlevselliğine rağmen, bu, yapay zekanın nasıl daha faydalı hale gelebileceğinin önemli bir parçası. Çoğu insan, kişisel verilerinin tamamını yapay zeka işleme için uzak bir sunucuya göndermemeyi tercih eder, ancak cihaz içi bir model bu bilgiyi daha güvenli bir şekilde işleyebilir. Örneğin, Google'ın ekran görüntüsü işleme özelliği tüm ekran görüntülerinizi görür, ancak tüm işlem telefonunuzda gerçekleşir. Benzer şekilde, bazı telefonlar bildirim özetlerini yerel olarak işlerken, daha az yetenekli modeller bu tür işlemleri bir sunucuya gönderebilir.
Gemini Nano ile entegre çalışan API'lerin yayınlanması, mobil yapay zekaya çok ihtiyaç duyulan tutarlılığı sağlayabilir. Ancak bu, Google ve cihaz üreticilerinin Gemini Nano desteği konusunda işbirliği yapmasına bağlı. Bazı şirketler kendi yollarına gitmeye karar verebilir ve yerel olarak yapay zeka çalıştırmaya yetecek güce sahip olmayan birçok telefon da olacaktır.