Ara

Google’dan Devrim Niteliğinde Yenilik: Anında Sesli Çeviri Gemini 3.5 Live Translate ile Hayat Buluyor!

Google, uzun yıllardır peşinde koştuğu gerçek zamanlı çeviri teknolojisinde önemli bir adım atarak, bunu makine öğreniminin öncü deneylerinden biri olarak tanımlıyor. Geçmişte Google etkinliklerinde defalarca gösterilen bu teknoloji, genellikle özel cihazlar veya belirli kurulumlar gerektiriyordu. Geçen yıl Translate uygulamasıyla daha fazla kullanıcıya ulaşan gerçek zamanlı çeviri, şimdi ise daha geniş bir alana yayılıyor. Gemini 3.5 Live Translate'in piyasaya sürülmesiyle birlikte, anında çeviriye daha önce hiç olmadığı kadar düşük gecikme süresiyle ve daha fazla noktada erişim mümkün hale geliyor.

Yeni yapay zeka modeli, geçtiğimiz günlerde duyurulan 3.5 ailesinin bir parçası. Bu modelin öncesinde sadece Flash sürümü kullanıma sunulmuştu. Gemini 3.5 Live Translate, 70'ten fazla dilde otomatik algılama ve çeviri yapabilen, konuşmadan konuşmaya bir model olarak geliştirildi.

Google'dan yapılan açıklamalara göre, Gemini 3.5 Live Translate o kadar hızlı ki, konuşmacının sadece birkaç saniye gerisinde kalarak normal bir sohbeti yakalayabiliyor. Ayrıca, konuşmanın tonunu, temposunu ve perdesini de eşleştirerek daha doğal bir ses deneyimi sunuyor. Bu sayede, çeviri sesi robotik bir tınıdan uzaklaşarak size daha yakın geliyor. Kontrollü koşullarda kaydedilen demo videoları oldukça etkileyici görünüyor. Modelin yeteneklerini bizzat deneyimlemek için uzun süre beklemenize gerek kalmayacak.

Gemini 3.5 Live Translate, Google ekosisteminin çeşitli bölümlerine entegre ediliyor. Geliştiriciler, Gemini Live API veya AI Studio üzerinden herkese açık önizleme ile çalışmaya başlayabilirler. Model, sürekli olarak konuşmayı işleyerek tüm çok dilli girişleri otomatik olarak yönetiyor, böylece geliştiricilerin manuel ayarlar yapma ihtiyacı ortadan kalkıyor. Yoğun ortamlardaki arka plan gürültüsünü de filtreleme yeteneğine sahip.

Seçili kurumsal müşteriler de bu ay itibarıyla Google Meet'te yeni çeviri modeline erişim sağlayacak. Bu özelliğin daha geniş çaplı bir kullanıma sunulması da yakın zamanda planlanıyor. Google, canlı çeviri özelliğini ön plana çıkarmak için Meet arayüzünde de iyileştirmeler yapıyor. En dikkat çekici gelişme ise, 3.5 Live Translate'in yakında hem Android hem de iOS platformlarındaki Google Translate uygulamasına entegre edilecek olması.

Geçtiğimiz yılın sonlarına doğru, Google Translate uygulaması içinde herhangi bir kulaklıkla (ve iOS uygulamasında) Gemini tabanlı canlı çeviri testlerine başlamıştı. Daha öncesinde bu özellik için Android telefonlarla birlikte şirketin Pixel Buds'ına ihtiyaç duyuluyordu. Yapılacak güncelleme ile en yeni 3.5 modeli eklenerek bu yetenek daha da genişleyecek. Artık herhangi bir kulaklık kullanılabileceği gibi, kulaklık kullanma zorunluluğu da ortadan kalkıyor. Eğer kulaklığınız yoksa, telefonu kulağınıza götürerek telefonla konuşur gibi konuşulan çeviriyi dinleyebilirsiniz. Ancak bu "dinleme modu" şu an için sadece Android'de çalışıyor.

Gemini 3.5 Live Translate'ten gelen ses akışlarının, kullanıcının sesini tam olarak taklit etmese de canlı bir ses gibi duyulması hedefleniyor. Ancak Google bu konuda temkinli ilerliyor. Tüm Gemini 3.5 Live Translate ses akışları, dalga formu verilerine entegre edilmiş SynthID dijital filigranlarına sahip olacak. Bu, konuşmanın yapay zeka tarafından üretildiğini belirtecek ve şu anda bu filigranı kaldırmanın bir yolu bulunmuyor.

Önceki Haber
Anthropic'tan Yapay Zeka Sınırlamaları: Fable 5 Hangi Konularda Sessiz Kalıyor?
Sıradaki Haber
Artemis III Görevine NASA'dan Kritik Ekip Açıklaması: Ay'a Dönüş Yaklaşıyor!

Benzer Haberler: