Ara

Google DeepMind’dan Çığır Açan Yenilik: Genie 3 ile Gerçek Zamanlı İnteraktif Dünyalar Yaratın!

Üretken yapay zeka ile para kazanmanın henüz tam olarak keşfedilmemiş olmasına rağmen, Google DeepMind sınırları zorlamaya devam ediyor. Derin Öğrenme'nin (DeepMind) modellerinin yetenekleri ve maliyetleri etkileyici bir artış eğiliminde. Bu eğilimin son örneği ise Genie 3'ün tanıtımı oldu. Sadece yedi ay önce, öncülü üzerinde önemli bir gelişme olan Genie 2 'temel dünya modelini' tanıtan Google, şimdi Genie 3 ile karşımızda.

Genie 3 ile tek bir komut veya görsel, interaktif bir dünya yaratmak için yeterli oluyor. Ortam sürekli olarak üretildiği için anında değiştirilebiliyor. Nesneler eklenebilir veya değiştirilebilir, hava koşulları ayarlanabilir veya yeni karakterler eklenebilir. DeepMind bu duruma 'komutla tetiklenebilir olaylar' adını veriyor. Değiştirilebilir 3D ortamlar yaratma yeteneği, oyunları oyuncular için daha dinamik hale getirebilir ve geliştiricilere konseptleri ve seviye tasarımlarını test etmek için yeni yollar sunabilir. Ancak, oyun endüstrisindeki birçok kişi bu tür araçların yardımcı olacağı konusunda şüphelerini dile getirdi.

Genie 3'ü sadece oyun yaratma aracı olarak düşünmek cazip gelse de, DeepMind bunu bir araştırma aracı olarak da görüyor. Oyunlar, yapay zekanın geliştirilmesinde önemli bir rol oynar çünkü zorlu, etkileşimli ortamlar ve ölçülebilir ilerleme sunarlar. Bu nedenle DeepMind daha önce Go ve StarCraft gibi oyunlara yapay zekanın sınırlarını genişletmek için yönelmişti.

Dünya modelleri bunu bir sonraki seviyeye taşıyor ve bir dünya modelini kare kare oluşturuyor. Bu, 'somutlaştırılmış ajanlar' dahil olmak üzere yapay zeka modellerinin gerçek dünya durumlarıyla karşılaştıklarında nasıl davranacaklarını iyileştirmek için bir fırsat sunuyor. Yapay genel zeka (AGI) hedefine ulaşma yolunda şirketlerin karşılaştığı temel sınırlamalardan biri, güvenilir eğitim verisinin kıtlığıdır. İnternetteki hemen her web sayfasını ve videoyu yapay zeka modellerine besledikten sonra, araştırmacılar birçok uygulama için sentetik verilere yöneliyor. DeepMind, dünya modellerinin bu çabanın önemli bir parçası olabileceğine inanıyor, çünkü bu modeller yapay zeka ajanlarını neredeyse sınırsız etkileşimli dünyalarla eğitebilir.

DeepMind, Genie 3'ün Genie 2'ye kıyasla çok daha yüksek görsel sadakat sunması ve tamamen gerçek zamanlı olması nedeniyle önemli bir gelişme olduğunu belirtiyor. Klavye girdisi kullanarak, simüle edilmiş dünyada 720p çözünürlükte saniyede 24 kare hızında gezinebilmek mümkün. Belki de daha da önemlisi, Genie 3 yarattığı dünyayı hatırlayabiliyor.

Genie 2'nin en belirgin sınırlamalarından biri, çoğu simülasyonda yaklaşık 10 saniye ile sınırlı olan belleğiydi. Sohbet botlarının bağlam penceresini aşmasına benzer şekilde, model kısa bir süre görüş alanı dışına çıkan dünyanın hangi kısımlarının göründüğünü unutuyordu. Google, modeli tanıttığında Genie 2'nin yetersiz tutmasını 'uzun ufuk belleği' olarak adlandırmıştı. İşler ne kadar hızlı değişiyor. Genie 3 için ufuk çok daha uzun ve çoklu dakikalarca görsel tutarlılıkla dünya modellerinin sınırlarını zorluyor.

Mükemmel Olmayan Bir Dünya

Genie 3 henüz mükemmel bir dünya oluşturucu değil. Birden çok dakikayı detayları koruma yeteneği daha fazla kullanıma olanak tanıyabilir, ancak ekip ideal olarak bir modelin en az saatlerce tutarlı kalmasını istediğini kabul ediyor. Model ayrıca gerçek dünya konumlarını simüle edemiyor; oluşturduğu her şey benzersiz ve deterministik değil. Bu da onu tipik yapay zeka halüsinasyonlarına eğilimli hale getiriyor. Ekip, Genie 3'ün doğrulukta büyük adımlar attığını belirtiyor, ancak yine de yanlış video öğeleri üretebiliyor. Örneğin, insan hareketlerinin inceliği bazen üretken karışıma kaybolabiliyor ve geriye doğru yürüyormuş gibi görünen insanlar ortaya çıkabiliyor. Bu yapay zeka dünyalarındaki metinler de, komut modele dahil etmesi için belirli dizeler içermedikçe bir karmaşa halindeydi.

Yapay zeka ajanlarının dünya modellerine entegrasyonu da sınırlı. Gerçekçi koşullara sahip dünyalar ve komutla tetiklenebilir olaylar yaratabiliyor olsanız da, ajanların bu olaylarda bir rolü yok. Simüle edilmiş dünyayla etkileşimleri, mevcut ajanların simülasyonu değiştirme yeteneği için gerekli olan üst düzey akıl yürütmeden yoksun olmaları nedeniyle, yalnızca içinde hareket etmekle sınırlı. DeepMind ayrıca birden fazla yapay zeka ajanının ortak bir ortamda birbirleriyle etkileşim kurmasına izin vermenin yolları üzerinde deneyler yapmaya devam ediyor. Belki de bunu birkaç ay içinde Genie 4'te görürüz?

Aylık yüzlerce doları premium yapay zeka abonelikleri için ödemeye istekli olanlar bile, en büyük ve en pahalı modellerde kullanım sınırları olduğunu öğrendi. Genie 3, etkileşimli görünecek kadar hızlı çok uzun bir video oluşturuyor ve bu da kesinlikle muazzam bir işlem gücü gerektiriyor. Google DeepMind bu konuda herhangi bir ayrıntı sunmuyor, ancak kullanamamanız bile çok şey anlatıyor.

Genie 3 hala bir araştırma aracı olarak kalmaya devam ediyor, ancak DeepMind'ın açıkça sergilemek istediği yeteneklere sahip. Ekip, modeli geliştirmeye yardımcı olacak bir grup uzmana ve araştırmacıya erişim sağlamayı planlıyor. Bununla birlikte, Genie dünya modellerine daha fazla kişiye erişim açma planları olduğunu öneriyorlar.

Önceki Haber
Google'dan Kagi'ye Geçiş: Arama Motoru Deneyiminde Yeni Bir Dönem Başlıyor
Sıradaki Haber
Mech Avcılarının Yeni Gözdesi: Daemon X Machina: Titanic Scion İncelemesi

Benzer Haberler: