Ara

Robotlar Google’ın ‘Düşünen Yapay Zekası’ Sayesinde Dünyayı Anlamaya Başlıyor

Google DeepMind, robotların daha önce imkansız görünen karmaşık genel görevleri yerine getirmesini ve akıl yürütmesini sağlayacak iki yeni yapay zeka (YZ) modelini tanıttı.

Şirket daha önce, Gemini büyük dil modeline (LLM) dayanan ancak robotik alanına özel olarak geliştirilmiş bir YZ modeli olan Gemini Robotics'in ilk versiyonunu duyurmuştu. Bu model, makinelerin fiziksel ortamlarda akıl yürütmesini ve basit görevleri yerine getirmesini sağlıyordu.

Gemini Robotics 1.5 ve Gemini Robotics-ER 1.5 olarak adlandırılan yeni modeller, önceki versiyonun çok adımlı, "uzun vadeli" görevleri yerine getirme yeteneklerini önemli ölçüde genişletiyor ve robotların gerçek dünya senaryolarında insanlara yardımcı olma yolunda önemli bir kilometre taşını temsil ediyor.

Google'ın sunduğu temel örneklerden biri, bir muzu sepete koyma görevi. Önceki YZ modeli, "Bu muzu sepete koy" gibi basit bir komutu alıp robot kolunu yönlendirerek bu görevi tamamlayabiliyordu.

Ancak yeni iki modelle desteklenen bir robot artık bir grup meyveyi alıp renklerine göre ayrı kaplara ayırabiliyor. Bir gösterimde, iki robot kolu (şirketin Aloha 2 robotu) bir muzu, bir elmayı ve bir limonu uygun renkteki üç tabağa doğru bir şekilde yerleştirdi. Dahası, robot görevi yerine getirirken ne yaptığını ve nedenini doğal dilde açıklayabiliyor.

Derin Zihin'de kıdemli araştırma bilimcisi olarak görev yapan bir yetkili, sunulan bir videoda "Onu düşünmeye yetenekli hale getiriyoruz," dedi. "Ortamı algılayabilir, adım adım düşünebilir ve ardından bu çok adımlı görevi tamamlayabilir. Bu örnek çok basit görünse de, arkasındaki fikir gerçekten güçlü. Aynı model, daha karmaşık günlük görevleri yerine getirecek daha gelişmiş insansı robotlara güç verecek."

YARININ YAPAY ZEKA DESTEKLİ ROBOTİĞİ

Bu gösterim yüzeyde basit görünse de, bir dizi gelişmiş yeteneği ortaya koyuyor. Robot, meyvelerin ve tabakların konumunu mekansal olarak belirleyebiliyor, meyveleri ve tüm nesnelerin rengini tanımlayabiliyor, paylaşılan özelliklere göre meyveleri tabaklarla eşleştirebiliyor ve akıl yürütme sürecini açıklayan doğal dil çıktısı sunabiliyor.

Tüm bunlar, en yeni YZ modellerinin birbirleriyle etkileşim kurma şekli sayesinde mümkün oluyor. Bu modeller, bir yönetici ve bir işçi gibi birlikte çalışıyor.

Google Robotics-ER 1.5 (beyin), bir alandaki bilgiler ve içindeki nesneler hakkında veri toplayan, doğal dil komutlarını işleyen ve Google Robotics 1.5'e (eller ve gözler) talimat göndermek için gelişmiş akıl yürütme ve araçları kullanabilen bir vizyon-dil modelidir (VLM). Google Robotics 1.5, bu talimatları alanıyla ilgili görsel anlayışıyla eşleştirir ve yürütmeden önce bir plan oluşturur, bu sırada süreçleri ve akıl yürütmesi hakkında geri bildirim sağlar.

İki model, önceki versiyonlardan daha yetenekli ve görevleri tamamlamak için Google Arama gibi araçları kullanabiliyor.

Ekip, bir araştırmacının Aloha'dan konumuna göre geri dönüşüm kurallarını kullanarak bazı nesneleri kompost, geri dönüşüm ve çöp kutularına ayırmasını istemesiyle bu kapasiteyi gösterdi. Robot, kullanıcının San Francisco'da bulunduğunu fark etti ve çöpleri uygun kutulara doğru bir şekilde ayırmasına yardımcı olmak için internetten geri dönüşüm kurallarını buldu.

Yeni modellerde temsil edilen bir diğer gelişme ise birden fazla robotik sistemde öğrenme (ve bu öğrenmeyi uygulama) yeteneğidir. DeepMind temsilcileri, Aloha 2 robotu (iki robot kolu), Apollo insansı robotu ve Franka çift kollu robotu arasında elde edilen herhangi bir öğrenmenin, modellerin genelleştirilmiş öğrenme ve evrimleşme biçimi nedeniyle diğer sistemlere uygulanabileceğini belirtti.

Gemini Robotics Ekibi, yeni modeller hakkındaki teknik raporunda, "Genel amaçlı robotlar, fiziksel dünya hakkında derin bir anlayışa, gelişmiş akıl yürütmeye ve genel ve becerikli kontrole ihtiyaç duyar" dedi. Bu tür genelleştirilmiş akıl yürütme, modellerin fiziksel alanlar ve etkileşimler hakkında geniş bir anlayışla bir probleme yaklaşabileceği ve görevleri kolayca yürütülebilecek küçük, bireysel adımlara ayırarak buna göre problem çözebileceği anlamına gelir. Bu, yalnızca çok spesifik, dar durumlar ve bireysel robotlar için geçerli olan uzmanlaşmış bilgiye dayanan önceki yaklaşımlardan farklıdır.

Bilim insanları, robotların gerçek bir senaryoda nasıl yardımcı olabileceğine dair ek bir örnek sundu. Bir Apollo robotuna iki kutu verildi ve kıyafetleri renge göre ayırması istendi; beyazlar bir kutuya, diğer renkler diğerine. Görev ilerledikçe kıyafetleri ve kutuları hareket ettirerek, robotun fiziksel alanı yeniden değerlendirmesini ve buna göre tepki vermesini zorlayarak ek bir zorluk eklediler, ki bu da robot tarafından başarıyla yönetildi.

Önceki Haber
Çin'den Nvidia Yapay Zeka Çipleri İçin Kapsamlı Yasak: H20 ve RTX 6000D Sevkiyatları Mercek Altında
Sıradaki Haber
Dil Öğrenme Uygulaması Duolingo, OpenAI'ın En Çok Token Kullanan Müşterisi Olabilir Mi?

Benzer Haberler: