Ara

Google DeepMind’dan Devrim: Robotlar Artık Düşünerek Hareket Edecek!

Metin, görsel, ses ve hatta video üreten yapay zeka sistemleri giderek yaygınlaşıyor. Tıpkı bu veri türlerini üretebildikleri gibi, yapay zeka modelleri robot hareketlerini de üretebilir. Google DeepMind'ın bu temele dayanan Gemini Robotics projesi, harekete geçmeden önce düşünen ilk robotları yaratmak için birlikte çalışan iki yeni model tanıttı. Geleneksel büyük dil modellerinin (LLM) kendi sorunları olsa da, simüle edilmiş akıl yürütmenin tanıtılması yeteneklerini önemli ölçüde geliştirmişti ve şimdi aynısı yapay zeka robotları için de gerçekleşiyor olabilir.

DeepMind ekibi, üretken yapay zekanın robotik için benzersiz bir şekilde önemli bir teknoloji olduğuna inanıyor çünkü genel işlevselliğin önünü açıyor. Mevcut robotlar belirli görevler üzerinde yoğun bir şekilde eğitilmek zorunda ve genellikle başka hiçbir şeyi yapma konusunda yetersizler. Google DeepMind'ın robotik başkanı Carolina Parada, "Bugünün robotları oldukça özeldir ve kurulumları zordur; tek bir görevi yapabilen tek bir hücreyi kurmak genellikle aylar sürer" dedi.

Üretken sistemlerin temelleri, yapay zeka destekli robotları daha genel hale getiriyor. Yeniden programlanmalarına gerek kalmadan tamamen yeni durumlara ve çalışma alanlarına sunulabilirler. DeepMind'ın robotik konusundaki mevcut yaklaşımı iki modele dayanıyor: biri düşünen, diğeri ise yapan.

Bu iki yeni modelin adı Gemini Robotics 1.5 ve Gemini Robotics-ER 1.5. İlki, görsel ve metin verilerini kullanarak robot hareketlerini üreten bir görme-dil-eylem (VLA) modelidir. Diğer modeldeki "ER" ise gömülü akıl yürütme anlamına gelir. Bu, karmaşık bir görevi tamamlama adımlarını oluşturmak için görsel ve metin girdilerini alan bir görme-dil modelidir (VLM).

Düşünen Makineler

Gemini Robotics-ER 1.5, modern metin tabanlı sohbet robotları gibi simüle edilmiş akıl yürütme yeteneğine sahip ilk robotik yapay zekasıdır. Google bunu "düşünme" olarak adlandırmayı seviyor, ancak bu üretken yapay zeka alanında biraz yanıltıcı bir terim. DeepMind, ER modelinin hem akademik hem de dahili kıyaslamalarda en üst düzeyde puanlar aldığını belirtiyor ve bu da fiziksel bir alanla nasıl etkileşim kurulacağı konusunda doğru kararlar verebileceğini gösteriyor. Ancak herhangi bir eylemde bulunmuyor. İşte Gemini Robotics 1.5'in devreye girdiği yer burası.

Bir robotun bir çamaşır yığınını beyazlar ve renkliler olarak ayırmasını istediğinizi varsayalım. Gemini Robotics-ER 1.5, bu isteği fiziksel çevrenin (bir yığın giysi) görüntüleriyle birlikte işleyecektir. Bu yapay zeka, daha fazla veri toplamak için Google araması gibi araçları da çağırabilir. Ardından ER modeli, robotun verilen görevi tamamlamak için izlemesi gereken belirli adımlar olan doğal dil talimatları oluşturur.

Gemini Robotics 1.5 (eylem modeli), bu talimatları ER modelinden alır ve hareketlerini yönlendirmek için görsel girdileri kullanırken robot hareketlerini üretir. Ancak her adıma nasıl yaklaşacağını düşünmek için kendi düşünce sürecinden de geçer. DeepMind'dan Kanishka Rao, "Bir insanın bu görevi yönlendirmesine yardımcı olan her türlü sezgisel düşünce vardır, ancak robotlarda bu sezgi yoktur. 1.5 ile VLA'da yaptığımız en büyük gelişmelerden biri, harekete geçmeden önce düşünme yeteneğidir" dedi.

DeepMind'ın her iki yeni robotik yapay zekası da Gemini temel modelleri üzerine kurulmuş, ancak fiziksel bir alanda faaliyet göstermeye uyum sağlamış verilerle ince ayarlanmıştır. Ekip, bu yaklaşımın robotlara daha karmaşık çok aşamalı görevleri yerine getirme yeteneği kazandırdığını ve robotiklere ajans yetenekleri getirdiğini söylüyor.

DeepMind ekibi, Gemini robotiklerini iki kollu Aloha 2 ve insansı Apollo gibi birkaç farklı makineyle test ediyor. Geçmişte yapay zeka araştırmacılarının her robot için özel modeller oluşturması gerekiyordu, ancak bu artık gerekli değil. DeepMind, Gemini Robotics 1.5'in farklı gövdelerde öğrenebildiğini ve Aloha 2'nin tutucularından Apollo'nun daha karmaşık ellerine özel bir ayarlama yapmadan öğrenilen becerileri aktarabildiğini belirtiyor.

Yapay zeka tarafından desteklenen bu fiziksel ajanlar hakkındaki tüm bu konuşmalar eğlenceli olsa da, çamaşırlarınızı yıkamanızı isteyebileceğiniz bir robottan hala çok uzaktayız. Robotları gerçekten kontrol eden model olan Gemini Robotics 1.5, hala yalnızca güvenilir test kullanıcılarına açık. Bununla birlikte, düşünen ER modeli artık Google AI Studio'da kullanıma sunuluyor ve geliştiricilerin kendi fiziksel gövdeli robot deneyleri için robotik talimatları oluşturmalarına olanak tanıyor.

Önceki Haber
Amazon'dan Prime İptali İçin Dev Adım: Milyarlarca Lira İade!
Sıradaki Haber
Oyunseverlere Müjde: GeForce NOW Kütüphanesine 10 Yeni Oyun Ekleniyor!

Benzer Haberler: