Yapay zeka kodlama ajanlarına bir laboratuvar dolusu robotik kol, biraz hesaplama gücü ve onlara çeşitli görevler öğretmek için cömert bir 'token bütçesi' verdiğinizde ne olur? Bu ajanlar, robotlara fermuar bağlarını kesmeyi ve hatta anakartlardaki ince yuvalara ekran kartı (GPU) takmayı öğretecek bir eğitim rejimi geliştirebiliyor.
Yapay zekanın robot eğitimini otomatikleştirmede tamamen otonom bir şekilde nasıl hareket edebileceğine dair bu bakış açısı, yapay zeka modellerini çeşitli araçları kullanabilmeleri için saran ve aynı zamanda hafıza, bağlam, kısıtlama ve geri bildirim döngüleri gibi yetenekler sağlayan bir yazılım olan yeni bir ajan çerçevesiyle mümkün oldu. Bu ajan çerçevesi ENPIRE, Nvidia'nın Genel Amaçlı Gömülü Ajan Araştırması (GEAR) laboratuvarındaki robotik araştırmacıları tarafından Pittsburgh'daki Carnegie Mellon Üniversitesi ve Berkeley'deki Kaliforniya Üniversitesi'nden işbirlikçilerle geliştirildi.
Nvidia'da Yapay Zeka Direktörü Jim Fan, bir sosyal medya paylaşımında, "NVIDIA GEAR laboratuvarımızın bir kısmı artık gece boyunca yorulmadan kendini iyileştiriyor. Sabahları raporları okuyoruz" dedi.
Fan ayrıca, bu tür yapay zeka güdümlü robot eğitiminin amacını şakayla şöyle tanımladı: "Hepimiz tatile çıkıyoruz ve Jensen farkında bile olmaz." Ancak bundan sadece Nvidia robotik araştırmacıları faydalanmıyor; Fan, ekibin her şeyi açık kaynak olarak sunacağını, böylece herkesin evde kendi 'kendi kendine çalışan robot laboratuvarını' kurabileceğini belirtti.
ENPIRE çerçevesi, yapay zeka kodlama ajanlarının görevler üzerinde otomatik sıfırlama ve doğrulama yapmasına, robotik davranışı yönlendiren politikaları iyileştirmesine, birden fazla fiziksel robot üzerinde bu politikaları değerlendirmesine ve günlükleri analiz ederek, araştırma makalelerini inceleyerek ve eğitim altyapısı ile algoritma kodunu iyileştirerek arızaları gidermesine olanak tanıyan dört modüle sahiptir. Daha fazla teknik ayrıntı, 16 Haziran 2026 tarihinde yüklenen araştırma makalesinde bulunabilir.
Çerçeve, OpenAI'nin GPT-5.5'li Codex'i, Anthropic'in Opus 4.7'li Claude Code'u ve Moonshot AI'nin Kimi K2.6'lı Kimi Code'u dahil olmak üzere üç farklı yapay zeka kodlama ajanı ile test edildi. Kodlama ajanlarından oluşan ekipler, robot eğitimi için bağımsız olarak farklı algoritmik yaklaşımlar geliştirdi, bunları gerçek dünya deneylerinde test etti ve ardından tekrar eden kendi kendine yönlendirilen test döngülerinde genel başarı oranını artıran değişiklikleri korudu.
Yapay Zeka Güdümlü Robot Eğitiminin Başarısı ve Sınırları
ENPIRE ile donatılmış yapay zeka kodlama ajanları, standart "Push-T" görevi de dahil olmak üzere çeşitli manipülasyon görevlerinde yüzde 99 başarı oranına ulaşan robotik kendi kendine iyileştirme stratejileri geliştirdi. Bu görev, robotları bir T şeklindeki bloğu masanın üzerindeki hedef konuma oturtmaya zorluyor. Diğer görevler arasında pin kutusundaki iğneleri düzenleme, fermuar bağlarını bağlama ve kesme, bir anakarta GPU yerleştirme ve ardından bir sonraki deneme için sıfırlamak üzere ekran kartını çıkarma yer alıyordu.
En umut verici sonuç, pin yerleştirme ve düzenleme görevinden gelmiş olabilir. Bu robot eğitimi senaryosunda, yapay zeka kodlama ajanları, aynı insan araştırmacıların çoğu tarafından geliştirilen bir "sınır insan-in-the-loop yöntemi"nden daha hızlı bir şekilde neredeyse yüzde 100 başarı elde etti.
Bu tür deneyler ayrıca, sekiz yapay zeka kodlama ajanından oluşan daha büyük ekiplerin, daha küçük dört ajanlı ekiplere veya tek başına çalışan tekil ajanlara kıyasla robot eğitiminde daha hızlı bir şekilde yüksek başarı oranlarına ulaşabildiğini gösterdi. Örneğin, sekiz ajanlı ekip, Push-T görevinde iki saatlik araştırma süresinde yüzde 99 başarı elde ederken, dört ajanlı ekip üç saat, tek ajanlı ekip ise neredeyse beş saat gerektirdi.
Ancak insan araştırmacılar, yapay zeka kodlama ajanlarını otonom robot eğitmenleri olarak serbest bıraktıklarında bazı kritik sınırlamalar da keşfettiler. Kodlama ajanları "günlükleri okuma, kod yazma, hata ayıklama veya dil modeli arka ucunu bekleme" ile meşgulken robotlar genellikle boşta ve kullanılmıyordu. Daha büyük kodlama ajanı ekipleri, birbirlerinin fikirlerini özetleyerek daha fazla zaman harcadı ve robotları fiilen kullanarak daha az zaman harcadı ve kodlama ajanları bazen paralel eğitim oturumları başlatırken mevcut hesaplama kaynaklarından tam olarak yararlanamadı.
Daha fazla ajan ve robotun birlikte çalışmasıyla elde edilen daha hızlı başarı oranları, daha yüksek token tüketimi maliyetine de yol açtı; bu, Anthropic gibi yapay zeka geliştiricilerinin yapay zeka hizmetlerini kullanmanın token ile ilgili maliyetlerini önemli ölçüde artıracak fiyatlandırma değişikliklerini tartıştığı bir dönemde dikkate değer bir husustur.
Yapay zeka patlamasından elde edilen nakit akışıyla Nvidia, çeşitli robotik girişimleriyle fiziksel yapay zeka vizyonunu agresif bir şekilde ilerletiyor. 31 Mayıs'ta şirket, genel amaçlı yapay zeka destekli robotlar geliştiren araştırma laboratuvarları için "Referans İnsansı Robot" sağlamak üzere önde gelen Çinli robotik şirketi Unitree ile bir ortaklık duyurdu.
Haziran ayının başlarında Güney Kore'ye yaptığı yoğun bir tur sırasında Nvidia kurucusu ve CEO'su Jensen Huang, Hyundai Motor İcra Kurulu Başkanı Chung Euisun ile yapay zeka destekli robotların seri üretimini ölçeklendirmeyi görüşmek üzere bir araya geldi. Hyundai Motor Group, dört ayaklı "robot köpeği" Spot ile zaten iyi bilinen ve Atlas insansı robotunu ticarileştirmek için çalışan ABD robotik şirketi Boston Dynamics'in sahibidir.