Nvidia, gerçek dünyada yüksek hassasiyet gerektiren ve el becerisi isteyen görevleri kendi kendine öğrenen yapay zeka destekli robotları tanıttı. Bu ENPIRE teknolojisinin demoları arasında, bir oda dolusu robotun ekran kartlarını anakartlara takmak gibi karmaşık işlemleri başarıyla gerçekleştirdiği görülüyor. Robotlar ayrıca bir kaptaki metal pimleri ayırabiliyor ve kablo bağlarını manipüle edip kesebiliyor.
Nvidia'nın Yapay Zeka Direktörü ve Seçkin Bilim İnsanı Jim Fan, bu demoların araştırmacıların ilk kez fiziksel dünyada 'otomatik araştırma' (AutoResearch) yapabildiğini gösterdiğini belirtti. Fan'ın açıklamasına göre, ENPIRE projesi 8 adet Codex aracına bir robot filosunu, bir miktar ekran kartını ve cömert bir token bütçesini tahsis etti. Ardından bu araçlara, hata yapmadan ve mümkün olan en kısa sürede bir görevi çözmeleri talimatı verildi.
Talimatın ardından robot filosu canlandı: Araçlar görsel ipuçlarını aramayı, sahneyi sıfırlamayı, yeni beceriler edinmeyi, kontrol yığınını kurcalamayı, çevrimiçi makaleler okumayı, tartışmayı, düşünmeyi, takılıp kalmayı ve doğrudan donanım üzerinde tekrar denemeyi öğrendiler. Fan, bu sürecin temelinde sadece Codex'e fiziksel dünya için bir API sağlamak olduğunu ve geri kalanının kendi kendine ortaya çıkan bir gelişim olduğunu ifade etti.
Özellikle bir robotun ekran kartlarını tek başına anakartlara monte etmesi dikkat çekiciydi. Bu kişisel bilgisayar toplama görevine ait kısa kayıtta, bir robot kolunun bir ekran kartı seçip önünde anakart bulunan başka bir robota aktardığı görülüyor. İkinci robot kolu, kartın PCIe yuvasını anakart yuvasıyla hizalayacak şekilde dikkatlice konumlandırıyor, nazikçe aşağı iniyor ve yerine oturtuyor. Yerleştirme sırasında biraz titreme olsa da, işlemin başarılı olduğu düşünülüyor. Robotların üstlendiği diğer otomatik araştırma görevleri arasında ince pimleri düzenlemek ve kablo bağlarını bağlayıp kesmek de bulunuyordu.
Bu demoların arkasındaki teknikler hakkında daha fazla bilgi, ENPIRE: Agentic Robot Policy Self-Improvement in the Real World adlı araştırma makalesinde bulunabilir. Araştırmacılar ayrıca farklı kodlama araçlarının (Codex, Claude Code ve Kimi Code gibi) karşılaştırmalı test sonuçlarını da sundular. Robot filosunu ölçeklendirmenin de test edildiği çalışmada, sekiz robotun paralel olarak görevleri daha az sayıda robota göre önemli ölçüde daha hızlı çözdüğü sonucuna varıldı. Fan, robotları eğittikten sonra herkesin tatile gidebileceği ve işverenlerin bunu fark etmeyeceği esprisini yaptı.