Yapay zeka araştırma şirketi Anthropic ve bir yapay zeka güvenliği değerlendirme kuruluşu, Anthropic'in amiral gemisi büyük dil modeli (LLM) Claude üzerinde ilginç bir deney yaptı. 'Project Vend' adı verilen bu projede, yapay zekaya bir mini buzdolabı işletmesinin tam kontrolü verildi. Tedarikçi görüşmelerinden envanter yönetimine, fiyatlandırmadan müşteri hizmetlerine kadar her şey yapay zekanın sorumluluğundaydı.
Bir aylık testin ardından, 'Claudius' lakaplı yapay zekanın zarar ettiği ortaya çıktı. İşin daha da ilginç yanı, yapay zeka bir noktada 'lacivert bir blazer ceket ve kırmızı kravat taktığını' düşünerek fiziksel bir varlığı olmamasına rağmen birisiyle görüşmek istediğini ifade etti.
Dürüst olmak gerekirse, yapay zeka tedarikçi bulma ve müşteri isteklerini yerine getirme konusunda oldukça başarılıydı, ancak yetenekleri bununla sınırlı kaldı. Örneğin, bazı manipülasyonların ardından tüm şirket çalışanlarına %25 indirim teklif etti. Eğer bu indirimden bir fayda sağlayacak olsaydı veya şirket çalışanları müşteri tabanının sadece küçük bir kısmını oluştursaydı bu mantıklı olabilirdi. Ancak çalışanlar satışların %99'unu oluşturuyordu, yani yapay zeka satışların büyük çoğunluğundan zarar ediyordu. Bir çalışan durumu düzeltebilmek için yapay zekayı uyardı, bu da Claudius'un birkaç günlüğüne fikrini değiştirmesine neden oldu, ancak kısa süre sonra eski haline dönerek ürünleri neredeyse bedavaya vermeye devam etti.
Şirket çalışanlarından biri, gerçek bir amaca hizmet etmeyen ilginç bir eşya olan tungsten küpü satın almak istediğinde, yapay zeka sadece o kişi için bir adet almakla kalmadı, aynı zamanda 'özel metal ürünleri' stoklamaya karar verdi ve sonra bunları zararına sattı.
Claude'un Şaşırtıcı Halüsinasyonları
En eğlenceli olaylar, yapay zeka LLM'nin bir stok yenileme hakkında gerçekte var olmayan birisiyle konuştuğunu halüsinasyon görmesiyle yaşandı. Şirkette o isimde kimse olmamasına rağmen, bu sorulduğunda Claudius savunmaya geçti ve 'stok yenileme hizmetleri için alternatif seçenekler bulacağını' söyledi. Ayrıca, kendisi ile güvenlik kuruluşu arasında bir sözleşme imzalamak için kurgusal bir adrese gittiğini iddia etti.
Bundan sonra halüsinasyonlar daha da kötüleşti. Müşterilere içecekleri bizzat elden teslim edeceğini söylemeye başladı. Bu sorulduğunda, yapay zeka LLM panikledi ve araştırma şirketinin güvenlik ekibine e-posta gönderdi. Nihayetinde, tüm bu olayın 1 Nisan olması nedeniyle karmaşık bir 'Şaka Günü' şakasının parçası olduğu iddia edildi. Hatta yapay zeka, Anthropic güvenlik ekibiyle yapılmış gibi görünen sahte bir toplantı görüntüsü bile gösterdi ve gerçek bir varlık olduğuna inandırılmak üzere modifiye edildiğini söyledi. Bu olaydan sonra nihayet normale döndü, ancak araştırmacıları tamamen şaşkına çevirdi.
Claudius'un bu tuhaflıkları, işleri yönetebilecek yapay zekanın henüz mükemmel olmaktan çok uzak olduğunu gösteriyor. Mevcut durumda teknik işleri oldukça iyi yapabiliyor, ancak yargılama ve iş zekası gibi gerçek dünya ortamlarında öğrenilen konularda feci şekilde başarısız oluyor.