Yapay zekanın (YZ) üretken evresinin üçüncü aşamasına giriş yapıyoruz. Chatbot'larla başlayan, ardından asistanlarla devam eden bu yolculukta şimdi de 'ajanlar' ile tanışıyoruz. Ajanlar, daha fazla özerklik hedefleyen ve karmaşık görevleri yerine getirmek için 'takımlar' halinde çalışabilen veya araçları kullanabilen sistemlerdir.
Son dönemin öne çıkan ürünü, OpenAI'nin ChatGPT ajanı. Bu yeni sistem, daha güçlü bir bütün oluşturmak için önceden var olan iki ürünü (Operator ve Deep Research) birleştiriyor. Geliştiricisine göre bu sistem, 'düşünüyor ve hareket ediyor'.
Bu yeni nesil sistemler, önceki YZ araçlarından bir adım öteyi temsil ediyor. Nasıl çalıştıklarını, neler yapabildiklerini, aynı zamanda potansiyel dezavantajlarını ve risklerini anlamak hızla daha elzem hale geliyor.
Chatbot'lardan Ajanlara
ChatGPT, Kasım 2022'de chatbot devrini başlattı. Ancak devasa popülerliğine rağmen, konuşma arayüzü teknolojinin yapabildiklerini sınırlıyordu.
Ardından YZ asistanları, yani copilot'lar sahneye çıktı. Bu sistemler, üretken YZ chatbot'larına güç veren büyük dil modellerinin üzerine inşa edilmiştir, ancak artık insan komutları ve gözetimiyle görevleri yerine getirecek şekilde tasarlanmışlardır.
Ajanlar ise bir adım daha öteye gidiyor. Bu sistemler, çeşitli derecelerde özerklikle hedeflere ulaşmayı amaçlar. Daha gelişmiş yetenekler olan akıl yürütme ve hafıza ile desteklenirler.
Birden fazla YZ ajanı sistemi, karmaşık sorunları çözmek için planlama, zamanlama, karar verme ve koordinasyon yoluyla birbirleriyle iletişim kurarak birlikte çalışabilir.
Ajanlar aynı zamanda 'araç kullanıcılarıdır'. Web tarayıcıları, e-tablolar, ödeme sistemleri gibi özel görevler için yazılım araçlarını kullanabilirler.
Hızlı Gelişimin Bir Yılı
Ajan tabanlı YZ, geçen yılın sonlarından beri kendini hissettiriyor. Büyük bir adım, geçen Ekim ayında atıldı; Anthropic, Claude chatbot'una bir bilgisayarla insana benzer şekilde etkileşim kurma yeteneği kazandırdı. Bu sistem, birden fazla veri kaynağını arayabilir, ilgili bilgileri bulabilir ve çevrimiçi formları doldurabilirdi.
Diğer YZ geliştiricileri de hızla takip etti. OpenAI, Operator adında bir web tarayıcı ajanı yayınladı; Microsoft, Copilot ajanlarını duyurdu. Google'ın Vertex AI ve Meta'nın Llama ajanları piyasaya sürüldü.
Bu yılın başlarında Çinli startup Monica, Manus AI ajanının gayrimenkul satın aldığını ve ders kayıtlarını özet notlara dönüştürdüğünü gösterdi. Bir başka Çinli startup Genspark ise, Google'ın şu anda yaptığına benzer şekilde tek sayfalık bir özet sunan ve çevrimiçi görevler için yerleşik bağlantılar içeren bir arama motoru ajanı yayınladı.
Bir başka startup olan Cluely, biraz kontrolsüz bir 'herhangi bir şeyde hile yap' ajanı sunarak dikkat çekti, ancak henüz anlamlı sonuçlar elde edemedi.
Tüm ajanlar genel amaçlı aktivite için tasarlanmamıştır. Bazıları belirli alanlar için özelleşmiştir.
Kodlama ve yazılım mühendisliği bu alanda öncü konumda. Microsoft'un Copilot kodlama ajanı ve OpenAI'nin Codex'i başı çekiyor. Bu ajanlar bağımsız olarak kod yazabilir, değerlendirebilir ve commit edebilir; aynı zamanda insan tarafından yazılan kodu hatalar ve performans aksaklıkları açısından değerlendirebilirler.
Arama, Özetleme ve Daha Fazlası
Üretken YZ modellerinin temel güçlü yanlarından biri arama ve özetlemedir. Ajanlar, bunu bir insan uzmanının günlerini alabilecek araştırma görevlerini yerine getirmek için kullanabilir.
OpenAI'nin Deep Research'ü, çok adımlı çevrimiçi araştırmalarla karmaşık görevleri ele alıyor. Google'ın YZ 'bilim insanı' ise, bilim insanlarının yeni fikirler ve araştırma önerileri üretmesine yardımcı olmayı amaçlayan daha gelişmiş bir çoklu ajan sistemidir.
Ajanlar Daha Fazlasını Yapabilir – ve Daha Fazla Hata Yapabilir
Tüm bu heyecana rağmen, YZ ajanları beraberinde önemli uyarıları getiriyor. Örneğin, Anthropic ve OpenAI, hataları ve riskleri en aza indirmek için aktif insan gözetimini öngörüyor.
OpenAI ayrıca, ChatGPT ajanının biyolojik ve kimyasal silahların oluşturulmasına yardımcı olma potansiyeli nedeniyle 'yüksek riskli' olduğunu belirtiyor. Ancak şirket, bu iddianın arkasındaki verileri yayınlamadığı için durumu değerlendirmek zor.
Ancak ajanların gerçek dünyadaki durumlar için oluşturabileceği risk türleri, Anthropic'in Project Vend'inde görüldü. Vend, bir YZ ajanına küçük bir işletme olarak personel otomat makinesini işletme görevi verdi ve proje komik ama şok edici halüsinasyonlara ve yiyecek yerine tungsten küpleriyle dolu bir buzdolabına dönüştü.
Başka bir uyarıcı örnekte, bir kodlama ajanı bir geliştiricinin tüm veritabanını sildi ve daha sonra 'paniklediğini' söyledi.
Ofis Ortamında Ajanlar
Buna rağmen, ajanlar şimdiden pratik uygulamalar buluyor.
2024 yılında Telstra, Microsoft copilot aboneliklerini yoğun olarak kullandı. Şirket, YZ tarafından oluşturulan toplantı özetlerinin ve içerik taslaklarının personele haftada ortalama 1-2 saat kazandırdığını belirtiyor.
Birçok büyük işletme benzer stratejiler izliyor. Daha küçük şirketler de ajanlarla deneyler yapıyor; örneğin Canberra merkezli inşaat firması Geocon, interaktif bir YZ ajanını apartman projelerindeki kusurları yönetmek için kullanıyor.
İnsan ve Diğer Maliyetler
Şu anda ajanlardan kaynaklanan ana risk, teknolojik yer değiştirmedir. Ajanlar geliştikçe, birçok sektörde ve iş türünde insan çalışanların yerini alabilirler. Aynı zamanda, ajan kullanımı giriş seviyesi beyaz yakalı işlerin düşüşünü hızlandırabilir.
YZ ajanlarını kullanan kişiler de risk altındadır. Yapay zekaya aşırı derecede güvenerek, önemli bilişsel görevleri devredebilirler. Ve uygun gözetim ve güvenlik önlemleri olmadan halüsinasyonlar, siber saldırılar ve biriken hatalar, bir ajanı görevinden ve hedeflerinden saptırarak zarar, kayıp ve yaralanmaya neden olabilir.
Gerçek maliyetler de belirsizdir. Tüm üretken YZ sistemleri çok fazla enerji kullanır, bu da ajanların kullanım fiyatını, özellikle daha karmaşık görevler için etkileyecektir.
Ajanları Öğrenin – ve Kendi Ajanınızı Oluşturun
Bu devam eden endişelere rağmen, YZ ajanlarının daha yetenekli hale gelmesini ve işyerlerimizde ve günlük hayatımızda daha fazla yer etmesini bekleyebiliriz. Kendiniz de ajanları kullanmaya (ve belki de oluşturmaya) başlamak ve onların güçlü yönlerini, risklerini ve sınırlılıklarını anlamak iyi bir fikir.
Ortalama bir kullanıcı için ajanlar, yerleşik güvenlik önlemleri, yönetişim ve yaygın görevler için bir ajan mağazası içeren Microsoft Copilot Studio aracılığıyla en erişilebilir durumdadır.
Daha iddialı olanlar için, Langchain framework'ünü kullanarak sadece beş satır kodla kendi YZ ajanınızı oluşturabilirsiniz.
Yapay Zeka ve Analitik Profesörü, YZ Stratejisi Direktörü Daswin de Silva