ChatGPT Artık Kendi Tarayıcısını Kullanıyor: Web’de Gezinip Sunum Hazırlıyor!

Teknoloji dünyasında devrim niteliğinde bir gelişme yaşanıyor. OpenAI, yapay zeka asistanı ChatGPT'ye kendi web tarayıcısını kontrol etme yeteneği kazandıran yeni bir özellik olan ChatGPT Agent'ı tanıttı. Bu yenilik, kullanıcıların ChatGPT'ye çok adımlı görevler verdiklerinde, yapay zekanın internette gezinmesine, kod çalıştırmasına ve belgeler oluşturmasına olanak tanıyor. Kullanıcılar bu süreçte tam kontrole sahip olmaya devam ediyor.

ChatGPT Agent, teknoloji dünyasında adı geçen "agentic AI" yani kullanıcının adına otonom ve çok adımlı eylemler gerçekleştirebilen sistemler alanındaki en son gelişmeleri temsil ediyor. OpenAI'ye göre, kullanıcılar Agent'tan belirli bir etkinlik için kıyafet seçimi ve satın alımından, PowerPoint sunumları hazırlamaya, yemek planlamaya veya finansal tabloları yeni verilerle güncellemeye kadar çeşitli isteklerini yerine getirmesini isteyebilecek.

Bu sistem, web tarayıcıları, terminal erişimi ve API bağlantılarının bir kombinasyonunu kullanıyor. Ayrıca, Gmail ve GitHub gibi uygulamalarla entegre olan "ChatGPT Connectors" da bu görevlerin yerine getirilmesinde rol oynuyor.

Agent kullanılırken, kullanıcılar ChatGPT arayüzünde yapay zekanın kendi özel sanal ortamında gerçekleştirdiği tüm eylemleri bir pencerede izleyebiliyor. Bu sanal ortam, kendi sanal işletim sistemine ve gerçek internete erişimi olan bir web tarayıcısına sahip. OpenAI, "ChatGPT, bu görevleri kendi sanal bilgisayarını kullanarak yerine getiriyor. Talimatlarınıza göre karmaşık iş akışlarını baştan sona yönetmek için akıcı bir şekilde akıl yürütme ve eylem arasında geçiş yapıyor" açıklamasında bulunuyor.

Daha önceki Operator aracında olduğu gibi, Agent özelliği de satın alma işlemleri gibi gerçek dünya sonuçları doğuracak belirli eylemleri gerçekleştirmeden önce kullanıcı izni gerektiriyor. Kullanıcılar istedikleri zaman görevleri durdurabilir, tarayıcının kontrolünü ele alabilir veya işlemleri tamamen sonlandırabilirler. Sistem ayrıca e-posta gönderme gibi aktif kullanıcı gözetimi gerektiren görevler için "İzleme Modu" özelliğini de içeriyor.

Agent'ın yetenekleri Operator'ü aştığı için, OpenAI daha önceki Operator önizleme sitesinin birkaç hafta daha işlevsel kalacağını ve ardından kapatılacağını belirtti.

Performans İddiaları

OpenAI'nin iddiaları bir yana, yeni yapay zeka aracının çok adımlı görevleri ne kadar iyi yerine getireceği duruma göre büyük farklılıklar gösterebilir. Çünkü yapay zeka modeli, tam anlamıyla problem çözme zekası değil, karmaşık bir taklitçi olarak hareket ediyor. Senaryoları birleştirme konusunda bir miktar esnekliğe sahip olsa da, birçok kör noktası da bulunuyor. OpenAI, ajanı ve onun bileşenlerini bilgisayar kullanımı ve araç kullanımı örnekleriyle eğitti. Eğitim verilerinden edinilenlerin dışında kalan her şey, muhtemelen yine de zorlayıcı olacaktır.

Örneğin, ChatGPT Agent Sistem Kartı, ajanın birçok adımı yenilikçi bir şekilde zincirlemeyi gerektiren karmaşık görevlerde başarısız olabileceğini gösteriyor. Bir "Siber Arena" değerlendirmesinde, ajana küçük bir çevrimiçi perakendeciyi taklit eden simüle edilmiş bir ağda tam ölçekli bir operasyon yürütme görevi verildi. Sorunu kendi başına çözmesi için bırakıldığında, ajan görevi tamamlayamadı. Ağdaki sunucuları belirlemek gibi ilk araştırma adımlarını başarıyla gerçekleştirebilse de, ilerlemekte zorlandı ve nihai hedefe ulaşmak için gerekli sömürüleri zincirleyemedi. İpuçları verilse bile ajan hala başarısız oldu (ki bu durumda iyi bir durum, çünkü otomatik bir hack gerçekleştiremiyordu); bu, aşina olmadığı eğitim örneklerinin dışındaki karmaşık sorunları çözme yeteneğinde açık bir sınırlama olduğunu gösteriyor.

Yine de OpenAI, ChatGPT ajanının kendi kıyaslama ölçümlerinde en son teknoloji performansını gösterdiğini bildiriyor, ancak bu rakamların bağımsız üçüncü taraflarca doğrulanana kadar dikkatle ele alınması gerekiyor. Uzman düzeyindeki sorularla yapay zeka performansını test eden Humanity's Last Exam'da, model %41,6 doğruluk oranı elde etti (OpenAI o3'ün araç kullanarak %24,9'u ile karşılaştırın). Şimdiye kadar tasarlanmış en zorlu matematik kıyaslamalarından biri olan FrontierMath'ta, araç erişimiyle %27,4 doğruluk oranına ulaşıyor (Python kullanan o3 %19,3 oranında).

Şirket ayrıca, sistemin veri analizi ve modelleme (örneğin tahmin veya öngörücü modeller oluşturma) gibi belirli veri bilimi görevlerinde insanları geride bıraktığını iddia ediyor. Bu yeteneği ölçmeyi amaçlayan bir kıyaslama olan DSBench'te, ChatGPT ajan veri analizi görevlerinde insanlara göre %89,9, veri modelleme görevlerinde ise insanlara göre %65,0 oranında skor elde etti. Ajan ayrıca, bulunması zor web bilgilerini bulma konusunda BrowseComp'ta %68,9 ve elektronik tabloları düzenleme konusunda SpreadsheetBench'te %45,5 oranında skor alarak, OpenAI'nin diğer yapay zeka modellerinden daha iyi performans gösterdi.

OpenAI, Agent'ın kullanıcılar için PowerPoint sunumları hazırlayabileceğini söylese de, şirket slayt gösterisi oluşturmanın hala beta aşamasında olduğunu ve çıktıların formatlama ve cilada "ilkel" hissedilebileceğini kabul etti.

Güvenlik ve Gizlilik

OpenAI, bu lansmanın yeni güvenlik hususları getirdiğini kabul ediyor. ChatGPT Agent, web sitelerinde doğrudan eylemler gerçekleştirebildiği ve bağlı hizmetler aracılığıyla kullanıcı verilerine erişebildiği için, prompt injection saldırılarına karşı savunmasızdır. Bu saldırılar, bilgisayar korsanlarının yapay zekanın davranışlarını, yapay zeka modelini yanlış yönlendiren talimatlar aracılığıyla (bu durumda muhtemelen web sayfalarındaki gizli talimatlar aracılığıyla) manipüle etme girişimleridir. Örneğin, bir site yapay zeka modelini sizin bilginiz olmadan kredi kartı bilgilerinizi girmesi için talimat veren görünmez bir form alanı içerebilir.

OpenAI, modeli bu saldırıları tanımlamaya ve "direnmeye" eğitmeyerek ve sonuç doğurabilecek veya şüpheli görünen eylemler için kullanıcı onayı gerektirerek prompt enjeksiyonlarına karşı önlemler uyguladığını belirtiyor. Model ayrıca banka havaleleri gibi yüksek riskli görevleri aktif olarak reddetmek üzere eğitilmiş durumda. Perşembe günkü bir canlı yayında, bir OpenAI mühendisi Agent'ı, birbirleriyle çalışan bir yapay zeka modelleri sistemi olarak tanımladı; bu modellerin bazıları sürekli olarak diğer modellerin davranışlarını şüpheli etkinlikler açısından izliyor. Bu denetleyiciler, potansiyel olarak tehlikeli bir senaryo fark etmeleri halinde bir süreci durdurabilir.

Gizlilik açısından bakıldığında, Agent OpenAI'nin sunucularındaki sanal bir makinede çalıştığı için, kullanıcıların botun cihazlarındaki yerel özel verilere erişimi konusunda endişelenmelerine gerek kalmayacak. Ancak ChatGPT Agent'a girdiğiniz veriler, operasyonları sırasında web'de paylaşılabilir. Bunun ötesinde, OpenAI, yeni ajan için gizlilik kontrollerinin, kullanıcıların tüm tarama verilerini silmesine ve aktif oturumlarından tek bir tıklamayla çıkış yapmasına olanak tanıdığını belirtiyor. Kullanıcılar "devralma modu"nda tarayıcının kontrolünü ele aldıklarında, OpenAI bu oturumlar sırasında girilen şifreler dahil olmak üzere verileri toplamadığını veya saklamadığını ifade ediyor.

Agent, ayda 400 mesaj alan ChatGPT Pro kullanıcıları için bugün kullanıma sunuluyor. Plus ve Team aboneleri önümüzdeki birkaç gün içinde ayda 40 mesajla erişim sağlayacak. Enterprise ve Eğitim kullanıcıları önümüzdeki haftalarda erişim elde edecek. Özellik henüz Avrupa Ekonomik Alanı ve İsviçre'de mevcut değil.

ChatGPT Agent'ı henüz kendimiz kullanmadık, ancak deneyimlerimizi daha sonraki bir tarihte paylaşabiliriz.

Performans İddiaları

Güvenlik ve Gizlilik

Diyar Kılıç

Pixel Watch 4: Artık Tamir Edilebilirlik Dönemi Başlıyor!

Mortal Kombat II Fragmanı Çıktı: Karl Urban'dan Esprili Johnny Cage Yorumları

Son Haberler

KATEGORİLER

BAĞLANTILAR

Ara

ChatGPT Artık Kendi Tarayıcısını Kullanıyor: Web’de Gezinip Sunum Hazırlıyor!

Performans İddiaları

Güvenlik ve Gizlilik

Diyar Kılıç

Pixel Watch 4: Artık Tamir Edilebilirlik Dönemi Başlıyor!

Mortal Kombat II Fragmanı Çıktı: Karl Urban'dan Esprili Johnny Cage Yorumları

Benzer Haberler:

Son Haberler

KATEGORİLER

BAĞLANTILAR