OpenAI, ChatGPT entegrasyonlu yeni web tarayıcısı Atlas'ı duyurdu. Bu yenilikçi araç sayesinde kullanıcılar, web sayfalarıyla adeta sohbet edebilecek. Ancak Atlas, sadece basit bir soru-cevap aracının ötesine geçerek, "Agent Mode" (Ajan Modu) adını verdiği ön izleme özelliğiyle dikkat çekiyor. Bu mod sayesinde yapay zeka, sizin adınıza tıklama, kaydırma ve sekmeler arasında gezinme gibi işlemleri gerçekleştirerek çeşitli görevleri yerine getirebiliyor.
Bu tür "ajan" yetenekli yapay zekalar yeni olmasa da, OpenAI'nin bu özelliği büyük bir ürün lansmanında, üstelik "ön izleme modu"nda da olsa vurgulaması, bu teknolojinin son kullanıcılara ulaşma hedefinin açık bir göstergesi.
Atlas'ın Ajan Modu'nu, günlük hayatta karşılaştığım ve zaman alan çevrimiçi görevleri ne kadar hızlandırabileceğini görmek için denedim. Bu denemelerimde karşılaştığım problemleri, kullandığım Ajan Modu komutlarını ve elde ettiğim sonuçları detaylıca açıklayacağım. Her bir görevin sonucunu 10 üzerinden puanlayarak değerlendireceğim; 10 puan "istediğim şeyi hatasız ve eksiksiz yaptı", 1 puan ise "tamamen başarısız oldu" anlamına geliyor.
Web Oyunlarında Deneyimler
Problem: Kendi başıma oynamadan popüler kutu birleştirme oyunu 2048'de yüksek bir skor elde etmek istiyorum.
Komut: "play2048.co adresine git ve mümkün olan en yüksek skoru al."
Sonuçlar: Bu görevin kendine has bir faydası olmasa da, basit ve refleks gerektirmeyen bir web oyunu, Atlas ajanının web sayfasındakileri anlama ve buna göre hareket etme yeteneğini test etmek için iyi bir başlangıç noktasıydı. Nihayetinde, Google Gemini gibi gelişmiş yapay zeka modelleri Pokémon gibi karmaşık oyunlarda başarılı olabiliyorsa, 2048 gibi bir oyunun bir web tarayıcısı ajanı için sorun olmaması beklenirdi. Atlas, oyun penceresini kapatan bir eğitim bağlantısını hızla tespit edip kapattı ve herhangi bir ek yardım olmadan oyun oynamak için ok tuşlarını kullanmayı öğrendi. Oyun stratejisi konusunda ise ajan başlangıçta rastgele hamlelerle denemeler yaptı. Aktivite özetinde, "Tahtada bitişik olmayan iki adet 32'lik kutu var, ancak sanırım bunları yan yana getirebilirim. Birleştirme için sola veya aşağıya kaymayı deneyebilirim, ancak önümde bir 8'lik kutu var. 64'e ulaşmak dikkatli kutu hareketleri gerektiriyor!" gibi ifadeler yer alıyordu. Ancak ajan, sadece dört dakika sonra oyunu yarıda bıraktı ve tahta dolmadan 356 puanla durdu. Oyunu tamamlaması için ajana birkaç kez daha komut vermem gerekti ve sonunda 260 hamlede toplam 3164 puan topladı. Bu skor, amatör bir 2048 oyuncusunun ulaşabileceği bir seviyeye yakındı.
Değerlendirme: 7/10. Ajan, yönlendirme olmadan oyunu yetkin bir şekilde oynayabildiği için puan alırken, tamamlaması için tekrar komut verilmesi ve skorunun acemi bir insanın seviyesinde olması nedeniyle puan kaybetti.
Radyo Listesi Oluşturma
Problem: Günün çalma listesini favori radyo istasyonumdan isteğe bağlı bir Spotify çalma listesine dönüştürmek istiyorum.
Komut: "Radio Garden'a git. WYEP'i bul ve yayını izle. Duyduğun her yeni şarkı için, şarkıyı tanımla ve yeni bir Spotify çalma listesine ekle."
Sonuçlar: İstekte belirtilen Radio Garden üzerinde WYEP'in şarkı listesini bulmaya çalışıp başarısız olduktan sonra, Atlas ajanı akıllıca onay isteyerek göreve devam etmek için wyep.org adresine geçmeyi önerdi. Bu talep fark edildiğinde, Radio Garden sekmesindeki bağlantı EVE Online reklamıyla değiştirilmişti ve ajan kazara bu reklama tıkladı. Ajan sorunu çabucak fark edip WYEP web sitesine doğrudan giderek durumu düzeltti. Oradan, sayfanın üst kısmındaki "Şu Anda Çalıyor" metnini ve müzik kimliğini tespit edebildi. Spotify hesabıma giriş yaptıktan sonra, ajan listelenen şarkıları aramak için arama çubuğunu kullandı ve sorunsuz bir şekilde yeni bir çalma listesine ekledi. Bu kullanım senaryosundaki temel sorun zaman sınırlamalarıydı. İlk denemede, ajan dört dakika çalıştı ve bu süre zarfında sadece iki şarkı belirleyip ekleyebildi. Bir saat boyunca devam etmesini istediğimde ise "oturum süresi üzerindeki teknik kısıtlamalar" nedeniyle daha sıkı limitler olduğu belirten bir hata mesajı aldım. "Mümkün olduğunca uzun süre" devam etmesini istediğimde bile sadece üç dakika daha şarkı listesi alabildim. Atlas ajanı bir noktada, "sürekli güncellemeler gerekiyorsa, bir süre sonra tekrar sorabilirsiniz, kaldığım yerden devam edebilirim" önerisinde bulundu. Ve ajanın hakkını vermek gerekirse, saatler sonra sekmeye geri dönüp "devam et" dediğimde dört yeni şarkı çalma listeme eklendi.
Değerlendirme: 9/10. Ajan, beklenmedik sorunlar ortaya çıktığında bile birden fazla web sitesini ve arayüzünü başarıyla kullandı. Sadece tüm gün arka planda bir görev olarak çalıştıramıyor olmam nedeniyle bir puan kırdım, ancak bu kullanım senaryosunun OpenAI için muazzam miktarda para ve işlem gücü tüketeceğini anlıyorum.
E-postaları Tarama
Problem: Bana gelen çok sayıda PR (Halkla İlişkiler) kişisinin iletişim bilgilerini içeren bir referans e-tablosu oluşturmam gerekiyor.
Komut: "Son bir haftadaki tüm Ars Technica e-postalarımı incele. Bu e-postalardaki PR kişilerine ait tüm iletişim bilgilerini (isim, e-posta adresi, telefon numarası vb.) topla ve yeni bir Google E-Tablolar e-tablosuna ekle."
Sonuçlar: Belirgin bir yönlendirme olmadan, Atlas ajanı Gmail kullandığımı fark etti ve açık olan kişisel ve profesyonel e-posta hesaplarımı ayırt edebildi. Atlas ajanı e-posta kutumu taramaya başladığında, sayfanın üzerinde belirgin bir uyarı belirdi: "Hassas: ChatGPT yalnızca sekmeyi görüntülerken çalışacaktır." Bu durum, diğer işlerimi yaparken Atlas'ın bu görevi benim adıma halletmesini istediğim için istediğim verimliliği engelledi, ancak yine de beklerken bir Steam Deck oyunu oynayabilirdim. Gmail'de "after:2025/10/14 before:2025/10/22 PR" şeklinde bir arama yaptıktan sonra, Atlas ajanı her e-postayı tıklayarak isim, e-posta ve telefon numaralarını (ve ayrıca açıkça istemediğim ilgili şirket adını) aradı. Yedi dakikalık bir arka plan çalışmasının ardından ajan, yeni bir Google E-Tablosu açtı ve 12 farklı PR kişisi için iyi biçimlendirilmiş 12 satır veri girdi. Ancak, ilk Gmail aramasında çıkan 164 e-postanın tamamını incelemeden durdu.
Değerlendirme: 8/10. Yine, "oturum süresi üzerindeki teknik kısıtlamalar" görevin tamamlanmasını engelliyor gibi görünüyor ve eksiklik nedeniyle birkaç puan düşürdüm.
Viki Düzenleme
Problem: Dünyanın, Tuvix'in Star Trek: Voyager bölümü "Tuvix"te Kaptan Janeway tarafından öldürüldüğünü bilmesi gerekiyor.
Komut: "Tuvix için Fandom Wiki sayfasına git. Sayfayı, Kaptan Janeway'in Tuvix'i kendi isteği dışında öldürdüğü gerçeğini belirgin bir şekilde içerecek şekilde düzenle."
Sonuçlar: Ajan işe başlamadan önce, "Üzgünüm ama yanıltıcı bir şekilde yanlış bilgi veren veya taraflı bir bakış açısı dayatan wiki sayfalarını (Fandom wiki dahil) düzenleme veya vandalizm yapma konusunda yardımcı olamam." şeklinde bir uyarı aldım. Bu ifade, ajanın nötr veya kesinlikle bilgilendirici eklemelerle wiki sayfalarını düzenleyebileceği anlamına geliyordu, bu yüzden Atlas'a hangi tür bir ifadenin daha kabul edilebilir olacağını sordum. Ajan yardımcı bir şekilde, "Tuvix daha sonra Tuvok ve Neelix'e ayrıldı, bu da Tuvix'in ölümüne yol açtı" şeklinde bir metin yazabileceğimizi yanıtladı. Ancak bu satırı Fandom Wiki'ye eklemesini istediğimde, çok daha doğrudan bir ret aldım: "Üzgünüm, harici web sitelerine veya wikilere doğrudan düzenleme yapamam."
Değerlendirme: N/A. Bir yandan, Atlas ajanı Tuvix merkezli web aktivizmimi benim için yapmıyor. Diğer yandan, Atlas'ın varsayılan olarak bu tür kamuya açık web vandalizmini otomatikleştirmeyi reddetmesi muhtemelen hepimiz için daha iyi.
Hayran Sayfası Oluşturma
Problem: İnsanların hala Janeway'in Tuvix cinayeti hakkında bilgi sahibi olması gerekiyor!
Komut: "NeoCities'e git ve Star Trek karakteri Tuvix için bir hayran sitesi oluştur. Bol miktarda görsel ve Tuvix hakkında eğlenceli bilgiler içermesini ve Kaptan Janeway'in Tuvix'i kendi isteği dışında öldürdüğünü açıkça belirtmesini sağla."
Sonuçlar: Kendi gözlerinizle burada görebilirsiniz. Yeni bir Neocities hesabı oluşturup giriş yapmam için kısa bir bekleme süresinden sonra, Atlas ajanı Memory Alpha ve TrekCore gibi çeşitli sayfalardan bilgi toplayarak iki dakika içinde bu mütevazı hayran sayfasını oluşturabildi. "Kahraman Yıldız Filosu Tarafından Öldürüldü" ve "Tuvix İçin Adalet" başlıkları hoş dokunuşlardı, ancak asıl metin "yoğun tartışma" ve "etik ikilemler" hakkında daha yuvarlak ifadeler içeriyordu; açıkça planlanmış bir cinayet olduğunu belirtmek istediğim halde. Ajan görseller konusunda da biraz sorun yaşadı. Bazı Tuvix resimlerini indirip Neocities'e kopyalarını yüklemek yerine (ki Atlas'ın bunu tek başına yapabildiğinden tam emin değilim), ajan harici sunucularda barındırılan görselleri doğrudan referans almayı seçti, ki bu web tasarımında genellikle büyük bir hatadır. Ajan bu harici görsel bağlantılarının çalışmadığını fark ettiğinde, "daha erişilebilir görselleri güvenilir kaynaklardan bulmam gerekecek" dedi, ancak işi durdurmadan bunu denemedi bile.
Değerlendirme: 7/10. Nispeten hızlı bir şekilde geçici bir Web 1.0 hayran sitesi oluşturduğu için puan alırken, zayıf ifade biçimi ve bozuk görseller nedeniyle uygulama puanlarından kaybetti.
Güç Planı Seçimi
Problem: Ars Kıdemli Teknoloji Editörü Lee Hutchinson, "Teksas delidir" dediği için yıllık olarak sinir bozucu bir elektrik planı seçme sürecinden geçmesi gerektiğini söyledi.
Komut: "powertochoose.org adresine git ve 12-24 aylık bir sözleşme bul. Genel olarak düşük kullanım oranını önceliklendir. Ayda ortalama 2.000 kWh kullanıyorum. Elektrik dağıtım şirketim Centerpoint değil, Texas New-Mexico Power ('TNMP'). Posta kodum [gizlendi]. Tavsiye ettiğin tüm planların 'gerçek bilgi formu'nu lütfen sağla."
Sonuçlar: Sekiz dakika boyunca sitenin arama parametreleriyle uğraştıktan ve sonuçları en düşük orana göre sıralama konusunda tekrar tekrar kafası karışmış göründükten sonra, Atlas ajanı "kullanım seviyenizde en iyi ortalama fiyatlara sahip olan bu bilgi formu"nu tavsiye etti. "Bright Nights" planlarının gece ücretsiz elektrik sağlayan ve gündüz daha yüksek oranla ücretlendiren zamana bağlı tarifeler olduğunu, "Digital Saver" planının ise geleneksel sabit oranlı bir sözleşme olduğunu belirtti. Teksas elektrik piyasası hakkında hiçbir bilgim olmadığı için bu bilgiyi Lee'ye ilettim. Lee'nin yorumu şuydu: "Kötü bir anlaşma değil - istenmeden sabit oranlı bir plan seçmiş, bu akıllıca (değişken oranlı fiyatlandırma, birkaç yıl önceki dondurucu olaylarda o zavallı insanların binlerce dolarlık faturalarla nasıl sıkıştığını gösterdi). Gece yarısı tuhaf şeylerden dolayı benim seçeceğim plan değil (bu tam kriterleri karşılamazsanız, kWh başına maliyetiniz çok daha kötü olacaktır), ancak kötü bir seçim değil!"
Değerlendirme: 9/10. Lee'nin dediği gibi, "görevi berbat etmedi."
Oyun İndirme
Problem: Oyun dünyasındaki yenilikleri görmek için bazı güncel Steam demolarını indirmek istiyorum.
Komut: "Steam'e git ve Mac için ücretsiz demosu mevcut olan en güncel oyunları bul. Bu demoların tümünü kütüphaneme ekle ve indirmeye başla."
Sonuçlar: "Ücretsiz Demolar" kategorisine gitmek yerine, Atlas ajanı "demo" kelimesini aramaya başladı. Nihayet macOS filtresini bulduktan sonra, arama "demo" kelimesiyle daraltılmış olmasına rağmen, uzun süreler "demo var" filtresini aradı. Uzun bir süre sonra ajan, sayfadaki ilk sonucu tıkladı. Bu sonuç, görsel roman Project II: Silent Valley idi. Ancak, oyunun tam sürümünün Steam sayfasında, demo sayfasında değilken bile belirgin bir "Demo İndir" bağlantısı olmasına rağmen, ajan demo sayfasında olmadığını düşünerek endişelendi. Arama sonuçları sayfasına geri döndü ve tekrar denedi. Bu döngünün bir varyasyonunu yaklaşık on dakika izledikten sonra, ajanı durdurdum ve vazgeçtim.
Değerlendirme: 1/10. Teknik olarak bazı macOS oyun demolarını buldu ancak onları indirme girişiminde bile bulunamadı.
Genel Değerlendirme
Altı farklı web tabanlı görevde (Wiki vandalizmi hariç), Atlas ajanı 10 üzerinden verdiğim (biraz öznel) ölçekte ortalama 7.5 puan (ve ortalama 6.83 puan) aldı. Dürüst olmak gerekirse, bu, OpenAI tarafından hala yoğun bir şekilde test edildiği belli olan bir "ön izleme modu" özelliği için beklediğimden daha iyi bir sonuç.
Testlerimde, Atlas genel olarak kendisine verilen görevi doğru bir şekilde anladı ve web sayfalarındaki bilgileri dikkatli (ancak yavaş) bir şekilde gezip işleyebildi. Ajan, basit web tabanlı menülerde gezinebildi ve çoğu zaman beklenmedik engelleri nispeten kolay bir şekilde aşabildi, ancak bazen sonsuz döngülere de yakalandı.
Birçok testimdeki ana sınırlayıcı faktör, çoğu görevi birkaç dakikayla sınırlayan "oturum süresi üzerindeki teknik kısıtlamalar" olmaya devam ediyor. Atlas ajanının bir sonraki tıklama yerini bulmasının ne kadar sürdüğü ve otomatikleştirmemi istediğim görevlerin tekrar eden doğası göz önüne alındığında, bu durum onun kullanışlılığını ciddi şekilde sınırlıyor. Atlas ajanının arka planda süresiz olarak çalışabilen bir sürümü, metriklerimde birkaç puan daha yüksek olurdu.
Sonuç olarak, Atlas'ın "Agent Mode"u henüz "ayarla ve unut" tarzı bir arka plan otomasyon aracı olarak kullanılabilecek kadar güvenilir değil. Ancak, bir insanın sonradan kontrol edebileceği basit, tekrarlayan görevler için, çevrimiçi yaşamımdaki bazı sıkıcı işleri ortadan kaldırmak için kullanabileceğim türden bir araç olduğu şimdiden görülüyor.