Yapay zeka destekli arama motoru girişimi Perplexity, web sitelerinin erişimini engellemek için konulan kısıtlamaları atlayarak verileri topladığı iddialarıyla gündeme bomba gibi düştü. Yapılan bir rapora göre, Perplexity'nin bu tür koruma mekanizmalarını atlatmak için kendi kimliğini gizlediği ve sözleşme dışı yöntemler kullandığı öne sürülüyor. Bu iddialara göre Perplexity, bir web sitesinin hangi bölümlerine erişilmemesi gerektiğini belirten 'robots.txt' gibi dosyalardan kaçınmak için kullanıcı kimliğini maskelediği ve yakalanmamak için farklı hizmet sağlayıcıları kullandığı belirtiliyor.
Perplexity, Site Kısıtlamalarını Atlamak ve Korunan İçerikleri Toplamak İçin İzini Gizlemekle Suçlanıyor
Bu suçlamalar, bir gizli web sayfası oluşturularak ve bu sayfaya erişim kısıtlamaları uygulanarak yapılan kapsamlı bir inceleme sonrasında ortaya çıktı. Bu sayfanın dışarıdan bağlantısı olmadığı ve arama motorları tarafından indekslenmediği halde, Perplexity sistemlerinin bu sayfaya erişmeyi başardığı ve hatta içeriğini arama sonuçlarına dahil ettiği belirtiliyor. Bu durum, şirketin veri toplama yöntemlerindeki yetkisizliği doğruluyor.
Bu eylemlerin hizmet şartlarının ihlali ve etik dışı olduğu vurgulanıyor. Yapay zeka girişimi, doğrulanmış botlar listesinden çıkarıldı ve genel erişim kısıtlamalarını sıkılaştırmayı planlanıyor. Öte yandan Perplexity ise bu iddiaları tamamen reddederek, söz konusu incelemenin şeffaflığı göz ardı ettiğini ve yeterli kanıta sahip olmadığını savunuyor. Hatta bulguların abartıldığını veya durumun yanlış okunduğunu ileri sürüyor.
Bu olay, dijital sınırlar konusunda Perplexity'yi sert bir dille eleştiren Cloudflare'in kararlı tutumu nedeniyle oldukça ciddi bir boyut kazanıyor. Yapay zeka şirketi için bu durum, geleneksel arama motorlarına kıyasla şeffaf olma imajını zedeleyebilir. Her iki durumda da bu olay, gelecekte daha da yaygınlaşabilecek büyük bir sorunu gözler önüne seriyor: içeriklere erişim ve bu içeriğin paraya dönüştürülmesi arasındaki mücadele.
Yaşananlar, aynı zamanda yapay zeka ekosistemindeki daha geniş bir tartışmayı da aydınlatıyor. Yapay zeka modellerinin verilerini nasıl kaynakladığı ve sistemler daha güçlü ve ticarileştikçe ortaya çıkan gri uygulamalarla ilgili bir durum söz konusu. Bu modellerin içerik üreticileri ve yayıncılar için oluşturduğu riskler konusunda çeşitli açıklamalarda bulunan yetkililer, yapay zeka şirketlerinden içerik erişimi için ücret talep etme ve yapay zeka tarayıcılarını otomatik olarak engelleme gibi seçenekleri hayata geçiriyor.