Yapay zeka alanının öncülerinden OpenAI, The New York Times'ın ChatGPT kayıtlarına erişim talebiyle ilgili mahkemede savunmasının son aşamasına hazırlanıyor. Times gazetesi, telif hakkı ihlali oluşturabilecek çıktıları tespit etmek amacıyla milyonlarca ChatGPT oturum kaydını inceleyerek davada en güçlü kanıtları toplamak istiyor.
Perşembe günü yapılan ortak bir başvuruyla taraflar, 7 Ağustos'ta gizli bir uzlaşma konferansı düzenlenmesini talep etti. Bu konferansın amacının davayı karara bağlamak değil, davanın en tartışmalı noktalarından biri olan haber kuruluşlarının milyonlarca ChatGPT kaydını incelemesi meselesini çözmek olduğu doğrulandı.
Bu durum, ChatGPT kullanıcılarının özel sohbetlerinin davada incelenip incelenmeyeceği konusunda bu hafta daha net bir anlayışa sahip olabileceği anlamına geliyor. Bu esnada OpenAI, The New York Times'ın daha geniş erişim talebini engellemek amacıyla silinen sohbetleri aranabilir hale getirmek için gereken "oldukça karmaşık" süreci ayrıntılı olarak açıkladı.
Daha önce OpenAI, The New York Times'ın ChatGPT kullanıcılarının "kitlesel gözetim" yapma girişimini durdurma sözü vermişti. Ancak sonuç olarak OpenAI, haber davacılarını tüm ChatGPT kayıtlarından uzak tutma mücadelesini kaybetti.
Bu yenilginin ardından OpenAI, müşterilerinin ciddi gizlilik endişeleri taşıdığı bir dönemde, uzlaşmaya yanaşmadan incelenen kayıt sayısını sınırlamak için elinden geleni yapıyor gibi görünüyor. En savunmasız kullanıcılar için dava, OpenAI'nin daha önce silineceğini vaat ettiği hassas sohbetlerden alınan ChatGPT çıktılarını ortaya çıkarma tehdidini taşıyordu.
En son olarak OpenAI bir uzlaşma teklifinde bulundu ve haber kuruluşlarının tüm ChatGPT kayıtlarını incelemesine gerek olmadığını belirterek mahkemenin onayını istedi. Yapay zeka şirketi, istatistiksel olarak anlamlı ve uygun bir örneklem boyutu konusunda bugüne kadar görüş bildiren "tek uzman" olarak bilgisayar bilimleri araştırmacısı Taylor Berg-Kirkpatrick'i gösterdi. Berg-Kirkpatrick, ChatGPT kullanıcılarının makaleleri tekrarlamak ve haber sitelerinin ödeme duvarlarını aşmak için sohbet botunu ne sıklıkla kullandığını belirlemek için 20 milyon kaydın yeterli olacağını öne sürdü.
Ancak OpenAI'nin dün yaptığı bir başvuruda belirttiğine göre, The New York Times ve diğer haber kuruluşları bu uzlaşmayı reddetti. Bunun yerine, haber davacılarının OpenAI'den "120 milyon ChatGPT tüketici konuşmasının bireysel günlük dosyalarını üretmesini" talep ettiği belirtildi.
OpenAI, bu miktarın Berg-Kirkpatrick'in önerdiğinin altı katı olduğunu savundu. Talebe uyulmasının, davanın sonucunu "aylarca" geciktirerek "kullanıcı gizliliği endişelerinin kapsamını artırma" tehdidini taşıdığını belirtti. Talep kabul edilirse, kullanıcıların silinen sohbetlerinin saklanma süresinin uzamasına ve potansiyel olarak bir ihlal veya sızıntıya karşı savunmasız hale gelmesine neden olarak birçok kullanıcıyı endişelendireceği düşünülüyor.
Müzakereler bu hafta sona ererken, OpenAI'nin birlikte yargılanan tarafı Microsoft, NYT'nin dahili ChatGPT eşdeğeri aracıyla ilgili kendi mücadelesini başlattı ve bu durum The New York Times'ı ChatGPT kayıtları konusundaki anlaşmazlıkları uzlaşmaya itebilir.
Silinen Sohbetleri Aranabilir Hale Getirmenin Maliyeti OpenAI'yi Zorluyor
The New York Times'a göre, 120 milyon ChatGPT kullanıcısının sohbetlerini incelemek gerekiyor. Haber davacıları, sadece ihlal içeren çıktıların sık sık meydana geldiğini kanıtlamakla kalmayıp, aynı zamanda ihlalde ani artışlar gösteren kalıpları da belgelemek istiyor.
OpenAI'nin açıkladığına göre, The New York Times ve diğer haber davacıları "ürünün zamanla nasıl değiştiğini değerlendirebilmek için, ilgili 23 aylık dönemdeki her ay için tam ölçekli bir analiz yapmaya hakları olduğunu ısrarla belirtiyorlar - bu yükümlülüğe rağmen."
OpenAI, The New York Times'ın "tekrar etmenin yaygınlığının zamanla nasıl değiştiğine" dair kanıt aramasının doğru olmadığını savundu. Bu tür "olağanüstü derecede ayrıntılı analizlerin, tartışmalı konularla orantısız" olduğunu iddia ettiler. Ancak haber davacıları, davalarını en iyi şekilde sunabilmek için kendilerine tanınan erişimden en iyi şekilde yararlanmak istiyor gibi görünüyor.
The New York Times'a bu kadar geniş bir erişim iznini hemen veren yargıç Ona Wang'ın, bu aşamada OpenAI'nin argümanlarına ne kadar sempati duyacağı bilinmiyor. Ancak OpenAI, örneklem boyutunu sınırlamayı reddederek mahkemenin davayı uzatacağını vurguladı, çünkü her kullanıcının bireysel sohbet kayıtlarını aranabilir hale getirmek önemli ölçüde zaman alacaktır.
OpenAI için bu süreç "oldukça karmaşık", her bir kaydı "OpenAI'nin çevrimdışı veri depolamasındaki milyarlarca kayıt" arasından geri almayı gerektiriyor. Şirket daha sonra bu kayıtları depolama maliyetine katlanacak ve bu da The New York Times'ın 120 milyon kullanıcı konuşması talebini OpenAI'nin teklifinden altı kat daha pahalı hale getirecek.
OpenAI, "Bu adımların her biri zaman, hesaplama kaynakları ve ilgili sistemleri tasarlayan, hata ayıklayan, çalıştıran ve izleyen OpenAI mühendislerini gerektiriyor" diyerek, 20 milyon kaydın 12 hafta, 120 milyon kaydın ise sıkıştırılıp anonimleştirilmesinin 36 hafta süreceğini tahmin etti.
Bu sözde yükümlülük nedeniyle OpenAI, mahkemeden The New York Times'ın talebini reddetmesini veya aksi takdirde haber davacıları "iddialarını yürütme kabiliyetlerinin başka bir örneklem yokluğunda maddi olarak zarar göreceğini gösterene" kadar 20 milyon kaydın aranmasıyla ilerlemesini istedi.
Neden The New York Times Sohbet Aramalarını Sınırlamayı Kabul Edebilir?
Bu hafta yapılacak uzlaşma konferansının bir parçası olarak The New York Times'ın örneklemi sınırlamayı kabul edip etmeyeceği belirsizliğini koruyor. Ancak The New York Times'ın uzlaşmaya yanaşma motivasyonu olabilir, zira gazete yakın zamanda Microsoft'un ChatExplorer adlı dahili ChatGPT alternatif aracından NYT muhabirlerinin ayrıcalıklı kayıtlarını zorlama taleplerine güçlü bir şekilde karşı çıktı.
Savunmasında The New York Times, Microsoft'un talebinin çok geniş olduğunu, "bu davayla hiçbir ilgisi olmayan gazeteciler ve NYT avukatlarından alınan 80.000'den fazla kaydı" talep ettiğini savundu. Eğer bu savunma size ChatGPT kayıtları hakkındaki OpenAI'nin argümanlarına benziyorsa, endişelenmeyin; The New York Times, iki sohbet örneği talebinin neden sözde çok farklı olduğunu açıklıyor.
The New York Times'a göre, ChatGPT kayıtları için yaptığı talep uygun şekilde "telif hakkı ihlalinin doğrudan kanıtını" ararken, Microsoft'un "yalnızca büyük ölçüde telif hakkı ihlali içermeyen kullanımlarını ve adil kullanım savunmalarını desteklemek" için kullanılabileceği iddia edilen ChatExplorer verilerine erişmeye "ihtiyacı yok".
The New York Times, gazetecilerinin Microsoft'un savunmalarına hizmet etmek üzere "dönüştürücü amaçlar" için "suçlanan ürünleri" kullandığına dair kanıtlar sunduğu ve Microsoft'un talebini belirli çalışanlara veya arama terimlerine uyarlayamadığı için, gazetenin Microsoft'un talebinin 58 NYT muhabirinin ve avukatının ayrıcalıklı kayıtlarını gereksiz yere çekeceğini ve bu argümanları ilerletmeyeceğini savundu.
The New York Times'ın savunmasının, bu hafta ChatGPT kayıtları hakkında ortaya çıkabilecek uzlaşmada haber davacılarına kaldıraç sağlayacak kadar güçlü olması mümkün. Bu olasılığın farkında olmak, OpenAI CEO'su Sam Altman'ın yakın zamanda kullanıcılar ve sohbet botları arasındaki herhangi bir sohbetin gizli kabul edileceği "yapay zeka ayrıcalığı" fikrini ortaya atmasının nedeni olabilir, diye bildirdi VentureBeat.