ChatGPT'nin geliştiricisi OpenAI, New York Times ve diğer medya kuruluşlarının açtığı telif hakkı ihlali davası kapsamında, mahkemenin 20 milyon kullanıcı sohbetini bu kuruluşlara sunma kararını tersine çevirmek için çaba gösteriyor. OpenAI daha önce bu sohbet kayıtlarının bir kısmını sunmayı teklif etmiş olsa da, mahkemenin bu kayıtların tamamının sunulması yönündeki kararının aşırı geniş olduğunu savunuyor.
OpenAI tarafından yapılan bir açıklamada, söz konusu kayıtların "tamamlanmış konuşmalar" olduğu, yani bir kullanıcının ChatGPT ile gerçekleştirdiği birden fazla girdi ve çıktı çiftini içeren eksiksiz sohbetler olduğu belirtildi. Bu türden tamamlanmış kayıtların, sadece birkaç saniyelik bir sohbet parçasına kıyasla daha fazla özel bilgi açığa çıkarma potansiyeli taşıdığı vurgulandı.
OpenAI, bu sohbetlerin "%99,99'undan fazlasının dava ile hiçbir ilgisi olmadığını" iddia etti. Şirket, mahkemeden verilen kararı iptal etmesini ve ilgili kayıtların belirlenmesi konusunda medya davacılarının OpenAI'nin teklifine yanıt vermesini talep etti. OpenAI, bu konuda federal temyiz mahkemesine başvurma seçeneğini de değerlendiriyor.
OpenAI, kendi web sitesinde yaptığı bir duyuruda, New York Times'ın kullanıcıların ödeme duvarını aşmak için ChatGPT'yi nasıl kullandıklarını tespit etmek amacıyla 20 milyon özel ChatGPT konuşmasını kendilerine teslim etmelerini talep ettiğini belirtti.
Gizlilik konusunda endişeli ChatGPT kullanıcıları için New York Times davası dışında da endişeler mevcut. Örneğin, ChatGPT konuşmalarının Google arama sonuçlarında ve geliştiricilerin arama trafiğini izlemesine olanak tanıyan Google Search Console gibi araçlarda yer aldığı görüldü. OpenAI, gelecekte kullanıcı verilerini gizli tutacak gelişmiş güvenlik özellikleri geliştirmeyi planladığını, buna mesajlar için uçtan uca şifreleme de dahil olduğunu açıkladı.
OpenAI: Yapay Zeka Sohbetleri Özel E-postalar Gibi Ele Alınmalı
OpenAI'nin mahkeme başvurusu, sohbet kayıtlarının dava ile ilgililiği temelinde daraltılması gerektiğini savunuyor.
Şirket, bu ölçekte kişisel bilgilerin toplu olarak sunulmasını emreden bir mahkeme kararına rastlamadığını belirtti. Bu durumun tehlikeli bir emsal teşkil edebileceği ve yapay zeka şirketlerine dava açan herkesin, ilgililik açısından daraltılmadan milyonlarca sohbet kaydını talep edebileceği anlamına gelebileceği ifade edildi. Bu durumun, diğer davalarda işleyen keşif süreçleriyle uyumlu olmadığı ve Google'a dava açanların, ilgililikten bağımsız olarak milyonlarca Gmail kullanıcısının özel e-postalarını inceleyemeyeceği gibi, üretken yapay zeka araçları için de geçerli olması gerektiği vurgulandı.
Daha önce alınan bir mahkeme kararıyla, OpenAI'nin 20 milyon anonimleştirilmiş ChatGPT kullanıcı kaydını, anonimleştirme işleminin tamamlanmasından sonraki 7 gün içinde medya davacılarına sunması gerektiği belirtilmişti. Kararda, tarafların kayıtların tam olarak sunulması gerektiği konusunda anlaşmazlığa düşüp düşmediğine bakılmaksızın üretimin devam etmesi gerektiği ifade edilmişti.
OpenAI'nin mevcut başvurusu, mahkeme kararının, anonimleştirme sürecinin yalnızca tanımlayıcı olmayan ancak yine de özel olabilecek bilgileri (örneğin, bir Washington Post muhabirinin haber makalesi hazırlığına yardımcı olmak için ChatGPT'yi kullanması gibi) kaldırmayı amaçlamadığını açıklayan bir tanığın beyanını dikkate almadığını ileri sürüyor.
New York Times ise yaptığı açıklamada, OpenAI ve Microsoft'a karşı açtıkları davanın, bu şirketlerin milyonlarca telifli eseri çalarak The Times ile doğrudan rekabet eden ürünler yaratmaları nedeniyle hesap vermelerini sağlamakla ilgili olduğunu belirtti. OpenAI'nin gizlilik iddiasının, şirketlerin yasadışı eylemlerini örtbas etme girişiminin bir parçası olduğunu ve kullanıcı gizliliğinin risk altında olmadığını savundu. Mahkemenin, OpenAI'den, kendisi tarafından anonimleştirilen bir sohbet örneğini yasal koruma düzeni altında sunmasını istediğini ve bu tür korku tellallığının, OpenAI'nin kendi hizmet şartlarının kullanıcı konuşmalarını modellerini eğitmek ve dava süreçleri için kullanmasına izin vermesi göz önüne alındığında daha da dürüst olmadığını söyledi.
Sohbet Kayıtları Yasal Koruma Altında Tutuluyor
OpenAI'nin belirttiğine göre, 20 milyon sohbet kaydı, Aralık 2022 ile Kasım 2024 tarihleri arasındaki rastgele seçilmiş ChatGPT konuşmalarından oluşuyor ve kurumsal müşterilerin sohbetlerini içermiyor.
Şirket, The Times'a, sohbetlerin örneklerini hedefli aramalar yaparak (örneğin, New York Times makalesinden metin içerebilecek sohbetleri arayarak sadece iddialarıyla ilgili konuşmaları almalarını sağlamak gibi) veya ChatGPT'nin örnekteki kullanımının nasıl sınıflandırıldığına dair üst düzey veri analizleri sunmak gibi çeşitli gizlilik odaklı seçenekler sunduğunu ancak bunların The Times tarafından reddedildiğini ifade etti.
Sohbetlerin, "yasal koruma altında" olup yalnızca yasal yükümlülükleri yerine getirme dışında başka amaçlarla erişilemeyen güvenli bir sistemde saklandığı belirtildi. OpenAI, New York Times'ın, mahkeme süreci dışında herhangi bir veriyi kamuoyuna açıklamakla yasal olarak yükümlü olacağını ve kullanıcı konuşmalarının kamuoyuna açıklanmasına yönelik her türlü girişime karşı mücadele edeceğini dile getirdi.
New York Times'ın daha önceki bir başvurusunda, OpenAI'nin, davayla ilgili olan milyarlarca model çıktısının küçük bir örneğini bile üretmeyi reddederek önceki anlaşmaları ihlal etmekle suçladığı belirtildi. Başvuruda, OpenAI'nin, keşif taleplerinin başlangıçta "Times içeriğiyle ilgili" kayıtlarla sınırlı olduğu, ancak daha sonra medya davacılarının, "Times içeriğiyle ilgili" kayıtları bulup üretmek yerine, 20 milyonluk örneğin tamamını harici bir sürücü aracılığıyla teslim etme talebiyle yeni bir talepte bulunduğu belirtildi.
OpenAI, Mahkeme Hakiminin Gerekçesini Tartışıyor
Daha önceki bir mahkeme kararında, ABD Bölge Mahkemesi Hakimi Susan van Keulen'in, bir başka davada 5 milyon kayıt sunulmasına karar verdiği ve OpenAI'nin bu karara dayandırdığı bir formül kullandığı belirtildi. OpenAI, bu formülü sohbet verisi örneklemesi için önceki metodolojisini desteklemek amacıyla kullandığını ancak Hakime van Keulen'in daha sonraki kararının neden burada da benzer şekilde yol gösterici olmadığını açıklayamadığını iddia etti.
OpenAI'nin mevcut başvurusu, söz konusu "Concord" kararının, örneğin toptan sunulmasının uygun olup olmadığıyla ilgili olmadığını, daha çok, önceden üzerinde anlaşılmış bir üretimin nasıl gerçekleştirileceği mekanizmasıyla ilgili olduğunu savundu. OpenAI, bu kararın, eğer kendisi benzer gizlilik endişelerini dile getirmiş olsaydı, Hakime van Keulen'in de toptan sunulmasına karar vereceğini ima etmediğini belirtti.
OpenAI, "Concord" kayıtlarının sadece girdi-çıktı çiftlerinden oluştuğunu, yani tek bir kullanıcı girdisi ve ardından tek bir model çıktısı olduğunu vurguladı. Oysa mevcut davadaki kayıtların "tamamlanmış konuşmalar" olduğunu ve her birinin birden fazla girdi-çıktı çiftini içeren eksiksiz bir kullanıcı-ChatGPT etkileşimi olduğunu belirtti. Bu durumun, 80 milyon girdi-çıktı çiftine kadar ulaşabileceğini öne sürdü.