Mesajlaşma uygulamaları alanında gizlilik standardını yeniden belirleyen Signal'ın arkasındaki mühendis (Moxie Marlinspike takma adıyla biliniyor), şimdi de yapay zeka sohbet robotları alanında benzer bir devrim yaratmayı hedefliyor.
Marlinspike'ın son girişimi Confer, kullanıcı verilerinin platform operatörü, hackerlar, kolluk kuvvetleri veya hesap sahipleri dışındaki herhangi bir taraf tarafından okunamayacağına dair güçlü güvenceler sunan açık kaynaklı bir yapay zeka asistanı. Büyük dil modelleri ve arka plan bileşenlerini içeren hizmet tamamen açık kaynaklı yazılımlarla çalışıyor ve kullanıcılar bunun şifrelenmiş şekilde yerinde olduğunu kriptografik olarak doğrulayabiliyor.
Kullanıcılardan gelen veriler ve konuşmalar ile büyük dil modellerinden elde edilen yanıtlar, sunucu yöneticilerinin bile gizlice bakmasını veya üzerinde değişiklik yapmasını engelleyen güvenilir bir yürütme ortamında (TEE) şifreleniyor. Konuşmalar, anahtarı kullanıcıların cihazlarında güvenli bir şekilde kalan şifrelenmiş formda Confer tarafından saklanıyor.
Signal gibi, Confer'ın da altında yatan çalışma prensipleri zarif bir tasarım ve sadelikle öne çıkıyor. Signal, kullanıcıların kolayca kullanabileceği ilk uçtan uca gizlilik aracıydı. Öncesinde, şifreli iletişim kanalları kurmak için PGP e-posta veya diğer seçenekleri kullanmak, hataya açık ve karmaşık bir süreçti. Signal bu kalıbı kırdı. Anahtar yönetimi artık kullanıcıların endişelenmesi gereken bir görev olmaktan çıktı. Signal, platform operatörlerinin bile mesajlara göz atmasını veya kullanıcıların gerçek kimliklerini belirlemesini engelleyecek şekilde tasarlandı.
“Doğası Gereği Veri Toplayıcılar”
Tüm büyük platformlar, yasal bir celp kağıdı sunulduğunda kullanıcı verilerini kolluk kuvvetlerine veya özel taraflara devretmekle yükümlüdür. Kullanıcılar verilerinin uzun süreli saklanmasını reddetse bile, bir davada taraf olanlar platformu verileri saklamaya zorlayabilir. Geçtiğimiz Mayıs ayında bir mahkemenin OpenAI'ye, API iş kolu aracılığıyla kaydedilen sohbetler ve hassas konuşmalar dahil olmak üzere tüm ChatGPT kullanıcı günlüklerini saklama emri vermesiyle dünya bunu öğrenmişti. OpenAI CEO'su Sam Altman, bu tür kararların platformdaki psikoterapi seanslarının bile gizli kalmayabileceği anlamına geldiğini belirtti. Veri saklamayı reddetmenin bir diğer istisnası ise Google Gemini gibi yapay zeka platformlarının sohbetleri insanlar tarafından okunabilmesidir.
Veri gizliliği uzmanı Em (soyadını internette paylaşmıyor), yapay zeka asistanlarını veri gizliliğinin “baş düşmanı” olarak nitelendiriyor çünkü bu asistanların faydası, bireyler dahil olmak üzere sayısız kaynaktan büyük miktarda veri toplamaya dayanıyor.
“Yapay zeka modelleri doğası gereği veri toplayıcılardır,” diyor. “Eğitim, iyileştirme, operasyonlar ve özelleştirmeler için büyük veri toplama işlemine güvenirler. Çoğu zaman bu veriler, net ve bilgilendirilmiş bir rıza olmadan (bilgisiz eğitim deneklerinden veya platform kullanıcılarından) toplanır ve verileri paylaşmak ve para kazanmak için birçok teşviki olan özel bir şirkete gönderilir ve bu şirket tarafından erişilir.”
Marlinspike'a göre, büyük dil modeli etkileşimlerinin doğası göz önüne alındığında kullanıcı kontrolünün eksikliği özellikle sorunlu. Kullanıcılar sıklıkla diyalogları samimi sohbetler olarak ele alırlar. Kullanıcılar düşüncelerini, korkularını, yanlışlarını, iş anlaşmalarını ve en derin, en karanlık sırlarını, yapay zeka asistanları güvenilir sırdaşlar veya kişisel günlükler gibiymiş gibi paylaşırlar. Bu etkileşimler, genellikle anahtar kelimeler ve çıkan bağlantılarla işlem odaklı bir modeli takip eden geleneksel web arama sorgularından temelde farklıdır.
Yapay zeka kullanımını “veri gölüne itiraf etmek” olarak benzetiyor.
Bugünün Yapay Zeka Ortamının Kabusundan Uyanış
Buna yanıt olarak Marlinspike, Confer'ı geliştirdi ve şu anda denemelerini yapıyor. Signal'ın mesajları yalnızca sohbet katılımcıları tarafından okunabilir hale getirmek için şifreleme kullandığı gibi, Confer da kullanıcı komutlarını, yapay zeka yanıtlarını ve içerdiği tüm verileri koruyor. Ve tıpkı Signal gibi, bireysel kullanıcıları e-posta adresleri, IP adresleri veya diğer detaylar aracılığıyla gerçek kimliklerine bağlamanın bir yolu yok.
Marlinspike, “Etkileşimin karakteri temelde farklı çünkü bu özel bir etkileşim,” dedi. “Confer'ı kullanan ve hayat değiştiren konuşmalar yapan insanlardan hikayeler duymak gerçekten ilginç, teşvik edici ve harika oldu. Kısmen, ChatGPT gibi kaynaklarla yapılan konuşmalara bilgi dahil etme konusunda özgür hissetmedikleri veya ChatGPT ile paylaşmaya gerçekten özgür olmadıkları verileri kullanarak içgörüler elde ettikleri için, ancak Confer gibi bir ortamda bunu yapabiliyorlar.”
Confer şifrelemesinin ana bileşenlerinden biri passkey'lerdir. Sektör çapında standart olan bu teknoloji, kullanıcının giriş yaptığı her hizmet için benzersiz bir 32 baytlık şifreleme anahtar çifti oluşturur. Genel anahtar sunucuya gönderilir. Özel anahtar yalnızca kullanıcı cihazında, hackerların (fiziksel erişime sahip olsalar bile) erişemeyeceği korumalı depolama donanımı içinde saklanır. Passkey'ler iki faktörlü kimlik doğrulama sağlar ve bir parmak izi, yüz taraması (bunların hepsi de cihazda güvende kalır) veya cihaz kilidi açma PIN'i veya parolası ile hesaba giriş yapmak için yapılandırılabilir.
Özel anahtar, cihazın Confer'a giriş yapmasına ve kırılması imkansız olduğuna inanılan yaygın bir şifreleme ile tüm girdileri ve çıktıları şifrelemesine olanak tanır. Bu, kullanıcıların, kendilerinden başka kimse tarafından okunamayacağı güvencesiyle konuşmaları Confer sunucularında saklamasına imkan tanır. Bu depolama, konuşmaların kullanıcının sahip olduğu diğer cihazlarda senkronize olmasına olanak tanır. Tüm bunları çalıştıran kod herkesin incelemesi için mevcuttur.
Yukarıdaki iki resimde görülen kullanıcı arayüzü aldatıcı derecede basittir. Sadece iki adımla bir kullanıcı oturum açar ve önceki tüm sohbetler şifresi çözülür. Bu sohbetler daha sonra aynı hesaba giriş yapmış herhangi bir cihazda kullanılabilir hale gelir. Bu şekilde, Confer konuşmaları gizliliği tehlikeye atmadan senkronize edebilir. Cömert 32 baytlık anahtar materyali, özel anahtarın düzenli olarak değişmesine olanak tanır; bu özellik, anahtarın tehlikeye girmesi durumunda bir saldırganın önceki veya sonraki konuşmaları okuyamayacağı anlamına gelen ileri doğru gizlilik olanağı sağlar.
Confer'daki diğer ana bileşen, platform sunucularındaki bir TEE'dir. TEE'ler, makineye yönetici erişimi olan biri tarafından okunmasını veya değiştirilmesini önleyerek sunucu CPU'sundan geçen tüm verileri ve kodu şifreler. Confer TEE ayrıca uzak kimlik doğrulama da sağlar. Uzak kimlik doğrulama, sunucu tarafından gönderilen ve verilerin ve yazılımların TEE içinde çalıştığını kriptografik olarak doğrulayan ve üzerinde çalışan tüm yazılımları listeleyen dijital bir sertifikadır.
Confer üzerinde, uzak kimlik doğrulama, herkese açık olarak kullanılabilen proxy ve görüntü yazılımlarının—ve yalnızca bu yazılımların—sunucuda çalıştığını doğrulayan, bit-bit çıktıları yeniden üretebilme imkanı tanır. Confer'ın vaat edildiği gibi çalıştığını daha da doğrulamak için, her sürüm dijital olarak imzalanır ve bir şeffaflık günlüğünde yayınlanır.
Confer için macOS, iOS ve Android'in en son sürümlerinde yerel destek mevcuttur. Windows'ta kullanıcıların üçüncü taraf bir kimlik doğrulayıcı yüklemesi gerekir. Linux desteği henüz mevcut değildir, ancak bu eklenti bu boşluğu dolduruyor.
Başka Gizli Büyük Dil Modelleri de Var, Ancak Büyük Oyuncular Yok
Uçtan uca şifreleme (E2EE) sunan bir başka halka açık büyük dil modeli (LLM) ise, popüler şifreli e-posta hizmetinin arkasındaki Avrupa şirketi Proton tarafından sağlanan Lumo'dur. Proton Mail, Drive ve Calendar tarafından kullanılan aynı şifreleme motorunu benimser. Motorun iç yapısı, bir dizi hem simetrik hem de asimetrik anahtara dayandığı için Confer'dan daha karmaşıktır. Ancak kullanıcı için sonuç büyük ölçüde aynıdır.
Kullanıcı hesabına kimlik doğrulama yaptıktan sonra Proton, tüm konuşmaların, verilerin ve meta verilerin yalnızca kullanıcıya ait olan simetrik bir anahtarla şifrelendiğini belirtiyor. Kullanıcılar, şifrelenmiş verilerin cihaz senkronizasyonu için Proton sunucularında saklanmasını veya konuşma bittikten hemen sonra silinmesini seçebilirler.
Gizlilik vaat eden üçüncü bir LLM sağlayıcısı ise Venice'dir. Tüm verileri yerel olarak, yani kullanıcı cihazında saklar. Uzak sunucuda hiçbir veri saklanmaz.
Büyük LLM platformlarının çoğu, kullanıcıların konuşmalarını ve verilerini pazarlama ve eğitim amaçları için muaf tutma olanağı sunar. Ancak daha önce de belirtildiği gibi, bu vaatler genellikle önemli istisnalar içerir. Seçilen insanlar tarafından incelemeye ek olarak, kullanıcılar varsayılan depolamayı reddetmiş olsalar bile, hizmet şartlarını uygulamak veya diğer iç amaçlar için kişisel veriler kullanılabilir.
Çevrimiçi saklanan çoğu verinin bir celp ile elde edilebilmesine ve bilgisayar korsanları tarafından yapılan büyük veri ihlallerinin düzenli olarak gerçekleşmesine izin veren mevcut yasal manzara göz önüne alındığında, kişisel verilerin gizli kaldığına dair makul bir beklenti olamaz.
Büyük sağlayıcıların uçtan uca şifreleme korumaları sunması harika olurdu, ancak şu anda bunu planladıklarına dair hiçbir işaret yok. O zamana kadar, kullanıcı verilerini sürekli büyüyen veri gölü dışında tutacak az sayıda küçük alternatif mevcut.