Yapay zeka (YZ) tarafından üretilen içeriklerin internette hızla yayılmasıyla birlikte, YZ öncesi dönemde insanlar tarafından oluşturulmuş dijital içerikler giderek daha değerli hale geliyor. Bu değişime dikkat çeken yeni bir web sitesi, makine öğrenmesinin henüz dijital ortamlara hakim olmadığı zamanlardan kalma 'saf' insan yaratıcılığını bir tür zaman kapsülü olarak arşivlemeyi amaçlıyor.
Girişim, ismini Soğuk Savaş döneminden kalma bilimsel bir olgudan alıyor. 1945'te başlayan nükleer silah denemeleri sonrasında, atmosferdeki radyasyon yeni çelik üretimini kirletmişti. Hassas bilimsel aletler için radyasyonsuz metale ihtiyaç duyan bilim insanları, yıllarca savaş öncesi batıklardan çelik kurtarmak zorunda kaldılar. Bu çeliğe "düşük arka planlı çelik" adı veriliyordu. Girişimin yaratıcısı, bugünün web'inde YZ üretimi içeriğin insan yapımı içerikle karıştığını ve onu 'kirlettiğini' belirterek, bu durumla bir paralellik kuruyor.
2022'de ChatGPT ve Stable Diffusion gibi üretici YZ modellerinin ortaya çıkışıyla birlikte, internette bulunan bir içeriğin YZ araçları kullanılmadan tamamen insanlar tarafından oluşturulduğundan emin olmak araştırmacılar için çok daha zor hale geldi. Özellikle ChatGPT, web genelinde YZ üretimi metinlerin çığ gibi yayılmasına neden oldu ve bu durum, en az bir önemli araştırma projesinin tamamen durdurulmasına yol açtı.
Bu projelerden biri, 40'tan fazla dilde kelime kullanım sıklığını takip eden ve akademisyenler ile geliştiriciler tarafından dilin evrimini incelemek veya doğal dil işleme uygulamaları geliştirmek için yaygın olarak kullanılan bir araçtı. Proje, Eylül 2024'te artık güncellenmeyeceğini duyurdu çünkü "genel olarak Web, büyük dil modelleri tarafından üretilmiş, kimse tarafından hiçbir şey iletmek için yazılmamış 'çamurla' dolu."
Bazı araştırmacılar ayrıca YZ modellerinin kendi çıktılarından öğrenmesiyle zamanla kalitenin düşebileceği ("model çökmesi" olarak adlandırılan bir olgu) konusunda endişe duyuyorlar. Ancak yakın zamandaki bazı araştırmalar, sentetik verinin gerçek verinin yerine tamamen geçmek yerine onunla birlikte biriktiğinde model çökmesinin önlenebileceğini öne sürüyor. Hatta, doğru şekilde düzenlendiğinde ve gerçek veriyle birleştirildiğinde, YZ modellerinden elde edilen sentetik verinin, yeni ve daha yetenekli modellerin eğitimine yardımcı olabileceği de belirtiliyor.
Dijital koruma çabalarına yabancı olmayan ve daha önce açık kaynaklı e-posta filtreleme yazılımı geliştiren bir teknoloji uzmanı tarafından başlatılan bu arşiv projesi, aslında Mart 2023'te YZ tarafından üretilen içerikle 'kirlenmemiş' çevrimiçi kaynaklar için bir depo olarak oluşturulmuş, ancak duyurusu şimdi yapılmış.
Web sitesi, Ağustos 2022 tarihli (ChatGPT'nin Kasım 2022'deki çıkışından önce) bir Wikipedia yedeği, Project Gutenberg'in kamu malı kitap koleksiyonu, Amerika Birleşik Devletleri Kongre Kütüphanesi'nin fotoğraf arşivi ve GitHub'ın Kuzey Kutbu yakınlarındaki eski bir kömür madenine gömülmüş açık kaynak kod anlık görüntüsünü içeren Arctic Code Vault gibi çeşitli büyük YZ öncesi içerik arşivlerine işaret ediyor. Daha önce bahsedilen kelime sıklığı projesinin verileri de, YZ kirliliğinin metodolojisini uygulanamaz hale getirmesinden önceki bir "anlık görüntü" olarak listede yer alıyor.
Site, YZ öncesi diğer içerik kaynakları için de kullanıcı gönderilerini kabul ediyor. Girişim sahibi, projenin YZ karşıtı bir duruş sergilemekten ziyade, YZ çağından önceki insan yaratıcılığını belgelemeyi amaçladığını vurguluyor. Atmosferik nükleer denemeler sona erdiğinde ve arka plan radyasyonu doğal seviyelere döndüğünde, düşük arka planlı çelik çoğu kullanım için gereksiz hale gelmişti. YZ öncesi içeriğin de benzer bir yörünge izleyip izlemeyeceği ise zamanla görülecek.
Yine de, insan yaratıcılığının kaynaklarını, özellikle de arşiv niteliğinde olanları şimdiden korumak makul görünüyor. Çünkü bu depolar, şu anda az kişinin takdir ettiği şekillerde gelecekte faydalı olabilir. Örneğin, gelecekteki tarihçilerin gerçekliğini doğrulayabileceği, YZ öncesi medyanın zaman damgalı bir arşivi gibi fikirler ortaya atılmıştı. YZ 'çamuru' sadece mevcut söylemi kirletmekle kalmıyor, aynı zamanda tarihsel kaydı da bulandırabilir.
Şimdilik, bu web sitesi, bir gün son YZ öncesi çağ olarak görülebilecek döneme ait insan ifadesinin mütevazı bir kataloğu olarak duruyor. İnsan yapımı ve melez insan-YZ kültürleri arasındaki sınırı işaret eden bir dijital arkeoloji projesi gibi. İnsan ve makine çıktısını ayırt etmenin giderek zorlaştığı bir çağda, bu arşivler YZ konuşmaya dahil olmadan önce insan iletişiminin nasıl evrildiğini anlamak için değerli olabilir.