Yapay zeka alanında çığır açan bir gelişme yaşanıyor. ABD merkezli bir teknoloji şirketi, altı ay süren dikkat çekici bir proje ile yaklaşık 10.000 saatlik beyin tarama verisi topladı. Bu veriler, bugüne kadar bir araya getirilen en büyük nöral dil veri kümesini oluşturuyor. Şirketin amacı, konuşma veya yazı öncesindeki beyin aktivitelerinden anlamlı içerikleri çözebilen düşünceden metne dönüştüren yapay zeka modellerini eğitmek.
Katılımcılar, iki saatlik seanslar boyunca özel kabinlerde oturarak bir büyük dil modeli ile serbestçe sohbet ediyor veya basitleştirilmiş klavyeler aracılığıyla yazıyor. İlk başta katı görevlere dayalı olan seanslar, katılımcıların motivasyonunun veri kalitesini önemli ölçüde etkilediği fark edildikten sonra kişiselleştirilmiş karşılıklı sohbetlere dönüştürüldü. Bu sayede, her kayıtta üretilen doğal dil miktarı maksimize edilerek metin, ses ve nöral sinyaller arasındaki zaman uyumu sıkılaştırıldı.
Şirket, kendi gereksinimlerini karşılayan ticari bir çoklu-duyusal başlık bulamayınca donanımı kendisi geliştirdi. Elektroensefalografi (EEG), fNIRS ve diğer sensörleri bir araya getirerek özel 3D baskılı kabuklar tasarladılar. Eğitim başlıkları, sinyal kapsamını en üst düzeye çıkarmak için tasarlanmış dört kiloluk yoğun ve ağır cihazlarken, çıkarım başlıklarının modeller olgunlaştıktan sonra yapılacak analizlerle şekilleneceği belirtildi. Tüm veriler, birden fazla sensör tipinden gelen girdiyi tek bir çerçevede birleştiren Zarr 3 formatından akıyor.
Başlangıçta elektriksel parazit, veri kalitesi için en büyük tehdit olarak görülüyordu. Ekip, ekipmanı kauçukla kaplayarak, güç düzenleyicileri deneyerek ve hatta 60 Hz dalgalanmayı ortadan kaldırmak için ana gücü tamamen kapatıp batarya paketlerine güvenerek bu sorunu çözmeye çalıştı. Bu yaklaşım, veri kaybı ve sürekli batarya değişimi gibi sorunlar yaratsa da, ölçeğin değişen geri bildirimleri beraberinde getirdiği keşfedilince normal güce dönüldü. Veri kümesi yaklaşık 4.000-5.000 saate ulaştığında, modelin insanlar, kabinler ve kurulumlar arasında genelleşmeye başladığı ve agresif gürültü azaltmanın değerinin azaldığı gözlemlendi.
Süreç ölçeklendikçe işletme maliyetleri düştü. Şirket, arka ucunu yeniden tasarlayarak bozuk oturumları gerçek zamanlı olarak yakalayıp oturum yöneticilerinin birden fazla kabini kameralar aracılığıyla izlemesine olanak tanıyarak Mayıs ve Ekim ayları arasında kullanılabilir saat başına marjinal maliyeti yaklaşık %40 oranında azalttı. Özel bir rezervasyon sistemi, 20 saatlik günlük bir program boyunca başlıkların dolu kalmasını sağlamak için dinamik fiyatlandırma ve aşırı rezervasyon yöntemlerini kullandı.
Şirket şu anda neredeyse tamamen model eğitimi üzerine odaklandığını ve kod çözme sistemini ileriki bir aşamada detaylandıracağını bildirdi.