İletişim kurmak, özellikle de ciddi motor nöron hastalıkları gibi durumlar nedeniyle vücut hareketleri kısıtlanmış kişiler için büyük bir zorluk olabilir. Geçmişte, bu tür durumdaki bireylerin iletişim kurmak için kullandığı yöntemler oldukça yavaştı; örneğin, bir kas hareketiyle ekrandan harf seçerek saniyede yalnızca birkaç kelime yazmak gibi. Bu metinler daha sonra seslendirilerek dış dünyayla bağlantı kuruluyordu.
Ancak teknoloji hızla ilerliyor. Son dönemde geliştirilen beyin-bilgisayar arayüzleri (BCI) sayesinde, beyin aktivitesini doğrudan metne ve hatta konuşmaya dönüştürmek mümkün hale geldi. Yine de bu sistemlerin önemli gecikmeleri vardı, genellikle kullanıcıyı belirli bir kelime hazinesiyle sınırlıyorlardı ve konuşmanın incelikleri olan tonlama veya vurgu gibi özellikleri yönetemiyorlardı.
Şimdi ise Amerika Birleşik Devletleri'ndeki bir üniversitede görevli bilim insanlarından oluşan bir ekip, beyin sinyallerini anında seslere – yani fonemlere ve kelimelere – dönüştürebilen nöral bir protez geliştirdi. Bu gelişme, tamamen dijital bir ses yolu oluşturma yolunda attığımız ilk gerçek adım olabilir.
Metin Tabanlı Sistemlerin Sınırları Aşıldı
Ekip lideri, geliştirilen bu esnek konuşma nöroprotezinin temel amacının, felçli bir hastanın mümkün olduğunca akıcı konuşmasını sağlamak, kendi hızını yönetmesine olanak tanımak ve tonlamayı ayarlayarak daha etkileyici olmasını mümkün kılmak olduğunu belirtiyor. Bu hedeflere ulaşmak, geçmiş BCI tabanlı iletişim çözümlerinin karşılaştığı neredeyse tüm sorunları çözmek anlamına geliyordu ki bu da oldukça büyük bir meydan okumaydı.
Önceki başarılı nöral protezlerin çoğu, beyin sinyallerini metne dönüştürüyordu. Yani, implant takılı olan hastanın söylemek istediği kelimeler ekranda görünüyordu. Bir başka araştırma ekibi tarafından geliştirilen bir sistem, beyin-metin dönüşümünde yaklaşık %25 hata oranına sahipti. Araştırmayı yürüten ekipteki bir sinirbilimciye göre, 'Hasta konuşmaya çalışırken kelimeler deşifre edilebiliyordu. Her dört kelimeden üçü doğruydu. Bu çok heyecan vericiydi ama günlük iletişim için yeterli değildi.'
Daha sonra, bu ekip kendi beyin-metin sistemleri üzerine yaptıkları başka bir çalışmada doğruluğu %97.5'e kadar yükseltti. Araştırmacı, 'Neredeyse her kelime doğruydu, ancak metin üzerinden iletişim kurmak sınırlayıcı olabilir, değil mi?' diye soruyor ve ekliyor: 'Bazen sesinizi kullanmak istersiniz. Bu, aniden araya girmenizi kolaylaştırır, diğer insanların sizi bölme olasılığını azaltır; şarkı söyleyebilir, sözlükte olmayan kelimeleri kullanabilirsiniz.' Ancak konuşma üretmek için en yaygın yaklaşım, metinden sentezlemekti, bu da BCI sistemlerinde başka bir soruna yol açıyordu: çok yüksek gecikme.
Neredeyse tüm BCI konuşma yardımcılarında, cümleler hastanın zihninde kelimeleri sıralamayı bitirmesinden çok sonra, önemli bir gecikmeyle ekranda beliriyordu. Konuşma sentezi genellikle metin hazırlandıktan sonra gerçekleşiyordu, bu da daha fazla gecikmeye neden oluyordu. Beyin-metin çözümleri aynı zamanda sınırlı bir kelime dağarcığından muzdaripti. Bu türden en son sistem, yaklaşık 1.300 kelimelik bir sözlüğü destekliyordu. Farklı bir dil konuşmaya çalıştığınızda, daha ayrıntılı kelime dağarcığı kullandığınızda veya hatta hemen köşedeki bir kafenin sıra dışı adını söylediğinizde, sistemler başarısız oluyordu.
Bu nedenle, araştırmacılar yeni protezlerini beyin sinyallerini kelimeler yerine seslere dönüştürecek şekilde tasarladılar ve bunu gerçek zamanlı yapmayı başardılar.
Beyinden Sesi Çıkarmak
Çalışmaya katılmayı kabul eden hasta, 46 yaşında ALS hastası bir erkekti. Bir sinir cerrahı ve çalışmanın yazarlarından biri, hastanın durumunu 'Ciddi derecede felçli ve konuşmaya çalıştığında anlaşılması çok zor. Onu birkaç yıldır tanıyorum ve konuştuğunda söylediklerinin belki sadece %5'ini anlıyorum' diye açıklıyor. Hasta, bu yeni çalışmadan önce, bilgisayar ekranındaki imleci kontrol etmek için jiroskopik bir baş fare kullanıyordu.
Yeni beyin-konuşma sistemi için, araştırmacılar hastanın beyninin ses yolu kaslarını kontrol etmekten sorumlu bölgesine yerleştirilen 256 mikroelektrodu kullandı. Elektrotlar tarafından kaydedilen sinyaller, bu sinyalleri çözümleyen ve tonlama veya seslendirme gibi konuşma özelliklerini çıkaran nöral kod çözücü adı verilen bir yapay zeka algoritmasına gönderildi. Bir sonraki adımda, bu özellikler bir vokodere beslendi; vokoder, hastanın normal konuşabildiği zamanki sesine benzeyecek şekilde tasarlanmış bir konuşma sentezleme algoritmasıydı. Tüm sistem, yaklaşık 10 milisaniyeye kadar düşen gecikmeyle çalıştı; beyin sinyallerinin seslere dönüşümü etkili bir şekilde anındaydı.
Yeni nöral protez, beyin sinyallerini seslere dönüştürdüğü için, desteklenen kelimelerin sınırlı bir seçimiyle gelmedi. Hasta, sözlükte olmayan sahte kelimeler ve 'ıh', 'hım' veya 'şey' gibi ünlemler dahil istediği her şeyi söyleyebildi. Sistem, tonlama veya vurgu gibi özelliklere duyarlı olduğu için, cümlenin son kelimesini biraz daha yüksek bir tonda söyleyerek soruları seslendirebildi ve hatta kısa bir melodi bile söyleyebildi.
Ancak geliştirilen protezin de sınırları vardı.
Anlaşılabilirlik Geliştirmeleri
Protezin performansını test etmek için ekip, ilk olarak insan dinleyicilerden, hastanın sentezlenmiş konuşmasının bir kaydını, benzer uzunlukta altı aday cümleden oluşan bir setten doğru transkriptle eşleştirmelerini istedi. Burada sonuçlar tamamen mükemmeldi, sistem %100 anlaşılabilirlik elde etti.
Sorunlar, ekip biraz daha zorlayıcı bir şey denediğinde başladı: dinleyicilerin herhangi bir aday transkript olmadan çalışmak zorunda olduğu açık bir transkripsiyon testi. Bu ikinci testte, kelime hata oranı %43.75 idi, yani katılımcılar kaydedilen kelimelerin yarısından biraz fazlasını doğru tanımladı. Bu, aynı dinleyici grubuyla aynı testte kelime hatasının %96.43 olduğu hastanın desteksiz konuşmasının anlaşılabilirliğine kıyasla kesinlikle bir gelişmeydi. Ancak protez, umut verici olmasına rağmen, günlük iletişim için henüz yeterince güvenilir değildi.
Ekipteki bir sinirbilimci, 'Açık uçlu sohbetlerde kullanılabilecek noktada değiliz. Bunu bir konsept kanıtı olarak görüyorum' diyor. Gelecekteki tasarımları iyileştirmenin bir yolunun daha fazla elektrot kullanmak olabileceğini öne sürdü. 'Şu anda binden fazla elektroda sahip BCI'lar inşa eden birçok startup var. Sadece 250 elektrotla başardıklarımızı bin veya iki bin elektrotla neler yapılabileceğini düşünürseniz, sanırım işe yarayacaktır' diye savundu. Ve bunun gerçekleşmesi için çalışmalar zaten devam ediyor.
Beyin-bilgisayar arayüzlerine odaklanan bir şirket, bir konuşma nöral protezinin klinik denemelerine devam etmek istiyor ve ilgili kurumlardan onay almak için başvuruda bulunuyor. Bu şirket, 1.600 elektrotlu bir sisteme sahip ve halka açık olarak konuşma alanında çalışma yapacaklarını belirttiler. Bu denemelerin, çalışmanın yazarlarından biri olan bir beyin cerrahı tarafından yönetileceği ve aynı üniversitede yapılacağı bildirildi.