Hiç kalabalık bir ortamda, mesela bir partide veya kafede, arkadaşınızın sesini etraftaki gürültü ve diğer konuşmalar arasından seçmekte zorlandınız mı? Bilim insanları bu durumu 'kokteyl partisi problemi' olarak adlandırıyor ve bu sorun, işitme kaybı yaşayan kişiler için çok daha büyük bir engel teşkil ediyor.
Mevcut işitme cihazlarının çoğu, kullanıcının önündeki seslere odaklanmasını sağlayan yönlü filtrelere sahip. Bu filtreler, sabit arka plan gürültüsünü azaltmada başarılı olsa da, kokteyl partisi gibi insanların birbirine yakın durup benzer ses seviyelerinde konuştuğu daha karmaşık akustik senaryolarda yetersiz kalıyor.
Ancak şimdi geliştirilen yeni bir algoritma, işitme cihazlarının bu 'kokteyl partisi problemiyle' başa çıkma şeklini iyileştirebilir. BOSSA (Biologically Oriented Sound Segregation Algorithm - Biyolojik Odaklı Ses Ayrıştırma Algoritması) adı verilen bu model, sesin kaynağını bulmak ve konumuna göre sesi filtrelemek için iki kulağın girdilerini kullanan beynin işitsel sisteminden ilham alıyor.
Araştırmacılar, geleneksel yönlü filtreleri ve BOSSA'yı yollarındaki şeyleri aydınlatan el fenerlerine benzetiyor. BOSSA'nın, daha seçici ve 'daha dar bir ışık huzmesine' sahip yeni bir el feneri olduğunu belirtiyorlar. Standart filtrelere kıyasla BOSSA'nın, konuşmacıları ayırt etmede daha iyi olması bekleniyor, ancak gerçek dünya senaryolarında uygun işitme cihazlarıyla test edilmesi gerekiyor.
Yakın zamanda bir bilimsel dergide yayınlanan lab testinde, işitme kaybı olan katılımcılara, beş farklı yönden eş zamanlı olarak konuşan kişilerin sesini simüle eden sesler dinletildi. Sesler ya BOSSA ya da geleneksel bir işitme cihazı algoritması aracılığıyla filtrelendi ve katılımcılar filtreli sesleri, hiçbir ek işlem yapılmadan duydukları sesle karşılaştırdı.
Deneyde, katılımcılardan beş konuşmacıdan birinin söylediği cümleleri takip etmeleri istendi. Hedef konuşmacının ses seviyesi, diğerlerine göre değişiyordu. Hedef konuşmacı, dinleyicinin 30 derece içinde bir açıda olduğunda, katılımcılar BOSSA ile geleneksel algoritmaya veya desteksiz dinlemeye kıyasla daha düşük ses seviyelerinde daha fazla kelimeyi seçebildi.
Geleneksel algoritmanın, statik gürültüden konuşmayı ayırt etmede BOSSA'dan daha iyi performans gösterdiği görüldü, ancak bu sadece katılımcıların bir kısmıyla test edildi.
Standart algoritma, belirli bir yönden gelen seslerin sinyal-gürültü oranını artırarak dikkat dağıtıcı sesleri azaltır. BOSSA ise, ses dalgalarını, algoritmanın işleyebileceği 'girdi yükselmelerine' dönüştürür. Bu süreç, iç kulaktaki kokleanın ses dalgalarından gelen titreşimleri nöronlar tarafından iletilen sinyallere dönüştürmesine benzer.
Algoritma, beyin sapının üst kısmı olan orta beyindeki özel hücrelerin belirli bir yönden gelen seslere seçici olarak nasıl tepki verdiğini taklit eder. Bu konumsal olarak ayarlanmış hücreler, her kulağa gelen ses girdilerindeki zamanlama ve ses seviyesi farklarına dayanarak yönü belirler.
Araştırmacılar, BOSSA'nın bu yönünün, avlarını bulmak için ses ipuçlarına güvenen ve sofistike mekansal algılama yeteneklerine sahip hayvanların orta beyin çalışmalarından ilham aldığını belirtiyorlar. BOSSA tarafından filtrelenen sinyaller daha sonra dinleyici için sese dönüştürülüyor.
BOSSA, sinir sisteminin 'aşağıdan yukarıya' dikkat yolunu modeller. Bu yol, duyusal bilgileri toplar ve beyin tarafından yorumlanır. Bu duyusal girdiler, çevrenin hangi yönlerine odaklanılması gerektiğini ve hangilerinin göz ardı edilebileceğini belirler. Ancak dikkat, kişinin önceki bilgileri ve mevcut hedeflerinin algısını şekillendirdiği bir 'yukarıdan aşağıya' yol tarafından da yönlendirilir. Bu durumda, birey neyin alakalı olduğuna odaklanmaya karar verebilir. Bu iki işlem modu birbirini dışlamaz; örneğin, arkadaşınızın sesi hem tanıdığınız için hem de kalabalığın sesi üzerine bağırdığı için dikkatinizi çekebilir.
BOSSA'nın 'aşağıdan yukarıya' yaklaşımı, belirli bir konumdan gelen konuşmaya odaklanmaya yardımcı olabilir, ancak gerçek hayatta insanlar dikkatlerini hızla farklı konuşmalara kaydırır. Araştırmacılar, BOSSA'nın bu algoritmada henüz mümkün olmadığını kabul ediyorlar. Ayrıca çalışmanın, özellikle iç mekanlarda, gerçek hayattaki ses yansımalarını ve yankılanmalarını tam olarak taklit etmediğini de belirtiyorlar.
Buna rağmen BOSSA'nın, ses filtrelemede başka bir yükselen yaklaşım olan derin sinir ağlarına dayalı algoritmalardan daha pratik olabileceği düşünülüyor. Derin sinir ağı modellerinin, kullanıcının karşılaşabileceği tüm farklı konuşmacı konfigürasyonlarına hazırlanması için kapsamlı eğitime ihtiyacı vardır. Ve bir kez uygulandığında, bu modellerin hesaplama talepleri çok fazla güç gerektirir. BOSSA ise kıyasla daha basittir, esas olarak iki ses arasındaki mekansal farka dayanır.
Araştırmacılar dışında kalan uzmanlar da, BOSSA'nın derin sinir ağlarının 'kara kutusundan' daha şeffaf olabileceğini belirtiyor. Bu, ses girdilerinin algoritmik çıktılara nasıl dönüştüğünü yorumlamayı kolaylaştırabilir ve belki de modelin iyileştirilmesini basitleştirebilir. Daha gerçekçi senaryolarda incelendikçe BOSSA'nın daha da iyileştirilmeye ihtiyacı olabileceğini ekliyorlar. Araştırmacılar, BOSSA'yı kulaklıklar yerine uygun işitme cihazlarında test etmeyi ve ayrıca kullanıcıların algoritmanın odağını yönlendirmesine yardımcı olacak bir yönlendirme mekanizması geliştirmeyi umuyor.