ма для вимірювань парціальних відносин сигнал-шум
Вхідними сигналами системи є досліджувані мовний сигнал і шум. На виході системи отримуємо п`ять (по числу каналів) оцінок парціальних відносин сигнал-шум:
. (4.3)
Зі співвідношення (4.3) випливає, що вимірювання вельми прості і зводяться до роздільної багатоканальної фільтрації мовного сигналу і шуму, з наступним виміром дисперсій відгуків кожного з фільтрів.
Малюнок 4.22 Підсистема обчислення парціальних відносин сигнал-шум
Малюнок 4.23 Підсистема вимірювання парціальних дисперсій
4.4 Обчислення формантной і словесної розбірливості мови
При досить великих рівнях шуму ефективний рівень відчуття мовного сигналу в кожному з частотних каналів дорівнює відношенню сигнал-шум в цьому каналі [1,2]:
. (4.4)
Ефективний рівень відчуття формант обчислюють, зменшуючи (4.4) на різницю спектральних рівнів мови і формант:
, (4.5)
де - центральні частоти каналів;
. (4.6)
Артикуляционную розбірливість обчислюють як суму розбірливо формант в кожній з смуг:
, (4.7)
де - коефіцієнт сприйняття мови:
, (4.8)
- ймовірність перебування формант в -тому частотному діапазоні, обмеженому частотами і:
, (4.9)
. (4.10)
Словесна розбірливість може бути обчислена за формантной розбірливості:
. (4.11)
мова акустичний шум розбірливість
5. Модель формування очищеної мови і її дослідження
5.1 Побудова спектрограм-specgram [10]
У даній роботі в якості основного засобу відображення частотно-часових характеристик досліджуваних сигналів використані спектрограми.
Спектрограма - це зображення, що показує залежність спектральної щільності потужності сигналу від часу. Це дуже потужна і сучасний засіб візуалізації спектру. Він являє залежність амплітуди спектральних складових ШПФ, обчислюваного в переміщається вікні, від моменту часу, що задає положення вікна. Фактично спектрограмма будується в площині частота-час, а амплітуда кожної спектральної складової визначає колір побудови кожної точки спектрограми. При побудові спектрограми використовується функціональна забарвлення - рисунок 5.1, наприклад.
Малюнок 5.1 Графік залежності щільності спектральних складових від частоти
З малюнка видно, що спектрограмма в якості засобу відображення дуже наочна.
Особливості, які видно на спектрограмі:
Горизонтальні лінії на НЧ і СЧ - це гудячі наведення (частина шуму);
Візерунчастий фон на всіх частотах - це широкосмуговий шум;
Хвилясті лінії - це гармоніки голосу;
Вертикальні світлі області на СЧ і ВЧ - це шиплячі і свистячі приголосні;
Шумове хмара в районі 2 секунди - це вдих;
Вертикальні штрихи в районі 1.7 секунди - це слюні, супроводжуючі відкривання рота.
Алгоритм обчислення спектрограм містить три характерних кроки:
. Розбивка x на перекриваються блоки, на кожен з яких накладається вікно.
. Виконання nttf - точкового ШПФ для відповідного відрізка часу, що створює відповідний стовпець матриці B, після чого вікно переміщається на число точок, рівне (length (window) -numoverlap). Якщо число точок ШПФ перевищує кількість відліків у вікні, то перед виконанням ШПФ блок доповнюється нулями.
. При речових компонентах x спектрограмма будується для позитивних частот, і матриця B містить при парному nfft (nfft/2) +1 рядків, а при nfft непарному - (nfft + 1)/2 рядків, і k=fix ((n-numerlap)/(length (window) - numerlap)) стовпців.
Спектр перешкоди сигналу являє собою суму спектрів мовного сигналу і шуму. Отже, придушити шум у мовному сигналі можна шляхом вирахування із спектру перешкоди сигналу спектр шуму. У результаті ми отримаємо спектр очищеного мовного сигналу. Складність даної задачі полягає в тому, що необхідно оцінити спектр шуму, використовуючи суміш мова + шум, яка доступна для обробки. Розглянемо один з класів шумів - адитивні стаціонарні шуми.
Адитивність означає, що шум підсумовується з чистим сигналом y [t] і не залежить від нього: x [t]=y [t] + noise [t].
Стационарность означає, що властивості шуму (потужність, спектральний склад) не змінюються в часі.
Прикладами таких шумів можуть бути постійне шипіння мікрофону або підс...