драхунку правильно розпізнаних речових одиниць, а шляхом проведення спеціального вимірювального експерименту зі звуковими сигналами у вигляді тону і смугового шуму, в ході якого вимірюються рівні відчуттів в декількох смугах частот. Розбірливість мови обчислюють, базуючись на результатах експериментальних вимірювань.
Зважаючи незаперечних переваг об'єктивного методу, а також в силу зазначеного вище принципової подібності ТПР і ТКУИ, в даний час об'єктивний метод в тій чи іншій модифікації застосовують як при оцінці якості каналів зв'язку [], так і при оцінці ефективності захисту мовної інформації [4,5,6]. Тому доцільно докладно розглянути ідею, що лежить в основі розглянутих вище непрямих методів вимірювання розбірливості мови. При цьому доцільно також згадати деякі положення психофізіології мови та слуху, на використанні яких базуються непрямі методи.
2.3 Властивості мовних сигналів, що впливають на розбірливість
Спектральні властивості звуків мови. Спектри голосних звуків являють собою (у першому наближенні) періодичну послідовність спектральних піків. Період проходження цих піків називають частотою основного тону. Виражені сплески рівня «обвідної» спектральних піків іменують «формантами» (малюнок 2.2).
Малюнок 2.2 Вид спектру голосного звуку
Корисна інформація про гласному звуці мови міститься в описі відповідних формант. Прийнято кожну формант описувати її граничними частотами. У російській мові досить обмежитися однією-двома формантами, щоб досягти прийнятної розбірливості мови.
Спектри приголосних звуків або повністю суцільні, тобто зовсім не містять дискретних компонентів, або суцільні в окремих смугах частот. Ці спектри також містять локальні сплески. Деякі з них є формантами, деякі - ні.
Щоб вирішити, які сплески рівня спектра є формантами, слід пам'ятати, що фізична природа формант - явище резонансу в порожнинах глотки і носоглотки (малюнок 2.3).
Малюнок 2.3 Порожнини глотки (1) і носоглотки (2-4)
В окремих звуках можна помітити до 6 спектральних підйомів. До формантам відносяться тільки ті, які обумовлені явищем резонансу в мовному апараті людини. Частина формант (як вказувалося - одна-дві в російській мові) забезпечують розбірливість мови, інша частина забезпечує індивідуальність голосу диктора, що може бути використано в задачах розпізнавання голосу (ідентифікації) диктора.
Форманти звуків мови розташовані в області частот від 200 до 8 600 Гц. Однак переважна частина формант звуків мови знаходиться в межах від 300 до 3000 Гц, тому таку смугу зазвичай вважають достатньою для хорошої розбірливості мови. Спектральні відмінності між звуками мови є головними, хоча і не єдиними. Наприклад, при розпізнаванні приголосних звуків важливі і тимчасові характеристики.
Інтегральні спектральні характеристики мови. Як випливає з назви, інтегральні спектральні характеристики мови характеризують властивості мовного процесу в цілому [1]. Сюди відносять:
- спектр мови;
спектр формант;
відносну зустрічальність формант по спектру.
Спектром мови називають оцінку спектральної щільності потужності мовного сигналу, обчислену по відрізку мовного сигналу значної протяжності (більше хвилини). Спектр мови характеризує розподіл потужності мовного сигналу по частоті.
Спектром формант називають залежність найбільш ймовірного рівня формант від частоти. Щоб оцінити спектр формант, необхідно також розташовувати відрізком мови великої протяжності. Спектр формант на всіх частотах менше спектра мови (малюнок 2.4):
.
Малюнок 2.4 Співвідношення спектра мови і спектра формант [1]
Відносна зустрічальність формант по спектру може бути оцінена так. Розіб'ємо весь діапазон частот на смужки, наприклад, по 100 Гц, і підрахуємо відносне число формант (у%) кожній смужці. Результат такого під?? чета дасть нам криву (малюнок 2.5).
Малюнок 2.5 Відносна зустрічальність формант [1]
2.4 Властивості слуху, що впливають на розбірливість
Для оцінювання розбірливості мови найбільше значення мають такі характеристики слухової системи людини, іменовані «постійними слуху» [1]:
- поріг чутності;
логарифмічна ширина критичної смуги слуху;
маскування слуху.
Поріг чутності - це мінімальна звуковий тиск, нижче якого вухо не сприймає звук (малюнок 2.6). Виражається в децибелах, по відношенню до тиску, який відповідає порогової величиною тиску звуку на частоті 1000 Гц.
Малюнок 2.6 Поріг чутності і больовий поріг [1]
Малюнок 2.7 Критична смуга слуху [1]
...