днієї сотні.
. Розпізнавання команд російською мовою
пофонемное розпізнавання команд може бути організовано на підставі прихованих Марковських моделей. У цьому випадку розпізнавання можливо тільки для одного конкретного мови, для якого вже розроблено відповідні акустичні моделі.
Головними перевагами цього підходу є те, що словник надійно розпізнаються команд може значно перевищувати 100 одиниць (аж до тисячі), а для додавання нової команди, яка буде розпізнаватися, достатньо лише ввести її в текстовому вигляді з клавіатури.
. Виділення ключових слів в потоці мови
У сучасному світі найбільш актуальним завданням є не збереження інформації, а організація ефективного пошуку в ній. Якщо для текстової інформації існує велика кількість різних рішень, то пошук в мовних архівах або потоках мови в режимі реального часу - набагато менш розроблена область.
Технологія виділення ключових слів на основі пофонемного розпізнавання дозволяє автоматично знаходити в мові слова і словосполучення, що представляють інтерес для користувача. При цьому слова для пошуку вводяться в текстовому вигляді з клавіатури - ніякої тренування системи голосом не потрібно.
. Розпізнавання на основі граматик
Розпізнавання мови на основі граматик знаходить широке застосування в системах з діалогової структурою спілкування користувача з автоматичною системою (наприклад, системи голосового самообслуговування для колл-центрів).
За допомогою граматик можна задати структуру діалогу і змоделювати спілкування людини з комп'ютером. Граматика у своєму найпростішому вигляді являє собою просто набір слів - в цьому випадку реалізується схема розпізнавання голосових команд.
. Розпізнавання злитої російської мови
Розпізнавання злитої спонтанної мови - кінцева мета всіх зусиллі по розпізнаванню мови. Це складна і багатогранне завдання. В даний час існують системи, орієнтовані на розпізнавання злитої промови для декількох найбільш поширених мов (в першу чергу англійської).
Тим не менш, не існує систем, що здійснюють якісне розпізнавання злитої промови без будь-яких обмежень. Такими обмеженнями є рівень навколишнього шуму, канал передачі мовної інформації, теми розпізнаваного розмови. Розпізнавання злитої російської мови - особливо складне завдання на увазі особливостей російської мови (висока флективно, вільний порядок слів). Застосування підходів, розроблених для англійської мови, в більшості випадків виявляється досить малоефективним. Тим не менш, в ЦРТ розроблений прототип подібної системи, який реалізує всі необхідні програмні компоненти: акустичні та мовні моделі російської мови, а також ефективний однопрохідний декодер.
4. Класифікація та аналіз акустичних шумів у кабіні літального апарату, розробка контрольного генератора
Малюнок 4.1 Класифікація шумів
У наступному розділі представлено побудову в середовищі Matlab моделі елементів відомої методики вимірювання розбірливості мови по відносинам сигнал-шум в декількох смугах частот, що перекривають частотний діапазон мовного сигналу [1,2].
4.1 Формування шумів
Для аналізу ефективності шумозаглушення необхідно в модельному експерименті вміти відтворювати не тільки мовні (корисні) сигнали, але і шуми (заважають впливу). Для моделювання шумів можливо два варіанти:
. Використання фрагментів реальних шумів, керованих за рівнем (рисунок 4.2);
. Формування шумів на базі «білого шуму» з різними варіантами формування спектра.
Малюнок 4.2 Структурна схема використання фрагментів реальних шумів в суміші з корисним сигналом
Припустимо, що мовний сигнал заздалегідь вводять в комп'ютер за допомогою звукової карти. Параметри мовного сигналу - пікова напруга не вище 1 В, тривалість - від декількох одиниць до декількох десятків секунд. Режим введення мовного сигналу: моно, частота дискретизації 8000 Гц.
Контрольовані параметри:
1) відношення сигнал-шум у всій смузі частот
,
де і - дисперсії сигналу і шуму, відповідно;
2) характер (забарвленість) шуму: білий, рожевий (спад спектра потужності зі швидкістю 3 дБ/октаву), коричневий (спад спектра потужності зі швидкістю 6 дБ/октаву).
Вимірювані параметри:
1) парціальні відносини сигнал шум на виході гребінки фільтрів, що перекривають частотний діапазон мовного сигналу;
2) артикуляційна розбірл...