ормованості и стиснутий, для полегшення подальшої ОБРОБКИ. Є Різні методи для вилучення корисних параметрів и стиснения вихідних даних в десятки разів без Втрати Корисної информации. Найбільш вікорістовувані методи:
-аналіз Фур'є;
-лінійне передбачення мовлення;
-кепстральніх аналіз.
Мовні кадри. Результатом АНАЛІЗУ сигналом є послідовність мовних кадрів. Зазвічай, КОЖЕН мовної кадр - це результат АНАЛІЗУ сигналом на невеликі відрізку годині (порядку 10 мс.), Что містіть інформацію про Цю ділянку (порядку 20 Коефіцієнтів).
Акустичні моделі. Для АНАЛІЗУ складу мовних кадрів Потрібний набор акустичних моделей. Розглянемо две найбільш пошірені з них.
-Шаблонна модель. У якості акустічної моделі Виступає якімось чином Збереження приклад розпізнаваної структурної одиниці (слова, команди).
-Модель станів. Кожне слово моделюється як послідовність станів вказуючі набор звуків, Які можливо почути в даній ділянці слова, грунтуючись при цьом на ймовірнісніх правилах.
акустично аналіз. Полягає у зіставленні різніх акустичних моделей до шкірного кадру мови и відає матрицю зіставлення послідовності кадрів и безлічі акустичних моделей.
Корекція годині. Вікорістовується для ОБРОБКИ тімчасової варіатівності, что вінікає при вімові слів (например, «розтягування» або «з'їдання» звуків).
Послідовність слів. У результате роботи, система розпізнавання мови відає послідовність (або кілька можливіть послідовностей) слів, яка найбільш ймовірно відпо?? ідає вхідному потоку мови [17].
.4 Огляд продуктов, Які Використовують технології голосового інтерфейсу
) Sphinx - 4 - найвідомішій и найбільш ПРАЦЕЗДАТНИХ з відкритих програмних продуктов для розпізнавання мови на сьогоднішній день. Розробка ведеться в університеті Карнегі-Меллона, пошірюється на условиях Ліцензії Berkley Software Distribution (BSD) i Доступний як для комерційного, так и для некомерційного использование.
Характеристики:
-Дікторонезалежність;
-Розпізнавання злиться мовлення;
-Навчання;
-Наявність Версії для вбудований систем [28].
Існують три основні модулі Структури Sphinx - 4: модуль попередня АНАЛІЗУ (Frontend), декодер (Decoder) i модуль лінгвістичного АНАЛІЗУ (Linguist). Модуль попередня АНАЛІЗУ пріймає одна або более вхідніх сігналів и перетворює їх в послідовність ознакой. Модуль лінгвістичного АНАЛІЗУ переводити будь-який тип стандартної моделі мови, вместе с транскріпціямі зі словника та інформацією про структуру однієї або декількох акустичних моделей, в граф поиска. Модуль пошуку в декодері вікорістовує ознакой з модуля попередня АНАЛІЗУ та графа поиска з модуля лінгвістичного АНАЛІЗУ для виконан фактичного декодування, генеруючими результати. У будь-який момент до або во время процесса розпізнавання, приложение может передаваті управління шкірному з модулів, Які могут помочь процесса розпізнавання.
Коженая елемент на представляет собою модуль, Який может буті легко чинний, что дозволяє досліднікам експеріментуваті з різнімі реалізаціямі модуля без необхідності Зміни других частин системи.
Система Sphinx - 4, як и більшість систем розпізнавання мови, має велику Кількість параметрів, что настроюються, Такі як розмір променя поиска для Поліпшення продуктівності системи. Для налаштування таких параметрів в Sphinx - 4 вікорістовується модуль управління конфігурацією. На Відміну Від других систем управління конфігурацією в Sphinx - 4 дозволяє дінамічно завантажуваті и налаштовуваті модулі во время виконан, что Робить систему Гнучкий и легко підключається. Например, Sphinx - 4, як правило, налаштованості на Попередній аналіз, Який віділяє Мел-кепстральні КОЕФІЦІЄНТИ (MFCC). Вікорістовуючі управління конфігурацією можна переналаштуваті Sphinx - 4 на побудову Іншого АНАЛІЗУ, Який віділяє перцептуальние КОЕФІЦІЄНТИ лінійного передбачення без необхідності змінюваті вихідний код або перекомпілюваті систему.
Щоб дати розробник Додатків можлівість відслідковувати статистику декодера, таку як частота помилок слово, ШВИДКІСТЬ виконан, и использование пам'яті, Sphinx - 4 надає ряд ІНСТРУМЕНТІВ. Як и в решті части системи, інструменти є налаштованості, что дозволяє Користувачами Виконувати широкий спектр системного АНАЛІЗУ. Крім того, інструменти такоже забезпечують інтерактівну середу виконан, что дозволяє Користувачами змінюваті параметри системи во время ее роботи, роблячі доступним швидке експеріментування з різнімі параметрами налаштування.також підтрімує утіліті, Які обробляють результати розпізнавання на Рівні Додатків. Например, ЦІ утіліті отримуються результати решітки, КОЕФІЦІЄНТИ впевненості, и степень розуміння природної мови [32].
) Google Voice Search (компанія «Google»). Ранее поиск застосовувався Виключно в мобільніх прилаштувати. З недавнього годині Голосовий поиск від Google вбудований в брауз...