голос, параметри зіниці і сітківки ока, форма і розміри особи і т. д. Одним з перспективних способів аутентифікації особистості є підтвердження або встановлення особи по голосу на основі мовного сигналу людини [1].
Розпізнавання і породження (синтез) мови комп'ютером є, безумовно, важливою проблемою. Десятиліттями вчені та інженери шукали способи, які дозволили б людям спілкуватися з комп'ютером так само, як вони спілкуються між собою, а не змушували людини підлаштовуватися під спосіб спілкування, прийнятний для машини. Багато було зроблено, але, мабуть, і на сьогоднішній день можна вважати, що питання далеко не закритий, хоча саме останнім часом були досягнуті значні успіхи: вже багато років голосові команди є однією з можливих опцій програмного забезпечення персональних комп'ютерів, поява функцій розпізнавання мови вже звичайна справа в ряді текстових процесорів, системи розпізнавання мови працюють там, де потрібно надання довідкових послуг і в системах безпеки.
Запитання цифрової обробки сигналів, окремі галузі математичної статистики, штучного інтелекту (теорії нейронних мереж), пов'язані з розробкою движків і додатків розпізнавання і породження мовлення.
Запитання обробки мови є, головним чином, частиною дисциплін, іменованих цифровою обробкою сигналів і розпізнаванням образів.
Методи цифрової обробки сигналів зазвичай здійснюють перетворення, очищення і трансформацію звукового сигналу в цифровий формат даних і інші уявлення, які можуть безпосередньо оброблятися системою розпізнавання мови. Ці завдання включають також фільтрацію шумових сигналів, які домішуються до звуку при передачі акустичних сигналів від сприймають пристроїв (мікрофонів) або по мережі. Методи ж розпізнавання образів використовують при виділенні і розпізнаванні окремих слів чи пропозицій мовного потоку або в деяких випадках для ідентифікації мовця.
Крім того, системи розпізнавання і синтезу мови зачіпають питання лінгвістики, в якій закладені фундаментальні концепції та принципи розпізнавання мови і розуміння мови.
Синтез усного мовлення - це перетворення заздалегідь не відомої текстової інформації в мову. Речовий висновок інформації - це реалізація мовного інтерфейс, для спрощення використання системи. Фактично, завдяки синтезу мови надається ще один канал передачі даних від комп'ютера, мобільного телефону до людини, аналогічно монітора.
Технологія синтезу усного мовлення знайшла широке застосування для людей, що мають проблеми із зором. Для всіх інших вона створює новий вимір зручності користування технікою і значно знижує навантаження на зір, на нервову систему, дозволяє задіяти слухову пам'ять.
Будь-який текст складається з слів, розділених пробілами та розділовими знаками. Проголошення слів залежить від їх розташування в реченні, а інтонація фрази - від розділових знаків. Нарешті, проголошення залежить і від сенсу слова! Відповідно, для того щоб синтезоване мовлення звучала натурально, необхідно вирішити цілий комплекс завдань, пов'язаних як із забезпеченням природності голосу на рівні плавності звучання і інтонації, так і з правильною розстановкою наголосів, розшифровкою скорочень, чисел, абревіатур і спеціальних знаків з урахуванням особливостей граматики російської мови.
Існує декілька підходів до вирішення поставлених завдань:
системи аллофон синтезу - забезпечують стабільне, але недостатньо природне, роботизоване звучання;
системи, засновані на підході Unit Selection - забезпечують набагато більш природне звучання, однак можуть містити фрагменти мови з різкими провалами якості, аж до втрати розбірливості;
гібридна технологія, заснована на підході Unit Selection і доповнена одиницями аллофон синтезу.
На основі цієї технології була створена система VitalVoice, яка забезпечує стабільне і природне звучання на акустичному рівні.
Мовне спілкування є природним і зручним для людини. Завдання розпізнавання мови полягає в тому, що б прибрати посередника у спілкуванні людини і комп'ютера. Керування машиною голосом у реальному часі, а також введення інформації за допомогою людської мови набагато спростить життя сучасної людини. Навчити машину розуміти без посередника ту мову, якою говорять між собою люди - завдання розпізнавання мови.
Вчені й інженери вже багато років вирішують проблему мовного спілкування людини і машини. Перший пристрій для розпізнавання мови з'явилося в 1952 році, воно могло розпізнавати вимовлені людиною цифри. Комерційні програми з розпізнавання мови з'явилися на початку дев'яностих років.
Всі системи розпізнавання мови можна розділити на два класи:
) Систем...