Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Курсовые проекты » Математичні методи опису мовних сигналів (кореляційні та спектральні характеристики, функція розподілу, пік-фактор)

Реферат Математичні методи опису мовних сигналів (кореляційні та спектральні характеристики, функція розподілу, пік-фактор)





голос, параметри зіниці і сітківки ока, форма і розміри особи і т. д. Одним з перспективних способів аутентифікації особистості є підтвердження або встановлення особи по голосу на основі мовного сигналу людини [1].

Розпізнавання і породження (синтез) мови комп'ютером є, безумовно, важливою проблемою. Десятиліттями вчені та інженери шукали способи, які дозволили б людям спілкуватися з комп'ютером так само, як вони спілкуються між собою, а не змушували людини підлаштовуватися під спосіб спілкування, прийнятний для машини. Багато було зроблено, але, мабуть, і на сьогоднішній день можна вважати, що питання далеко не закритий, хоча саме останнім часом були досягнуті значні успіхи: вже багато років голосові команди є однією з можливих опцій програмного забезпечення персональних комп'ютерів, поява функцій розпізнавання мови вже звичайна справа в ряді текстових процесорів, системи розпізнавання мови працюють там, де потрібно надання довідкових послуг і в системах безпеки.

Запитання цифрової обробки сигналів, окремі галузі математичної статистики, штучного інтелекту (теорії нейронних мереж), пов'язані з розробкою движків і додатків розпізнавання і породження мовлення.

Запитання обробки мови є, головним чином, частиною дисциплін, іменованих цифровою обробкою сигналів і розпізнаванням образів.

Методи цифрової обробки сигналів зазвичай здійснюють перетворення, очищення і трансформацію звукового сигналу в цифровий формат даних і інші уявлення, які можуть безпосередньо оброблятися системою розпізнавання мови. Ці завдання включають також фільтрацію шумових сигналів, які домішуються до звуку при передачі акустичних сигналів від сприймають пристроїв (мікрофонів) або по мережі. Методи ж розпізнавання образів використовують при виділенні і розпізнаванні окремих слів чи пропозицій мовного потоку або в деяких випадках для ідентифікації мовця.

Крім того, системи розпізнавання і синтезу мови зачіпають питання лінгвістики, в якій закладені фундаментальні концепції та принципи розпізнавання мови і розуміння мови.

Синтез усного мовлення - це перетворення заздалегідь не відомої текстової інформації в мову. Речовий висновок інформації - це реалізація мовного інтерфейс, для спрощення використання системи. Фактично, завдяки синтезу мови надається ще один канал передачі даних від комп'ютера, мобільного телефону до людини, аналогічно монітора.

Технологія синтезу усного мовлення знайшла широке застосування для людей, що мають проблеми із зором. Для всіх інших вона створює новий вимір зручності користування технікою і значно знижує навантаження на зір, на нервову систему, дозволяє задіяти слухову пам'ять.

Будь-який текст складається з слів, розділених пробілами та розділовими знаками. Проголошення слів залежить від їх розташування в реченні, а інтонація фрази - від розділових знаків. Нарешті, проголошення залежить і від сенсу слова! Відповідно, для того щоб синтезоване мовлення звучала натурально, необхідно вирішити цілий комплекс завдань, пов'язаних як із забезпеченням природності голосу на рівні плавності звучання і інтонації, так і з правильною розстановкою наголосів, розшифровкою скорочень, чисел, абревіатур і спеціальних знаків з урахуванням особливостей граматики російської мови.

Існує декілька підходів до вирішення поставлених завдань:

системи аллофон синтезу - забезпечують стабільне, але недостатньо природне, роботизоване звучання;

системи, засновані на підході Unit Selection - забезпечують набагато більш природне звучання, однак можуть містити фрагменти мови з різкими провалами якості, аж до втрати розбірливості;

гібридна технологія, заснована на підході Unit Selection і доповнена одиницями аллофон синтезу.

На основі цієї технології була створена система VitalVoice, яка забезпечує стабільне і природне звучання на акустичному рівні.

Мовне спілкування є природним і зручним для людини. Завдання розпізнавання мови полягає в тому, що б прибрати посередника у спілкуванні людини і комп'ютера. Керування машиною голосом у реальному часі, а також введення інформації за допомогою людської мови набагато спростить життя сучасної людини. Навчити машину розуміти без посередника ту мову, якою говорять між собою люди - завдання розпізнавання мови.

Вчені й інженери вже багато років вирішують проблему мовного спілкування людини і машини. Перший пристрій для розпізнавання мови з'явилося в 1952 році, воно могло розпізнавати вимовлені людиною цифри. Комерційні програми з розпізнавання мови з'явилися на початку дев'яностих років.

Всі системи розпізнавання мови можна розділити на два класи:

) Систем...


Назад | сторінка 2 з 6 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Сучасні технології розпізнавання мови
  • Реферат на тему: Досвід розробки моделі розпізнавання російської мови з надвеликим словником
  • Реферат на тему: Розробка програмного забезпечення системи синтезу парадигм слів англійської ...
  • Реферат на тему: Розпізнавання ключових слів у потоці мовлення за допомогою фонетичного стен ...
  • Реферат на тему: Системи розпізнавання образів