Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Статьи » Дослідження ефектівності! Застосування марковських ПРИХОВАНЕ моделей для побудова голосових компонент інтерфейсу користувача з програмним Додатками

Реферат Дослідження ефектівності! Застосування марковських ПРИХОВАНЕ моделей для побудова голосових компонент інтерфейсу користувача з програмним Додатками





с для взаємодії з електронною технікою [6, С. 112].

Системи розпізнавання мови - це системи, что аналізують акустично сигнал алгоритмами, засновання на різноманітніх теоріях, что пріпускають, Які характеристики мовного сигналу створюють Відчуття звуків даної мови, и математичних методах, з тією чи іншою точністю, что віділяють значущі параметри акустично сигналом и превращаются его в різній повноті в необхідну форму.

Практично всі відомі методи розпізнавання мови мают ряд основних загально властівостей:

) Для розпізнавання вікорістовується метод порівняння з ЕТАЛОН;

) Сигнал может буті уявлень або у виде безперервної Функції годині, або у виде слова в Деяк кінцевому алфавіті;

) Для скороченню ОБСЯГИ Обчислення Використовують методи дінамічного программирования. Дінамічне программирования (ДП) - метод вирішенню Завдання путем складання послідовності з підзадач таким чином, что:

) Перший елемент послідовності (можливо кілька елементів) має трівіальне решение

) Последний елемент цієї послідовності - це віхідна завдання

) Кожна задача цієї послідовності может буті вірішена з використанн решение підзадач з меншими номерами.

Методи розпізнавання мови можна розділіті на две Великі групи: непараметрічні - з використанн непараметрічніх мір блізькості до еталонів (до них можна Віднести методи на Основі формальних Граматик и методи на Основі метрик на безлічі мовних сігналів) - и параметрічні (ймовірнісні - на Основі методу ПРИХОВАНЕ моделей Маркова, нейромережеві).

Непараметрічні методи, засновані на заходь блізькості на безлічі голосових сігналів. Метод Вінцюка [3], Заснований на методі дінамічного программирования (Беллман Р. [1], Ітакура Ф. [11] та іншімі) дозволивши скоротіті годину обчислення значень Функції блізькості до ЕТАЛОН сігналів, з експоненціального (від Довжина сигналу) до квадратичного. В силу того, что основною спеціфікою методу є нелінійне спотворення тімчасової осі однієї з порівнюваніх функцій, метод получил Назву «дінамічна деформації годині». До достоїнств відносяться простота его реализации та навчання. До недоліків можна Віднести складність обчислення Міри блізькості, яка пропорційна квадрату Довжина сигналу, и великий ОБСЯГИ пам'яті, необхідній для зберігання еталонів команд - пропорційній довжіні сигналом та кількістю команд в словнику.

Параметрічні - методи, застосовувані до задачі розпізнавання мови в Сейчас годину, були Вперше запропоновані обертав свої американских дослідніків (Бейкер [9] и Джелінек [4]) в 1970-ті роки Минулого століття. У них застосовується теорія ПРИХОВАНЕ моделей Маркова - двічі стохастичні процеси та ланцюга Маркова за переходах между станами и безлічі стаціонарних процесів в шкірному стані ланцюга.

Класіфікацію систем розпізнавання мови слід початиться з визначення основних аспектів ціх систем. До таких аспектів можна Віднести:

Розмір словника. Чім більшій розмір словника, з яким працює система розпізнавання мови, тім более частота з'явиться помилок при розпізнаванні слів. Для порівняння, словник, складається только з цифр, может буті розпізнаній практично безпомілково, тоді як частота з'явиться помилок при розпізнаванні словника в сто тисяч слів может досягаті 45%, альо нужно такоже враховуваті унікальність слів у словнику. Если слова очень схожі одна на одного, то похібка розпізнавання збільшується.

Дікторозалежність. Існують дікторозалежні и дікторонезалежні системи розпізнавання мови. Дікторозалежна система призначен для роботи только з одним користувачем (ЛЮДИНОЮ, яка Навчаюсь Цю систему), в тій годину як дікторонезалежна система призначен для роботи з будь-яким диктором. Альо создания по-Справжня дікторонезалежної системи - очень трудомістке Завдання. На поточному етапі розвитку систем розпізнавання мови, частота з'явиться помилок в дікторонезалежніх системах в 3-5 разів более, чем в дікторозалежніх.

злиться або РОЗДІЛЬНА мова. Мову диктора умовно можна розділіті на злить и роздільну. Роздільна - це мова, в Якій слова відокремлюються Одне від одного спеціальною паузи (проміжком тиші). Злиться мова - це природно вімовлені речення. Розпізнавання злиться мовлення складніше, так як у вімовленіх слів немає чіткіх границь.

Структурні одиниці. У якості структурних одиниць могут віступаті фрази, слова, фонеми, діфоні, алофон. Системи, Які розпізнають мову, вікорістовуючі цілі слова або фрази, назіваються системами розпізнавання мови за шаблоном. Смороду, як правило, дікторозалежні и їх создания Менш трудомістке, чем создания систем, Які розпізнають мову на базі віділення лексічніх елементів. У таких системах структурними Одиниця мови є лексічні елементи (фонеми, діфоні, алофон).

Принцип віділення структурних одиниць. У СУЧАСНИХ системах розпізнавання мови вікорістовується кілька підходів для віділення з потоку мови структурних одиниць. Найпошіренішій ПІДХІД Заснований на перетворен...


Назад | сторінка 9 з 23 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Сучасні технології розпізнавання мови
  • Реферат на тему: Досвід розробки моделі розпізнавання російської мови з надвеликим словником
  • Реферат на тему: Розпізнавання ключових слів у потоці мовлення за допомогою фонетичного стен ...
  • Реферат на тему: Історія систем розпізнавання образів
  • Реферат на тему: Системи розпізнавання образів