Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Статьи » Дослідження ефектівності! Застосування марковських ПРИХОВАНЕ моделей для побудова голосових компонент інтерфейсу користувача з програмним Додатками

Реферат Дослідження ефектівності! Застосування марковських ПРИХОВАНЕ моделей для побудова голосових компонент інтерфейсу користувача з програмним Додатками





Через него проходять на Обробка усі командіровку фахівців, что надходять в AutoCAD, Незалежности від того були смороду введені з Клавіатури, міші або через діалогове вікно. У цьом рядку такоже зберігається поточний стан системи (поточна команда). Если Голосовий інтерфейс буде використовуват для спілкування з системою автоматичного проектування цею рядок, то ВІН НЕ буде створюваті Перешкода в работе іншім інтерфейсам. Таким чином, ми отримавших багатомодульній інтерфейс. За Попередніми результатами ДОСЛІДЖЕНЬ предложено концепція использование голосового інтерфейсу в сістемі автоматичного проектування AutoCAD Повністю собі віправдала, ведуться роботи з Подальшого вдосконалення програмного забезпечення та Принципів! Застосування голосового інтерфейсу [8, C. 209].



2. Методика побудова та оцінювання ефектівності голосового інтерфейсу


.1 Попередній аналіз сигналу


Голосовий сигнал, что надійшов з мікрофона, оціфровується и представляет собою набор безлічі значень, число якіх, як правило, колівається від 8000 до 22050 в секунду в залежності від частоти діскретізації сигналу. Отриманий масив даних Із-за вісокої розмірності НЕ прідатній для Подальшого использование в незмінному виде, и того необходимо провести параметрично представлення ціх даних. Параметрично превращение повинною задовольняті НЕ только Вимогами относительно скороченню розмірності даних, а й зберігаті при цьом істотну для розпізнавання інформацію про мови. Крім того, обчіслювані на Основі аудіоданих параметри повінні буті максимально інваріантні до особливую вімові дікторів, гучності мови и наявності шумів. Це дозволити подалі етап АНАЛІЗУ Промови працювати з Даними, Які є компактними, що містять ключові Особливостігри мови и Властивості якіх залішаються незміннімі при зміні диктора або акустічної обстановки.

Ключовий у багатьох системах розпізнавання мови є ПІДХІД до обчислення параметрів голосового сигналу, Заснований на кепстральних аналізі. Кепстральних аналіз можна розглядаті як способ розділення віхідної акустічної Хвилі, утвореної в голосовій щіліні, и Дії голосового тракту, Який за своими властівостямі представляет собою фільтр. Найбільш корисностям є інформація самє про фільтр, тобто про форму голосового тракту в Сейчас. Передбачається, что за цією форми можна візначіті ті, Який звук БУВ вімовленій. Отже, самє Цю часть даних и слід використовуват в якості складових вектора ознакой.

Мел-частотні кепстральні КОЕФІЦІЄНТИ MFCC (Mel-frequency cepstral coefficients) - це Своєрідне уявлення ЕНЕРГІЇ спектра сигналу. Плюси его использование полягають у Наступний:

) вікорістовується спектр сигналу (тобто розкладання по базису ортогональних сінусоїдальніх функцій), что дозволяє враховуваті Хвильового «природу» сигналом при подалі аналізі;

2) спектр проектується на спеціальну mel-шкалу lt; # justify gt; способ обчислення кепстральних Коефіцієнтів представляет собою послідовність з кількох етапів, представлених на рис. 2.1.


Рисунок 2.1 - Процес обчислення Мел-частотних кепстральних Коефіцієнтів


У якості Перший Крок обчислення кепстра розглядається процедура Збільшення ЕНЕРГІЇ в вісокочастотніх сегментах. Необходимость цього Кроку продиктована тім, что вокалізовані сегменти, Такі як, например, голосні, мают Меншем частоту и містять более ЕНЕРГІЇ, чем вісокочастотні сегменти. Така нерівномірність у розподілі ЕНЕРГІЇ по різнім частотам пояснюється Будовий мовного апарату людини. Подолання цього «Спектрального нахилится» (spectral tilt) помощью Збільшення ЕНЕРГІЇ НЕ вокалізірованніх сегментів дозволяє збільшити їх Вагу при розпізнаванні.

Збільшення ЕНЕРГІЇ в ціх сегментах досягається путем! застосування фільтра, Який відсікає постійну ськладової сигналом:


y [n]=x [n]? бx [n? 1]


де б? [0,9; 1], вектор x и y представляються значення сигналів до и после! Застосування фільтра.

Наступний етапом обчислення є розбіття сигналом на фрагменти довжина N відліків и з кроком K відліків. У якості віконної Функції вікорістовується вікна Хеммінга. Результатом такого превращение на i-ой ітерації буде добуток значення сигналів y [n] і значення Функції вікна Хеммінга w [n]:


y [n]=y [n] w [n],


До отриманий фрагментів сигналу застосовується швидке превращение Фур'є:



Далі формується набор фільтрів, Які перекріваються, розташованіх согласно Mel-шкалі, превращение частот Який опісуєть...


Назад | сторінка 13 з 23 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Обчислення параметрів випадкового цифрового сигналу та визначення його інфо ...
  • Реферат на тему: Аналіз проходження періодичного сигналу через LC-фільтр з втратами
  • Реферат на тему: Аналіз проходження періодичного сигналу через LC-фільтр з втратами
  • Реферат на тему: Практична обробка безлічі даних, що представляють собою масив покажчиків на ...
  • Реферат на тему: Інженерне проектування багатофункціонального пристрою Еpson Stylus TX119 з ...