Теми рефератів

> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти

Реферати, твори, дипломи, практика » Статьи » Дослідження ефектівності! Застосування марковських ПРИХОВАНЕ моделей для побудова голосових компонент інтерфейсу користувача з програмним Додатками

Реферат Дослідження ефектівності! Застосування марковських ПРИХОВАНЕ моделей для побудова голосових компонент інтерфейсу користувача з програмним Додатками

Тема: Статьи

Через него проходять на Обробка усі командіровку фахівців, что надходять в AutoCAD, Незалежности від того були смороду введені з Клавіатури, міші або через діалогове вікно. У цьом рядку такоже зберігається поточний стан системи (поточна команда). Если Голосовий інтерфейс буде використовуват для спілкування з системою автоматичного проектування цею рядок, то ВІН НЕ буде створюваті Перешкода в работе іншім інтерфейсам. Таким чином, ми отримавших багатомодульній інтерфейс. За Попередніми результатами ДОСЛІДЖЕНЬ предложено концепція использование голосового інтерфейсу в сістемі автоматичного проектування AutoCAD Повністю собі віправдала, ведуться роботи з Подальшого вдосконалення програмного забезпечення та Принципів! Застосування голосового інтерфейсу [8, C. 209].

2. Методика побудова та оцінювання ефектівності голосового інтерфейсу

.1 Попередній аналіз сигналу

Голосовий сигнал, что надійшов з мікрофона, оціфровується и представляет собою набор безлічі значень, число якіх, як правило, колівається від 8000 до 22050 в секунду в залежності від частоти діскретізації сигналу. Отриманий масив даних Із-за вісокої розмірності НЕ прідатній для Подальшого использование в незмінному виде, и того необходимо провести параметрично представлення ціх даних. Параметрично превращение повинною задовольняті НЕ только Вимогами относительно скороченню розмірності даних, а й зберігаті при цьом істотну для розпізнавання інформацію про мови. Крім того, обчіслювані на Основі аудіоданих параметри повінні буті максимально інваріантні до особливую вімові дікторів, гучності мови и наявності шумів. Це дозволити подалі етап АНАЛІЗУ Промови працювати з Даними, Які є компактними, що містять ключові Особливостігри мови и Властивості якіх залішаються незміннімі при зміні диктора або акустічної обстановки.

Ключовий у багатьох системах розпізнавання мови є ПІДХІД до обчислення параметрів голосового сигналу, Заснований на кепстральних аналізі. Кепстральних аналіз можна розглядаті як способ розділення віхідної акустічної Хвилі, утвореної в голосовій щіліні, и Дії голосового тракту, Який за своими властівостямі представляет собою фільтр. Найбільш корисностям є інформація самє про фільтр, тобто про форму голосового тракту в Сейчас. Передбачається, что за цією форми можна візначіті ті, Який звук БУВ вімовленій. Отже, самє Цю часть даних и слід використовуват в якості складових вектора ознакой.

Мел-частотні кепстральні КОЕФІЦІЄНТИ MFCC (Mel-frequency cepstral coefficients) - це Своєрідне уявлення ЕНЕРГІЇ спектра сигналу. Плюси его использование полягають у Наступний:

) вікорістовується спектр сигналу (тобто розкладання по базису ортогональних сінусоїдальніх функцій), что дозволяє враховуваті Хвильового «природу» сигналом при подалі аналізі;

2) спектр проектується на спеціальну mel-шкалу lt; # justify gt; способ обчислення кепстральних Коефіцієнтів представляет собою послідовність з кількох етапів, представлених на рис. 2.1.

Рисунок 2.1 - Процес обчислення Мел-частотних кепстральних Коефіцієнтів

У якості Перший Крок обчислення кепстра розглядається процедура Збільшення ЕНЕРГІЇ в вісокочастотніх сегментах. Необходимость цього Кроку продиктована тім, что вокалізовані сегменти, Такі як, например, голосні, мают Меншем частоту и містять более ЕНЕРГІЇ, чем вісокочастотні сегменти. Така нерівномірність у розподілі ЕНЕРГІЇ по різнім частотам пояснюється Будовий мовного апарату людини. Подолання цього «Спектрального нахилится» (spectral tilt) помощью Збільшення ЕНЕРГІЇ НЕ вокалізірованніх сегментів дозволяє збільшити їх Вагу при розпізнаванні.

Збільшення ЕНЕРГІЇ в ціх сегментах досягається путем! застосування фільтра, Який відсікає постійну ськладової сигналом:

y [n]=x [n]? бx [n? 1]

де б? [0,9; 1], вектор x и y представляються значення сигналів до и после! Застосування фільтра.

Наступний етапом обчислення є розбіття сигналом на фрагменти довжина N відліків и з кроком K відліків. У якості віконної Функції вікорістовується вікна Хеммінга. Результатом такого превращение на i-ой ітерації буде добуток значення сигналів y [n] і значення Функції вікна Хеммінга w [n]:

y [n]=y [n] w [n],

До отриманий фрагментів сигналу застосовується швидке превращение Фур'є:

Далі формується набор фільтрів, Які перекріваються, розташованіх согласно Mel-шкалі, превращение частот Який опісуєть...

Назад | сторінка 13 з 23 | Наступна сторінка

Схожі реферати:

Реферат на тему: Обчислення параметрів випадкового цифрового сигналу та визначення його інфо ...

Реферат на тему: Аналіз проходження періодичного сигналу через LC-фільтр з втратами

Реферат на тему: Практична обробка безлічі даних, що представляють собою масив покажчиків на ...

Реферат на тему: Інженерне проектування багатофункціонального пристрою Еpson Stylus TX119 з ...

Український реферат переглянуто разів: | Коментарів до українського реферату:

Коментарів до українського реферату: 0