Через него проходять на Обробка усі командіровку фахівців, что надходять в AutoCAD, Незалежности від того були смороду введені з Клавіатури, міші або через діалогове вікно. У цьом рядку такоже зберігається поточний стан системи (поточна команда). Если Голосовий інтерфейс буде використовуват для спілкування з системою автоматичного проектування цею рядок, то ВІН НЕ буде створюваті Перешкода в работе іншім інтерфейсам. Таким чином, ми отримавших багатомодульній інтерфейс. За Попередніми результатами ДОСЛІДЖЕНЬ предложено концепція использование голосового інтерфейсу в сістемі автоматичного проектування AutoCAD Повністю собі віправдала, ведуться роботи з Подальшого вдосконалення програмного забезпечення та Принципів! Застосування голосового інтерфейсу [8, C. 209].
2. Методика побудова та оцінювання ефектівності голосового інтерфейсу
.1 Попередній аналіз сигналу
Голосовий сигнал, что надійшов з мікрофона, оціфровується и представляет собою набор безлічі значень, число якіх, як правило, колівається від 8000 до 22050 в секунду в залежності від частоти діскретізації сигналу. Отриманий масив даних Із-за вісокої розмірності НЕ прідатній для Подальшого использование в незмінному виде, и того необходимо провести параметрично представлення ціх даних. Параметрично превращение повинною задовольняті НЕ только Вимогами относительно скороченню розмірності даних, а й зберігаті при цьом істотну для розпізнавання інформацію про мови. Крім того, обчіслювані на Основі аудіоданих параметри повінні буті максимально інваріантні до особливую вімові дікторів, гучності мови и наявності шумів. Це дозволити подалі етап АНАЛІЗУ Промови працювати з Даними, Які є компактними, що містять ключові Особливостігри мови и Властивості якіх залішаються незміннімі при зміні диктора або акустічної обстановки.
Ключовий у багатьох системах розпізнавання мови є ПІДХІД до обчислення параметрів голосового сигналу, Заснований на кепстральних аналізі. Кепстральних аналіз можна розглядаті як способ розділення віхідної акустічної Хвилі, утвореної в голосовій щіліні, и Дії голосового тракту, Який за своими властівостямі представляет собою фільтр. Найбільш корисностям є інформація самє про фільтр, тобто про форму голосового тракту в Сейчас. Передбачається, что за цією форми можна візначіті ті, Який звук БУВ вімовленій. Отже, самє Цю часть даних и слід використовуват в якості складових вектора ознакой.
Мел-частотні кепстральні КОЕФІЦІЄНТИ MFCC (Mel-frequency cepstral coefficients) - це Своєрідне уявлення ЕНЕРГІЇ спектра сигналу. Плюси его использование полягають у Наступний:
) вікорістовується спектр сигналу (тобто розкладання по базису ортогональних сінусоїдальніх функцій), что дозволяє враховуваті Хвильового «природу» сигналом при подалі аналізі;
2) спектр проектується на спеціальну mel-шкалу lt; # justify gt; способ обчислення кепстральних Коефіцієнтів представляет собою послідовність з кількох етапів, представлених на рис. 2.1.
Рисунок 2.1 - Процес обчислення Мел-частотних кепстральних Коефіцієнтів
У якості Перший Крок обчислення кепстра розглядається процедура Збільшення ЕНЕРГІЇ в вісокочастотніх сегментах. Необходимость цього Кроку продиктована тім, что вокалізовані сегменти, Такі як, например, голосні, мают Меншем частоту и містять более ЕНЕРГІЇ, чем вісокочастотні сегменти. Така нерівномірність у розподілі ЕНЕРГІЇ по різнім частотам пояснюється Будовий мовного апарату людини. Подолання цього «Спектрального нахилится» (spectral tilt) помощью Збільшення ЕНЕРГІЇ НЕ вокалізірованніх сегментів дозволяє збільшити їх Вагу при розпізнаванні.
Збільшення ЕНЕРГІЇ в ціх сегментах досягається путем! застосування фільтра, Який відсікає постійну ськладової сигналом:
y [n]=x [n]? бx [n? 1]
де б? [0,9; 1], вектор x и y представляються значення сигналів до и после! Застосування фільтра.
Наступний етапом обчислення є розбіття сигналом на фрагменти довжина N відліків и з кроком K відліків. У якості віконної Функції вікорістовується вікна Хеммінга. Результатом такого превращение на i-ой ітерації буде добуток значення сигналів y [n] і значення Функції вікна Хеммінга w [n]:
y [n]=y [n] w [n],
До отриманий фрагментів сигналу застосовується швидке превращение Фур'є:
Далі формується набор фільтрів, Які перекріваються, розташованіх согласно Mel-шкалі, превращение частот Який опісуєть...