Частоту основного тону будемо оцінювати за допомогою методики, заснованої на визначенні мінімуму нев'язки коефіцієнтів кореляції [9].
Невязка визначається між значеннями коефіцієнтів кореляції, отриманими на основі експериментальних даних, і коефіцієнтів тестової (спеціальної для оцінки основного тону) математичної моделі мови, що містить вокалізованих ділянки. Оцінка частоти основного тону f0 визначається як значення аргументу, при якому спостерігається найменше значення нев'язки в діапазоні частот
тут тестова нев'язка (помилка):
де - коефіцієнт кореляції тестової математичної моделі мовного сигналу, застосовуваний для оцінки частоти основного тону, спрощений вигляд якого:
З використанням даної оригінальної методики стає можливим без застосування складних алгоритмів обчислення отримати високоточну оцінку частоти основного тону мовного сигналу (що містить вокалізованих ділянки мови).
Розрахуємо коефіцієнти моделі, для цього згідно з методом найменших квадратів мінімізуємо помилку моделі R? (5), прирівнявши до нуля першу похідні R? по кожному з коефіцієнтів, внаслідок одержимо наступну систему, що складається з рівнянь:
Рівняння даної системи являють собою поліноми 4-го ступеня, внаслідок чого система однозначного рішення не має. Покладемо, що енергія однакового мовного матеріалу - величина постійна (Ea=const), при використанні цього допущення система нелінійних рівнянь (12), що складається з поліномів четвертого ступеня, зводиться до лінійної (через постійне знаменника у виразі (6) для Ra ( ?) і має однозначне рішення (при введенні зручної заміни змінних.
Як приклад застосування розробленої математичної моделі (3) для задач аутентифікації по голосу будемо використовувати мовний матеріал у вигляді слова «він», що складається з одного голосного звуку [о] і одного сонорного приголосного звука [н]. При заданих параметрах:=6000 Гц;
- були отримані наступні сім коефіцієнтів моделі, що відображають індивідуальні особливості голосу:. При цьому помилка моделі склала R? =1,086. Чисельний порівняльний аналіз показує, що нормована АКФ моделі сигналу (3) досить точно апроксимує КК мовного сигналу. Дана обставина вказує на придатність запропонованої моделі до опису голосних і сонорних приголосних звуків.
При використанні запропонованої моделі мовного сигналу (3) необхідно обчислення і зберігання в банку даних семи коефіцієнтів, що входять в модель сигналу (3), для кожного з верифікованих дикторів.
Коефіцієнти розробленої моделі (для 0?=20 Гц), з точністю до постійного множника, практично збігаються з коефіцієнтами моделі у вигляді імпульсу АМ коливання з декількома несучими частотами [7] (при однакових енергіях сигналів двох моделей ). Таким чином, можна простежити досить точну взаємозв'язок між коефіцієнтами математичних моделей мовного сигналу, в одній з яких міститься параметр мовного сигналу у вигляді кінцевої тривалості і? [7], а в іншій (3) цей параметр відсутній, так, модулирующее коливання являє собою швидко загасаючу осцилюючу функцію виду xx) sin (. Відносні неузгодженості між коефіцієнтами першої та другої моделей відповідно рівні:. Як видно з результатів аналізу, для коефіцієнтів неузгодженість не перевищує 1%. Неузгодженість між амплітудами низькочастотної складової (нульовий коефіцієнт) двох моделей у вигляді 39% обумовлено структурою другої моделі (без обліку тривалості). Однак в задачах аутентифікації особистості по голосу внесок даного нульового коефіцієнта порівняно малий щодо решти п'яти амплітудних коефіцієнтів, і дану модель (3) можна використовувати для задач ідентифікації та верифікації, особливо (зважаючи простої форми моделі) на етапах попереднього аналізу.
Слід зазначити, що запропонована математична модель мовного сигналу адекватно і з високим ступенем точності описує вокалізованих ділянки мови, при цьому модель є досить простою в аналізі та розрахунку її істотних параметрів, чітко простежується її фізичний зміст. Запропоновану математичну модель мовного сигналу (3) доцільно застосовувати в тих випадках, коли утруднена оцінка тривалості виголошення контрольного мовного матеріалу, т. Е. Загасаюча обвідна модулюючого (інформаційні) коливання дає можливість без оцінки тривалості мовного сигналу здійснювати адекватний опис вокалізованих ділянок мови.
Таким чином, розроблена методика розрахунку параметрів математичних моделей мовного сигналу, заснованих на апроксимації спектра набором постійних складових у відповідних смугах частот. Запропонована модель мовного сигналу (3) для аутентифікації особистості по голосу адекватно описує мовні сигнали, що містять вокалізованих ділянки...