ь коефіцієнтів моделі та її простота, виконання даних вимог сприяє зменшенню систематичної помилки і часу обробки даних, що надійшли.
Таким чином, являє науковий інтерес розробка моделей мовного сигналу, що відображають індивідуальні особливості голосу людини, його унікальність при проголошенні мовного повідомлення.
Відомо, що найбільш ефективно проведення верифікації та ідентифікації особистості по голосу на основі мовного матеріалу, що містить вокалізованих ділянки мови, а саме голосні звуки [10].
Зазначимо, що однією з найпростіших форм опису мовних сигналів є представлення спектра у вигляді набору постійних складових у відповідних смугах частот, якими зазвичай є формантного частоти [11]. Даний спосіб опису мовних сигналів успішно застосовується для задач ідентифікації та верифікації диктора по голосу [11].
Речовий матеріал, використовуваний для аутентифікації особистості по голосу, містить вокалізованих ділянки мови. Тому для побудови математичної моделі мовного сигналу у вигляді деякої залежності від часу будемо використовувати підхід, заснований на виділенні модулирующей (інформаційної) і модулируемой (несучої) компонент [3, 9].
Скористаємося детермінованим підходом до побудови математичної моделі (мовного сигналу, що містить вокалізованих ділянки мови), заснованої на теорії модуляції. Ап?? роксіміруем спектральну щільність мовного сигналу набором постійних складових у смугах частот шириною в околиці несучих частот (постійної складової частоти, частоти основного тону і частот обертонів мовного сигналу.
Математичну модель мовного сигналу у вигляді детермінованої функції (в явному вигляді залежить від часу) отримаємо, обчисливши зворотне перетворення Фур'є від спектральної щільності (1). У результаті математичну модель можна привести до вигляду:
Слід зазначити важливий окреме моделі (2) при виконанні умов:
) (частоти обертонів кратні частоті основного тону);
) (смуги частот рівні між собою по ширині);
при даних допущених математична модель спрощується, перетворюючись до вигляду:
Зі співвідношення (3) видно, що дана математична модель мовного сигналу є амплітудно-модульованим коливанням:
в якому можна умовно виділити: [безрозмірна величина] - модулюючий коливання і [В] - несе коливання.
Глава 2. Експериментальна частина
Розрахуємо коефіцієнти запропонованої математичної моделі (3) мовного сигналу. Для розрахунку коефіцієнтів, що входять в модель (3), будемо використовувати персональну ЕОМ, введення мовного сигналу в яку виконується за допомогою звукової плати зі стандартною частотою дискретизації df=6000 Гц. Дана частота була обрана внаслідок того, що перші 3-4 форманти знаходяться в області до 3000-3600 Гц [2]. Звукові плати ЕОМ, як правило, додають різні постійні складові в мовний сигнал.
У зв'язку з цим проводилася операція центрування реалізації:
,
де ix [В] - початкові відліки мовного сигналу;- математичне очікування; N - число відліків.
Тривалість імпульсу (час виголошення пральний фрази) була задана=0,3 с, при даному інтервалі дискретизації мовний сигнал має N=+1800 відліків.
Для визначення коефіцієнтів моделі (3) в якості ступеня невідповідності моделі і оригіналу була прийнята помилка моделі між коефіцієнтами кореляції [безрозмірна величина] центрированного мовного сигналу і значеннями нормованої автокореляційної функції [безрозмірна величина] математичної моделі (3):
де
; тут функція кореляції (ФК) мовного сигналу:
J - число відліків КК (для центрованої реалізації 0=y); нормована:
де Ka (?) [В2? с] - АКФ моделі мовного сигналу, яка розраховується за допомогою зворотного перетворення Фур'є від спектральної щільності енергії. Для моделі (3) мовного сигналу отримаємо для 0? ?:
- енергія математичної моделі мовного сигналу.
Визначимо число відліків коефіцієнтів кореляції J, достатню для отримання адекватних характеристик моделі. Аналіз мовних сигналів різних дикторів показав, що всі значення коефіцієнтів кореляції заходять в довірчі межі Бартлетта? 3 ± до 200 відліку для частоти дискретизації fd=6000 Гц, таким чином, покладемо, що J=200. Тут [В] - стандартна помилка для коефіцієнтів кореляції; N- кількість відліків мовного сигналу; K - деяке значення кількості відліків коефіцієнтів кореляції, що не перевищує приблизно N/4. ...