мовлення за допомогою фонетичного стенографа" width="740" height="388" />
Рисунок 1 - Граф для довільної послідовності фонем
Надійність знайти фонему на правильному місці для відомої реалізації дорівнює приблизно 85%.
4. Результати експериментів з розпізнавання ключових слів у потоці злитої мови
Експерименти проводилися на описаної контрольної вибірці.
Ключові слова описувалися послідовністю фонем заданої довжини від 2 до 12 фонем. Для даної довжини зі словника вибиралося 30 ключових слів. На жаль, для довжин 2, 11 і 12 в тестовому корпусі не вдалося вибрати достатню кількість записів, і в даному випадку було вибрано близько 20 ключових слів. Всього було відібрано 309 ключових слів.
Для кожного ключового слова з тестового корпусу вибиралося від 15 до 100 записів фраз, в які це ключове слово обов'язково входило. На цьому матеріалі підраховувався відсоток помилкового відмови (False Rejection) як частка випадків, коли ключове слово не було розпізнано.
Крім цього вибиралася вибірка довжиною в 1000 слів, в яку ключове слово гарантовано не входило. На цьому матеріалі підраховувався відсоток помилкового спрацьовування (False Alarm) як частка випадків, коли відбувалося спрацьовування алгоритму розпізнавання ключового слова.
Алгоритм містить коефіцієнт, що дозволяє регулювати співвідношення між відсотками помилкового відмови і помилкового спрацьовування. Оптимальний коефіцієнт був вибраний з умови мінімуму суми цих відсотків. При необхідності можна вибрати інше значення коефіцієнта, віддаючи перевагу тому чи іншому сценарієм використання системи.
Таблиця 1 - Надійність розпізнавання ключових слів
Число фонем в ключовому слові
Відсоток помилкового відмови
Відсоток помилкового спрацьовування
2
6.95
13.27
3
5.22
7.30
4
3.26
4.76
5
4.06
2.34
6
3.32
1.87
7
2.21
1.12
8
1.52
1.48
9
2.09
0.74
10
3.79
0.55
11
4.47
0.38