> 0-граммно
- 20,97
192
23
853
416
1-граммно
30,06
328
244
496
7
2-граммно
36,89
559
43
466
165
3-граммно
24,72
270
373
425
6
Таблиця 2 - Результати розпізнавання символів з використанням різних моделей язикаТіп моделі
Точність розпізнавання,%
Кількість правильно розпізнаних символів
Кількість видалених символів
Кількість замінених символів
Кількість вставлених символів
0-граммно
54,47
4745
986
1460
828
1-граммно
67,47
5044
1262
885
192
2-граммно
73,70
5660
722
809
360
3-граммно
60,87
4571
1615
1005
194
Висновок
Статистичні моделі мови були створені по текстовому корпусу, сформованому з новинних інтернет-сайтів чотирьох електронних газет. Таким чином, цей корпус містить тексти з великою кількістю стенограм виступів і прямої мови, що відображають особливості сучасної мови, а не на літературних текстах, які вкрай далекі від розмовної мови. Були проведені експерименти по дікторозавісімому розпізнаванню злито виголошених фраз із застосуванням нульграммной, уніграммной, біграммной і тріграммной моделей мови. Найвища точність р...