осування рекомендації щодо корекції помилки усуне помилку і не приведе до появи нових.
5. Додамо правило до безліч застосувань правил.
6. Сформуємо Залишок некоректних МІ шляхом вибору з Вихідною таблиці запи - 1 сей, які не задовольняють жодному з Множини застосованих правил.
7. Якщо Залишок некоректних МІ не порожній і для його першого елемента кількість словоформ з даною МІ більше порогового, перейти на крок 3.
Таблиця 3 - Коригування словникової бази
Правило
Кількість словоформ
Рекомендація
П9, ПЗО
38468
Замінити значення категорії відмінка на невизначене.
П1, П10
4794
Замінити значення категорії роду на невизначене.
П24
899
Набір словоформ розділений по Лемма - отримано 27 лем. З них:
- 8 є винятками з правила і коригуванню не підлягають;
- Для 1 помилково побудовані пасивні форми причастя (словоформи підлягають видаленню);
- В 18 помилково віднесені до неперехідним (замінити значення категорії перехідності на «перехідний»).
П13
123
Замінити значення категорії одухотвореності на «неживе».
П14
42
Замінити значення категорії одухотвореності на невизначене.
П7.11
120
Дана група містить словоформи іменників групи plura-lia tantum («мають тільки множину»). Частина словоформ цієї групи визначені як такі, що однина (підлягають видаленню). Для решти обнулити в МІ ознака поворотної форми дієслова.
П23
44
Дана група містить причастя від леми «врізати», з якою словникова база працює некоректно.
Результати застосування даної методики відображені в табл. 3, де також зазначено порядок застосування правил і рекомендації щодо виправлення помилок. Дані рекомендації дозволяють виправити виявлені помилки.
Висновки
Наукова новизна даної роботи полягає в наступному.
1. На основі теоретичних відомостей згенеровані правила виявлення некоректних значень морфологічної інформації.
2. Розроблено методику коригування словникової бази модуля морфологічного аналізу.
Практична значущість роботи полягає в застосовності згенерованих правил і методики для виявлення, аналізу та виправлення помилок в МІ словникових баз систем обробки російськомовних текстів на морфологічному рівні.
Список літератури
1. Антоно...