Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Корекція словникової бази модуля морфологічного аналізу «РДМА_ІПІІ»

Реферат Корекція словникової бази модуля морфологічного аналізу «РДМА_ІПІІ»





осування рекомендації щодо корекції помилки усуне помилку і не приведе до появи нових.

5. Додамо правило до безліч застосувань правил.

6. Сформуємо Залишок некоректних МІ шляхом вибору з Вихідною таблиці запи - 1 сей, які не задовольняють жодному з Множини застосованих правил.

7. Якщо Залишок некоректних МІ не порожній і для його першого елемента кількість словоформ з даною МІ більше порогового, перейти на крок 3.

Таблиця 3 - Коригування словникової бази

Правило

Кількість словоформ

Рекомендація

П9, ПЗО

38468

Замінити значення категорії відмінка на невизначене.

П1, П10

4794

Замінити значення категорії роду на невизначене.

П24

899

Набір словоформ розділений по Лемма - отримано 27 лем. З них:

- 8 є винятками з правила і коригуванню не підлягають;

- Для 1 помилково побудовані пасивні форми причастя (словоформи підлягають видаленню);

- В 18 помилково віднесені до неперехідним (замінити значення категорії перехідності на «перехідний»).

П13

123

Замінити значення категорії одухотвореності на «неживе».

П14

42

Замінити значення категорії одухотвореності на невизначене.

П7.11

120

Дана група містить словоформи іменників групи plura-lia tantum («мають тільки множину»). Частина словоформ цієї групи визначені як такі, що однина (підлягають видаленню). Для решти обнулити в МІ ознака поворотної форми дієслова.

П23

44

Дана група містить причастя від леми «врізати», з якою словникова база працює некоректно.

Результати застосування даної методики відображені в табл. 3, де також зазначено порядок застосування правил і рекомендації щодо виправлення помилок. Дані рекомендації дозволяють виправити виявлені помилки.

Висновки

Наукова новизна даної роботи полягає в наступному.

1. На основі теоретичних відомостей згенеровані правила виявлення некоректних значень морфологічної інформації.

2. Розроблено методику коригування словникової бази модуля морфологічного аналізу.

Практична значущість роботи полягає в застосовності згенерованих правил і методики для виявлення, аналізу та виправлення помилок в МІ словникових баз систем обробки російськомовних текстів на морфологічному рівні.

Список літератури

1. Антоно...


Назад | сторінка 6 з 7 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Розробка алгоритму роботи синтаксичного аналізатора тексту, а також бази да ...
  • Реферат на тему: Політична культура: зміст і методологічне значення категорії
  • Реферат на тему: Категорії роду у іменників у сучасній російській мові
  • Реферат на тему: Використання генетичних алгоритмів для оптимізації бази правил
  • Реферат на тему: Етимологія поняття "Товар класу люкс" та основи класифікації това ...