Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Підвищення ефективності роботи опечаточніка

Реферат Підвищення ефективності роботи опечаточніка





великий і модель помилок не може це компенсувати. А так само слова з більш ніж однією помилкою, які часто виправляються на слова з одного друкарською помилкою. З точки зору швидкодії складно і малоефективно створювати модель помилок, яка б покривала ці проблемні місця. p align="justify"> Більшість російських програм перевірки орфографії виправляють тільки однобуквені друкарські помилки, тому що многобуквенние становлять не більше декількох відсотків від їх загальної кількості: як правило, зустрічаються лише друкарські помилки типу "баблікі з Муком". Небажання розробників закладати в свої програми пошук многобуквенних друкарських помилок пояснюється гнучкістю російської мови порівняно з англійською, через що список підказок на російське слово з двома друкарськими помилками виходить неприпустимо велике. p align="justify"> Виходячи з усього цього, можна зробити висновок, що створити універсальну модель помилок, що є найкращою в будь-якій ситуації, створити не вдається. У всіх варіантах є свої плюси і мінуси. br/>

Використовувана схема роботи


При проведенні даної роботи використовувалася наступна схема роботи опечаточніка:











Використовувані дані


Вхідні дані

Представляють собою тестову вибірку, представлену в текстовому файлі.

Вхідний файл (він же тестова вибірка).

Формат: _1 [ t correct_11, correct_12] _2 [ t correct_21, correct_22]

Тут: word - слово з помилкою або друкарською помилкою. Далі за бажанням через табуляцію вказуються варіанти виправлення (варіанти виправлення між собою розділяються ","), тоді в автоматичній видачу послід ті слова, які збіглися з варіантами виправлення, зазначеними вручну. p align="justify"> Приклад запису у вхідному файлі:

Безплатно безкоштовно

Параметри опечаточніка

Текстовий файл, що містить параметри, що впливають на якість роботи опечаточніка.

Параметри

Опис параметрів з їх значеннями за замовчуванням:

lev = 0.165

максимальна (порогове) значення відстані Левенштейна, при якому одне слово вважається виправленням іншого.

len_1 = 4_2 = 7_1 = 0.2_2 = 0.3_3 = 0.4

Коефіцієнти фільтрації. Нехай L - довжина исправляемого слова, K - коефіцієнт, який бере участь у фільтрації, тоді при

L len_2K = coeff_3.

limit = 5

Максимальна кількість підказок у вихідному файлі для одного исправляемого слова. Неявно впливає на порядок видачі, тобто і на те, яка карта буде ...


Назад | сторінка 7 з 10 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Загальний порядок виправлення помилок
  • Реферат на тему: Виправлення помилок и змін у ФІНАНСОВИХ звітах
  • Реферат на тему: Усунення помилок сімейного виховання та концепція роботи соціального педаго ...
  • Реферат на тему: Помилки в іншомовному мови учнів, технології їх виправлення
  • Реферат на тему: Параметри роботи електросхеми