Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Підвищення ефективності роботи опечаточніка

Реферат Підвищення ефективності роботи опечаточніка





стояти на першому місці. Припустимо, що limit == 5, це означає, що зі списку найкращих підказок ми візьмемо тільки перші 5 штук, які потім піддаються заключній сортуванню. Якщо варіант, зазначений людиною як правильний, буде стояти в цьому списку на 6 місці, то ми правильний варіант втрачаємо. Якби ми вказали limit = 6, то у видачі з'явився би правильний варіант. p align="justify"> log_arg = 2.0

Коефіцієнт, що бере участь в обчисленні граничного значення кількості виправлень для слова. Порогове значення кількості виправлень обчислюється як логарифм по підставі log_arg від довжини вхідного слова. p align="justify"> filter = all

Фільтрація видачі підказок. Приймає наступні значення: - залишаємо всі варіанти; - фільтрація за правилом трикутника; _dist - відкидаються далекі від першої підказки варіанти; - включаються обидві сортування відразу. p align="justify"> sort = count_freq

Фінальна сортування. Прінімет такі значення: _freq - сортування за кількістю виправлень у слові, в рамках однакової кількості - за частотою; - сортування за типом опечасток в слові; _freq - сортування за по відстані Левенштейна, в рамках однакової відстані - за частотою. p align="justify"> Словникова база

База слів, яку використовує опечаточнік.

Вихідні дані

Всі вихідні дані записуються в два вихідних файлу.

) Вихідний файл з докладним описом результатів для всіх слів

Формат вихідного файлу:

word_1 t time_1 t etalon

lev_dist_11 t correct_11 t [N_11, M_11] _dist_12 t correct_12 t [N_12, M_12]

Тут: _1 - оброблюване слово з помилкою або друкарською помилкою, _1 - час, витрачений на отримання виправлень слова word_1, - варіант виправлення, вибраний людиною, _dist_11 - відстань Левенштейна між word_1 і correct_11, _11 - варіант виправлення word_1,

[N_11, M_11] - проставляється, якщо варіант виправлення збігається з варіантом, вказаним вручну (еталоном). N_11 - номер варіанта в списку, зазначеним людиною, M_11 - номер варіанта в автоматичному списку. p align="justify"> Вихідний файл з загальним описом результатів для експерименту: - параметри опечаточніка

Time - час роботи опечаточніка-кількість слів в експерименті: all - right - [1,1] - [1,2] - [1,3]

Де

all - загальна кількість слів запропонованих опечаточніком

right - кількість слів збіглися з вибором користувачів

[1,1] - кількість слів, поставлених опечаточніком і користувачем на перше місце

[1,2] - кількість слів, поставлених користувачем на перше місце, а опечаточніком на друге


Назад | сторінка 8 з 10 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Сортування вводяться з клавіатури слів
  • Реферат на тему: Значення багатозначних слів у рекламних текстах
  • Реферат на тему: Архаїчне Значення слів у словнику української мови
  • Реферат на тему: Походження слів та виразів
  • Реферат на тему: Морфемний аналіз слів з прихованим j (й)