стояти на першому місці. Припустимо, що limit == 5, це означає, що зі списку найкращих підказок ми візьмемо тільки перші 5 штук, які потім піддаються заключній сортуванню. Якщо варіант, зазначений людиною як правильний, буде стояти в цьому списку на 6 місці, то ми правильний варіант втрачаємо. Якби ми вказали limit = 6, то у видачі з'явився би правильний варіант. p align="justify">
log_arg = 2.0 Коефіцієнт, що бере участь в обчисленні граничного значення кількості виправлень для слова. Порогове значення кількості виправлень обчислюється як логарифм по підставі log_arg від довжини вхідного слова. p align="justify"> filter = all
Фільтрація видачі підказок. Приймає наступні значення: - залишаємо всі варіанти; - фільтрація за правилом трикутника; _dist - відкидаються далекі від першої підказки варіанти; - включаються обидві сортування відразу. p align="justify"> sort = count_freq
Фінальна сортування. Прінімет такі значення: _freq - сортування за кількістю виправлень у слові, в рамках однакової кількості - за частотою; - сортування за типом опечасток в слові; _freq - сортування за по відстані Левенштейна, в рамках однакової відстані - за частотою. p align="justify"> Словникова база
База слів, яку використовує опечаточнік.
Вихідні дані
Всі вихідні дані записуються в два вихідних файлу.
) Вихідний файл з докладним описом результатів для всіх слів
Формат вихідного файлу:
word_1 t time_1 t etalon
lev_dist_11 t correct_11 t [N_11, M_11] _dist_12 t correct_12 t [N_12, M_12]
Тут: _1 - оброблюване слово з помилкою або друкарською помилкою, _1 - час, витрачений на отримання виправлень слова word_1, - варіант виправлення, вибраний людиною, _dist_11 - відстань Левенштейна між word_1 і correct_11, _11 - варіант виправлення word_1,
[N_11, M_11] - проставляється, якщо варіант виправлення збігається з варіантом, вказаним вручну (еталоном). N_11 - номер варіанта в списку, зазначеним людиною, M_11 - номер варіанта в автоматичному списку. p align="justify"> Вихідний файл з загальним описом результатів для експерименту: - параметри опечаточніка
Time - час роботи опечаточніка-кількість слів в експерименті: all - right - [1,1] - [1,2] - [1,3]
Де
all - загальна кількість слів запропонованих опечаточніком
right - кількість слів збіглися з вибором користувачів
[1,1] - кількість слів, поставлених опечаточніком і користувачем на перше місце
[1,2] - кількість слів, поставлених користувачем на перше місце, а опечаточніком на друге