в. Іншими словами, цей фактор обмежує універсальність таких алгоритмів.
Для роботи програми розпізнавання необхідний блок настроювання на конкретний шрифт. Очевидно, що цей блок буде вносити свою частку помилок в інтегральну оцінку якості розпізнавання, або функцію установки шрифту доведеться покласти на користувача.
Програма, заснована на шрифтовому алгоритмі розпізнавання символів, вимагає від користувача спеціальних знань про шрифти взагалі, про їх групах і відмінностях один від одного, шрифтах, якими надрукований документ, користувача. Відзначимо, що у випадку, якщо паперовий документ не створений самим користувачем, а прийшов до нього ззовні, не існує регулярного способу дізнатися з використанням яких шрифтів цей документ був надрукований. Фактор необхідності спеціальних знань звужує коло потенційних користувачів і зрушує його убік організацій, що мають в штаті відповідних фахівців.
З іншого боку, у шрифтового підходу є перевага, завдяки якому його активно використовують і, мабуть, будуть використовувати в майбутньому. А саме, маючи детальну апріорну інформацію про символи, можна побудувати досить точні й надійні алгоритми розпізнавання. Взагалі, при побудові шрифтового алгоритму розпізнавання надійність розпізнавання символу є інтуїтивно ясною і математично точно виразіми величиною. Ця величина визначається як відстань в якому-небудь метричному просторі від еталонного символу, пред'явленого програмі в процесі навчання, до символу, який програма намагається розпізнати.
Другий клас алгоритмів - безшріфтовие або шріфтонезавісімие, тобто алгоритми, що не мають апріорних знань про символи, що надходять до них на вхід. Ці алгоритми вимірюють і аналізують різні характеристики (ознаки), властиві буквах як таким безвідносно шрифту і абсолютного розміру (кегля), яким вони надруковані. У граничному випадку для шріфтонезавісімого алгоритму процес навчання може бути відсутнім. У цьому випадку характеристики символів вимірює, кодує й поміщає в базу програми сама людина. Однак на практиці, випадки, коли такий шлях вичерпно вирішує поставлене завдання, зустрічаються рідко. Більш загальний шлях створення бази характеристик полягає в навчанні програми на вибірці реальних символів.
До недоліків даного підходу можна віднести наступні фактори:
Реально досяжну якість розпізнавання нижче, ніж у шрифтових алгоритмів. Це пов'язано з тим, що рівень узагальнення при вимірах характеристик символів набагато вищий, ніж у випадку шріфтозавісімих алгоритмів. Фактично це означає, що різні допуски і огрублення при вимірах характеристик символів для роботи безшріфтових алгоритмів можуть бути в 2-20 разів більше порівняно з шрифтовими.
Слід вважати великою удачею, якщо безшріфтовий алгоритм володіє адекватним і фізично обгрунтованим, тобто природно проистекающим з основної процедури алгоритму, коефіцієнтом надійності розпізнавання. Часто доводиться миритися з тим, що оцінка точності або відсутня, або є штучною. Під штучної оцінкою мається на увазі те, що вона істотно не збігається з ймовірністю правильного розпізнавання, яку забезпечує даний алгоритм.
Переваги цього підходу тісно пов'язані з його недоліками. Основними достоїнствами є наступні:
Універсальність. Це означає з одного боку застосовність цього підходу у випадках, коли потенційне різноманітність символів, які можуть надійти на вхід системи, велике. З іншого боку, за рахунок закладеної в них здатності узагальнювати, такі алгоритми можуть екстраполювати накопичені знання за межі навчальної вибірки, тобто стійко розпізнавати символи, по виду далекі від тих, які були присутні в навчальній вибірці.
Технологічність. Процес навчання шріфтонезавісімих алгоритмів зазвичай є більш простим і інтегрованим у тому сенсі, що навчальна вибірки не фрагментована на різні класи (по шрифтах, кеглем і т.д.). При цьому відсутня необхідність підтримувати в базі характеристик різні умови спільного існування цих класів (некоррелірованні, що не змішуваність, систему унікального іменування і т.п.). Проявом технологічності є також той факт, що часто вдається створити майже повністю автоматизовані процедури навчання.
Зручність у процесі використання програми. У випадку, якщо програма побудована на шріфтонезавісімих алгоритмах, користувач не зобов'язаний знати що-небудь про сторінку, яку він хоче ввести в комп'ютерну пам'ять і повідомляти про ці знаннях програму. Також спрощується користувальницький інтерфейс програми за рахунок відсутності набору опцій і діалогів, обслуговуючих навчання і керування базою характеристик. У цьому випадку процес розпізнавання можна представляти користувачеві як чорний ящик (при цьому користувач повністю позбавлений можливості управляти або яким-небудь чином модифікув...