ися з довільним і, тим більше, складним шрифтом, програми такого роду починали давати серйозні збої.
Сучасні наукові досягнення в галузі розпізнавання образів буквально перевернули уявлення про оптичному розпізнаванні символів. Сучасні програми цілком можуть справлятися з різними (і вельми химерними) шрифтами без перенастроювання. Багато розпізнають навіть рукописний текст.
1.3.1. Програми розпізнавання текстів p> Оскільки потреба в розпізнаванні тексту відсканованих документів достатньо велика, не дивно, що мається значне число програм, призначених для цієї мети. Так як різні наукові методи розпізнавання тексту розвивалися незалежно один від одного, багато з цих програм використовують абсолютно різні алгоритми.
Ці алгоритми можуть давати різні результати на різних документах. Наприклад, згадувані вище системи OCR, здатні розпізнавати тільки стандартний спеціально підготовлений шрифт і дають на цьому шрифті найкращі результати, які не може перевершити жодна з більш універсальних програм.
Сучасні алгоритми розпізнавання тексту не орієнтуються ні на конкретний шрифт, ні на конкретний алфавіт. Більшість програм здатне розпізнавати текст на декількох мовах. Одні й ті ж алгоритми можна використовувати для розпізнавання російської, латинської, арабської та інших алфавітів і навіть змішаних текстів. Зрозуміло, програма повинна знати, про який алфавіт йдеться.
Нас, перш за все, цікавлять програми, здатні розпізнавати текст, надрукований російською та українською мовами. Такі програми випускаються в основному російськими виробниками. Найбільш широко відомі і поширені програми FineReader і CuneiForm. Ми детально зупинимося на програмі FineReader, що забезпечує високу якість розпізнавання і зручність застосування.
1.3.2. Програма FineReader p> Програма FineReader випускається російською компанією ABBYY Software (bitsoft.ru). Ця програма призначена для розпізнавання текстів російською, англійською, німецькою, українською, французькою і багатьох інших мовах, а також для розпізнавання змішаних двомовних текстів.
Програма має ряд зручних можливостей. Вона дозволяє об'єднувати сканування і розпізнавання в одну операцію, працювати з пакетами документів (або з багатосторінковими документами) і з бланками. Програму можна навчати для підвищення якості розпізнавання невдало надрукованих текстів чи складних шрифтів. Вона дозволяє редагувати розпізнаний текст і перевіряти його орфографію.
FineReader працює з різними моделями сканерів. Зокрема, програма підтримує стандарт TWAIN. Ми розглянемо програму на прикладі версії 4.0, однією з останніх версій на даний момент.
2. Розпізнавання документів в програмі finereader p> 2.1. Вікно програми p> Після установки програми FineReader в меню В«ПрограмиВ» Головного меню з'являються пункти, що забезпечують роботу з нею. Вікно програми має типовий для додатків Windows9Х вигляд і містить рядок мен...