тільки в рамках гіпотези про сприймаємо об'єкті - цілому.
При розпізнаванні тексту людиною будь-яке рішення приймається шляхом послідовного висунення і перевірки гіпотез із залученням знань як про сам досліджуваному об'єкті, так і про зміст всього тексту.
Перший крок сприйняття - це формування гіпотези про сприймаємо об'єкті. Гіпотеза може формуватися як на основі апріорної моделі об'єкта, контексту і результатів перевірки попередніх гіпотез (процес «зверху вниз»), так і на основі попереднього аналізу об'єкта («знизу вгору»). Другий крок - уточнення сприйняття (перевірка гіпотези), при якому проводиться додатковий аналіз об'єкта в рамках висунутої гіпотези і в повну силу залучається контекст.
Кожна гіпотеза повинна бути об'єктом, який можна було б оцінити або порівняти з іншими. Гіпотези висуваються послідовно, а потім об'єднуються в список і сортуються на основі попередньої оцінки. Для остаточного вибору гіпотези активно використовуються контекст та інші додаткові джерела знання.
Як вже зазначалося вище, сьогодні відомі три підходи до розпізнавання символів - шаблонний, структурний і прізнаковая. Принципу цілісності відповідають лише перші два. Тому компанія «Біт» принципово не використовує прізнаковая підхід. Разом з тим розробники FineReader звертають увагу на недоліки шаблонного і структурного підходів. Шаблонні системи досить стійкі до дефектів зображення і мають високу швидкість обробки вхідних даних, але надійно розпізнають тільки ті шрифти, шаблони яких їм відомі. Якщо розпізнаваний шрифт хоч трохи відрізняється від еталонного, шаблонні системи можуть робити помилки навіть при обробці дуже якісних зображень.
До недоліків структурних систем відноситься їх висока чутливість до дефектів зображення, що порушує складові елементи. Крім того, векторизация зображень сама по собі може додавати додаткові дефекти.
Фонтанне перетворення, пропоноване розробниками системи FineReader, на їх думку, поєднує в собі достоїнств шаблонної та структурної систем і дозволяє уникнути недоліків, притаманних кожній з них окремо. В основі цієї технології лежить використання структурж плям еталона (термін введений розробниками системи). Зображення представляється у вигляді набору плям, пов'язаних між собою n-арнимі відносинами, які задають структуру символу.
Ці відносини, тобто розташування плям один щодо одного, утворюють структурні елементи, складові символ. Так, відрізок - це один тип n-арних відносин між плямами, еліпс - інший, дуга - третій.
Інші відносини задають просторове розташування утворюють символ елементів. Використовуються зв'язку між структурними елементами, які визначаються або метричними характеристиками цих елементів (наприклад, «довжина більше»), або їх взаємним розташуванням на зображенні (наприклад, «правіше», «стикається»).
При завданні структурних елементів і відносин застосовуються конкретизують параметри, що дозволяють доопределить структурний елемент або відношення при використанні цього елемента в стандарті конкретного класу. Конкретизирующими можуть бути, наприклад, параметри, що задають діапазон допустимої орієнтації відрізка або граничне допустима відстань між характерними точками структурних елементів. Приклад завдання конкретизують параметрів для літери «А», наведений на малюнку...