fy"> На малюнку 2.8 показано, які порівняння можуть здійснюватися між підмножинами фотоелементів. Середнє з значень фотоелементів, помічених знаком «+», зіставляється із середнім зі значень, помічених знаком «-». Якщо виявляється, що зображення більш темне під осередками «+», то ми отримуємо дані щодо можливості присутності в цій області горизонтального відрізка. Рядки фотоелементів взяті довжиною всього в п'ять пікселів, що дозволяє не дуже строго відбирати лінії за напрямком.
Аналогічне зіставлення даних, отриманих від фотоелементів, складових вертикаль, виділяє відрізки ліній, розташованих приблизно вертикально. За таким же принципом виділяються і похилі лінії.
Таким чином, вихідна безліч пікселів, в яких була вказана яскравість, перетворюється на масив комірок, що несуть інформацію про наявність відрізка прямої, що йде в тому чи іншому напрямку. Так здійснюється перехід до ознак.
Малюнок 2.8 - Розташування пікселів при пошуку горизонтальних (а) і похилих (б) відрізків зображення
Новий масив знову розглядається за допомогою комірки 7x7 (малюнок 2.9), яка за певних умов вказує на наявність деякого морфологічного ознаки символу. Такою ознакою може бути зміна напрямку лінії; гострі, прямі або тупі кути; злиття або перетин ліній. Всього виходить 54 різних морфологічних ознаки.
Малюнок 2.9 - Приклад заповнення решітки на другому етапі сканування: Н - наявність горизонтальної ділянки; V - наявність вертикального ділянки; D і d - наявність похилих ділянок
Подання символу зводиться до перерахування його морфологічних ознак із зазначенням їх зразкового розташування. Проста програма, складена на основі статистичних даних, зібраних на вільно написаних цифрах, дозволяє здійснювати досить надійне розпізнавання.
Система виділення ознак, запропонована Парксом (початковий перегляд зображення за допомогою решітки та виявлення відрізків прямих) дуже добре відповідає процесу, який відбувається в зоровій корі мозку тварин на початкових етапах обробки зображень. Тому метод Паркса можна класифікувати як нейрокібернетіческій підхід.
2.3 Огляд існуючих програмних засобів для розпізнавання символів
В даний час набули поширення дві конкуруючі між собою системи розпізнавання текстової інформації - FineReader (компанія «Біт») і CuneiForm (компанія «Cognitive Technologies»). Розробники цих систем ретельно оберігають свої ноу-хау, проте деякі принципи, використовувані цими програмами, стають відомими.
2.3.1 Основні принципи роботи системи FineReader
Компанією «Біт» була розроблена спеціальна технологія розпізнавання символів, яка отримала назву фонтанного перетворення (від англ. font - шрифт), а на її основі - комерційний продукт - система оптичного розпізнавання FineReader.
В основі фонтанного перетворення лежить так званий принцип цілісності. Відповідно до нього будь сприймається об'єкт розглядається як ціле, що складається з частин, пов'язаних між собою певними відносинами.
Для виділення цілого потрібно визначити його частини. Частини ж, у свою чергу, можна розглядати тільки в складі цілого. Тому цілісний процес сприйняття може відбуватися...