p align="justify"> Згладжування складається з операцій заповнення та утоньшения. Заповнення усуває невеликі розриви і прогалини.
Утоньшение являє собою процес зменшення товщини лінії, в якій відразу кілька пікселів ставляться у відповідність тільки одному пікселу. Відомі послідовні, паралельні і гібридні алгоритми утоньшения. Найбільш загальні методи утоньшения засновані на итеративном розмиванні контурів, при якому вікно (3х3) рухається по зображенню, і всередині вікна виконуються відповідні операції. Після завершення кожного етапу всі виділені точки видаляються.
скелетизації являє собою відновлення траєкторії пише інструменту в якості вхідної інформації якого використовують або скелет зображення, або контур зображення. Незважаючи на велику ефективність використання «скелетизації» відновлення траєкторії по скелету зображення має істотний недолік: критично важливою інформацією при відновленні траєкторії є форма граничного буда в околиці областей перетину штрихів. З скелета зображення ця інформація недоступна (див. Рис. 1). До недоліків «скелетизації» можна віднести також велику чутливість до шуму на кордоні зображення і, як наслідок, виникнення випадкових «відростків» в скелеті зображення. Тому методи відновлення траєкторії, засновані на отриманні скелета, призводять до помилок при обробці зображень з досить складною траєкторією.
Альтернативою «скелетизації» є метод предобработки, який полягає в наступному: зображення символу розбивається на смуги чорних крапок, відповідні непересічним відрізкам штрихів (регулярні області) і області перетину штрихів (вузлові області).
Рисунок 1 - Зображення символу і його скелет
Існуючі алгоритми виділення регулярних областей грунтуються на точкової обробці зображень. У даній роботі пропонується алгоритм, побудований тільки на використанні ламаною, апроксимуючої контур зображення.
Основними особливостями пропонованого методу є:
висока швидкість обробки зображень, яка досягається за рахунок відсутності точкової обробки;
відсіювання зображень, для яких метод виділення траєкторій неприйнятний (зображення з плямами і запливами) вже на етапі предобработки.
Нормалізація складається з алгоритмів, що усувають перекоси окремих символів і слів, а також включає в себе процедури, що здійснюють нормалізацію символів по висоті і ширині після відповідної їх обробки.
Сегментація здійснює розбиття зображення на окремі області. Як правило, перш за все необхідно очистити текст від графіки і рукописних поміток, оскільки перераховані методи дозволяють обробляти лише незашумленим текст. Очищений від різних позначок текст уже може бути сегментований.
Більшість алгоритмів оптичного розпізнавання поділяють текст на символи і розпізнають їх окремо.
Це просте рішення дійсно ефективно, якщо тільки символи тексту не перекривають один одного. Злиття символів може бути викликано типом шрифту, яким був набраний текст, поганим дозволом друкувального пристрою або високим рівнем яскравості, обраним для відновлення розірваних символів.
Розбиття тексту на слова можливо в тому випадку, якщо слово є заможним ознакою, відповідно до якого виконується сегментація. Подібний підхід складно реалізувати через великого числа елементів, що підлягають розпізнаванню, але він може бути корисний, якщо набір слів в кодовому словнику обмежений за умовою задачі.
Під апроксимацією відрізків ліній розуміють складання графа опису символу у вигляді набору вершин і прямих ребер, які безпосередньо апроксимують ланцюжка пікселів вихідного зображення. Дана апроксимація здійснюється з метою зменшення обсягу даних і може використовуватися при розпізнаванні, заснованому на виділенні ознак, що описують геометрію і топологію зображення.
4. Ознаки символів, використовувані для автоматичного розпізнавання
Вважається, що виділення ознак є однією з найбільш важких і важливих завдань в розпізнаванні образів. Для розпізнавання символів може бути введено велику кількість різних систем ознак. Проблема полягає в тому, щоб виділити саме ті ознаки, які дозволять ефективно відрізняти один клас символів від усіх інших.
У даному розділі описано ряд основних методик розпізнавання символів.
. 1 Кореляція і зіставлення шаблонів
Введена матриця символів порівнюється з набором еталонів. Обчислюється ступінь подібності між образом і кожним з еталонів. Класифікація тестованого зображення символу відбувається за методом найближчого сусіда.
З практичної точки зору цей метод легко реалізув...