були повернені.
. Інваріантні числа.
З геометрії образів можна виділити деякі числа, інваріантні щодо розміру і повороту образів, далі можна скласти таблицю відповідності цих чисел конкретного образу (майже як в алгоритмі скелетезаціі). Приклади інваріантних чисел - число Ейлера, ексцентриситет, орієнтація (в сенсі розташування головної осі інерції щодо чого-небудь теж інваріантного).
. Поточечное процентне порівняння з еталоном.
Тут повинна бути деяка предобработка, для отримання інваріантності щодо розміру і положення, потім здійснюється порівняння з заготовленої базою еталонів зображень - якщо збіг більше ніж якась відмітка, то вважаємо образ розпізнаним.
1. Типові проблеми, пов'язані з розпізнаванням символів
Існує ряд суттєвих проблем, пов'язаних з розпізнаванням рукописних і друкованих символів. Найбільш важливі з них наступні:
різноманітність форм накреслення символів;
спотворення зображень;
варіації розмірів і масштабу символів.
Кожен окремий символ може бути написаний різними стандартними шрифтами, наприклад (Gothic, Elite, Courier, Orator), спеціальними шрифтами, що використовуються в системах OCR, а також безліччю нестандартних шрифтів. Крім того, різні символи можуть володіти подібними обрисами. Наприклад, U і V, S і 5 raquo ;, Z і 2 raquo ;, G і 6 .
Спотворення цифрових зображень символів можуть бути наступних видів:
Спотворення форми: розірваність рядків, непропечатанность символів, ізольованість окремих точок, неплоский характер інформаційного носія (наприклад, ефект жолоблення), зміщення символів або їх частин щодо місця розташування в рядку; обертання зі зміною нахилу символів; грубим дискретом оцифрування зображень;
Крім того, необхідно виділити радіометричні спотворення: дефекти освітлення, тіні, відблиски, нерівномірний фон, помилки при скануванні або при зйомці відеокамерою.
Істотним є і вплив вихідного масштабу друку. У прийнятій термінології масштаб 10, 12 або 17 означає, що в дюймі рядки поміщаються 10, 12 або 17 символів. При цьому, наприклад, символи масштабу 10 звичайно крупніше і ширше символу масштабу 12.
Крім зазначених проблем, система оптичного розпізнавання тексту (OCR), повинна виділяти на зображенні текстові області, в них виділяти окремі символи, розпізнавати ці символи і бути нечутливою до способу друку (верстки) і відстані між рядками.
. Структура систем оптичного розпізнавання текстів
Як правило, системи OCR складаються з декількох блоків, які передбачають апаратну або програмну реалізацію:
оптичний сканер;
блок локалізації та виділення елементів тексту;
блок попередньої обробки зображень;
блок виділення ознак;
блок розпізнавання;
блок постобробки результатів розпізнавання.
У результаті роботи оптичного сканера вихідний текст вводиться в комп'ютер у вигляді полутонового або бінарного зображення.
З метою економії пам'яті і зменшення витрат часу на обробку інформації, в системах OCR, як правило, застосовується перетворення напівтонового зображення в чорно-біле. Таку операцію називають бінаризація. Однак необхідно мати на увазі, що операція бінарізаціі може призвести до погіршення ефективності розпізнавання.
Програмне забезпечення в системах OCR відповідає за подання даних у цифровому вигляді і розбиття зв'язного тексту на окремі символи.
Після розбиття символи, представлені у вигляді бінарних матриць, піддаються згладжуванню, фільтрації з метою усунення шумів, нормалізації розміру, а також інших перетворень з метою виділення ознак, використовуваних згодом для розпізнавання.
Розпізнавання символів відбувається в процесі порівняння виділених характерних ознак з еталонними ознаками, відбираються в ході статистичного аналізу результатів, отриманих в процесі навчання системи.
Таким чином, смислова або контекстна інформація може бути використана як для вирішення невизначеностей, що виникають при розпізнаванні символів, що володіють ідентичними розмірами, так і для коригування слів та фраз в цілому.
3. Методи попередньої обробки зображень текстових символів
Передобробка є важливим етапом у процесі розпізнавання образів і дозволяє виробляти згладжування, нормалізацію, сегментацію і апроксимацію відрізків ліній.
<...