Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Курсовые проекты » Ознаки символів, використовувані для автоматичного розпізнавання

Реферат Ознаки символів, використовувані для автоматичного розпізнавання





ичного розпізнавання букв.

На малюнку 4 представлена ??блок схема реалізовується програми.














Малюнок 4 - Блок схема програми


Процес розпізнавання:

Завантаження зображення. Для початку нам необхідно зображення, з яким потім можна працювати. Завантажуємо його стандартними методами ОС Windows.

У даній програмі розпізнаються тільки бінарні образи, тому другим етапом після отримання картинки, вона бінарізуется. При роботі з кольоровим зображенням перетворення з кольорового в чорно-біле зображення йде за стандартною формулою

:=0.3 * R + 0.59 * G + 0.11 * B

Далі алгоритм досить простий: є деяка планка, якщо колір відтінку сірого вище - він вважається білим, якщо нижче - вважається чорним. Як видно бінаризація дуже проста, проте для серйозного поліпшення якості роботи розпізнавання, і зменшення часу роботи подальших модулів, на цьому місці краще ввести якийсь фільтр, нехай навіть найпростіший. У даній програмі не використовується ніякої фільтр, однак місце де він може бути включений позначено.

Найчастіше отримане зображення рясніє перешкодами, що не мають ніякого відношення до символів і тільки заважають процесу розпізнавання. Використовуючи найпростіший метод, який вважає щільність точок у заданій області, вдається позбутися більшої кількості перешкод.

Розбиття зображення на частини, кожна з яких містить свій унікальних об'єкт називається сегментацією.

У даній програмі реалізовано попіксельне порівняння з еталонними символами заданого шрифту. Якщо відсоток збігу зразка та виділеного символу не нижче заданої межі, то символ вважається розпізнаним.

Вихідний текст програми знаходиться у додатку А.


8. Тестування програми


Відкриваємо зображення (Рис. 5). Підходить будь-яке зображення у форматі BMP.


Малюнок 5 - Відкрите зображення


Для розпізнавання необхідно вибрати пункт меню «Розпізнати». Після цього відбувається бінаризація, очищення від шуму (Мал. 6) і починається сам процес розпізнавання символів (Рис. 7).


Малюнок 6 - Бінаризація і видалення шуму


Малюнок 7 - Розпізнавання символів


Розпізнані символи після закінчення роботи програми виводяться в рядку під малюнком (Рис 8).


Рисунок 8 - Розпізнані символи

9. Аналіз Алгоритмів оптичного розпізнавання символів


У випадку, коли мова йде про розпізнавання друкованих символів слід згадати, що майже нескінченну різноманітність друкованої продукції виготовляється при допомогою обмеженого набору оригіналів символів, які групуються за стилем (набору художніх рішень), який відрізняє дану групу від інших. Одна група, що включає всі алфавітні знаки, цифри і стандартний набір службових символів, називається гарнітурою. Однак широко поширився інший термін - шрифт, цей термін і буде використовуватися надалі.

Будь друкований текст має первинне властивість - шрифти, якими він надрукований. З цієї точки зору існують два класи алгоритмів розпізнавання друкованих символів: шрифтовий та безшріфтовий (omnifont). Шрифтові або шріфтозавісімие алгоритми використовують апріорну інформацію про шрифт, яким надруковані літери. Ет?? означає, що програмою ОРС повинна бути пред'явлена ??повноцінна вибірка тексту, надрукованого даними шрифтом. Програма вимірює й аналізує різні характеристики шрифту і заносить їх у свою базу еталонних характеристик. Після закінчення цього процесу шрифтовая програма оптичного розпізнавання символів (ОРС) готова до розпізнавання даного конкретного шрифту. Цей процес умовно можна назвати навчанням програми. Далі навчання повторюється для деякого безлічі шрифтів, яке залежить від області застосування програми.

До недоліків даного підходу слід віднести наступні фактори:

Алгоритм повинен заздалегідь знати шрифт, який йому представляють для розпізнавання, тобто він повинен зберігати в базі різні характеристики цього шрифту. Якість розпізнавання тексту, надрукованого довільним шрифтом, буде прямо пропорційно кореляції характеристик цього шрифту зі шрифтами, наявними в базі програми. При існуючому багатстві друкованої продукції в процесі навчання неможливо охопити всі шрифти та їх модифікації. Приміром, Поліграфбуммаш СРСР свого часу стандартизував близько 15-20 різних шрифтів, в сучасних комп'ютерних системах верстки документів використовується більш 100 шрифті...


Назад | сторінка 7 з 23 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Розробка програми розпізнавання зорових образів
  • Реферат на тему: Алгоритм і програма розпізнавання образів
  • Реферат на тему: Дослідження характеристик системи розпізнавання форми мікрооб'єктів
  • Реферат на тему: Розпізнавання режимів роботи авіаційного ГТД з використанням технології ней ...
  • Реферат на тему: Базова реалізація персептрона для навчання і розпізнавання простих фігур