Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Курсовые проекты » Ознаки символів, використовувані для автоматичного розпізнавання

Реферат Ознаки символів, використовувані для автоматичного розпізнавання





були повернені.

. Інваріантні числа.

З геометрії образів можна виділити деякі числа, інваріантні щодо розміру і повороту образів, далі можна скласти таблицю відповідності цих чисел конкретного образу (майже як в алгоритмі скелетезаціі). Приклади інваріантних чисел - число Ейлера, ексцентриситет, орієнтація (в сенсі розташування головної осі інерції щодо чого-небудь теж інваріантного).

. Поточечное процентне порівняння з еталоном.

Тут повинна бути деяка предобработка, для отримання інваріантності щодо розміру і положення, потім здійснюється порівняння з заготовленої базою еталонів зображень - якщо збіг більше ніж якась відмітка, то вважаємо образ розпізнаним.


1. Типові проблеми, пов'язані з розпізнаванням символів


Існує ряд суттєвих проблем, пов'язаних з розпізнаванням рукописних і друкованих символів. Найбільш важливі з них наступні:

різноманітність форм накреслення символів;

спотворення зображень;

варіації розмірів і масштабу символів.

Кожен окремий символ може бути написаний різними стандартними шрифтами, наприклад (Gothic, Elite, Courier, Orator), спеціальними шрифтами, що використовуються в системах OCR, а також безліччю нестандартних шрифтів. Крім того, різні символи можуть володіти подібними обрисами. Наприклад, U і V, S і 5 raquo ;, Z і 2 raquo ;, G і 6 .

Спотворення цифрових зображень символів можуть бути наступних видів:

Спотворення форми: розірваність рядків, непропечатанность символів, ізольованість окремих точок, неплоский характер інформаційного носія (наприклад, ефект жолоблення), зміщення символів або їх частин щодо місця розташування в рядку; обертання зі зміною нахилу символів; грубим дискретом оцифрування зображень;

Крім того, необхідно виділити радіометричні спотворення: дефекти освітлення, тіні, відблиски, нерівномірний фон, помилки при скануванні або при зйомці відеокамерою.

Істотним є і вплив вихідного масштабу друку. У прийнятій термінології масштаб 10, 12 або 17 означає, що в дюймі рядки поміщаються 10, 12 або 17 символів. При цьому, наприклад, символи масштабу 10 звичайно крупніше і ширше символу масштабу 12.

Крім зазначених проблем, система оптичного розпізнавання тексту (OCR), повинна виділяти на зображенні текстові області, в них виділяти окремі символи, розпізнавати ці символи і бути нечутливою до способу друку (верстки) і відстані між рядками.

. Структура систем оптичного розпізнавання текстів


Як правило, системи OCR складаються з декількох блоків, які передбачають апаратну або програмну реалізацію:

оптичний сканер;

блок локалізації та виділення елементів тексту;

блок попередньої обробки зображень;

блок виділення ознак;

блок розпізнавання;

блок постобробки результатів розпізнавання.

У результаті роботи оптичного сканера вихідний текст вводиться в комп'ютер у вигляді полутонового або бінарного зображення.

З метою економії пам'яті і зменшення витрат часу на обробку інформації, в системах OCR, як правило, застосовується перетворення напівтонового зображення в чорно-біле. Таку операцію називають бінаризація. Однак необхідно мати на увазі, що операція бінарізаціі може призвести до погіршення ефективності розпізнавання.

Програмне забезпечення в системах OCR відповідає за подання даних у цифровому вигляді і розбиття зв'язного тексту на окремі символи.

Після розбиття символи, представлені у вигляді бінарних матриць, піддаються згладжуванню, фільтрації з метою усунення шумів, нормалізації розміру, а також інших перетворень з метою виділення ознак, використовуваних згодом для розпізнавання.

Розпізнавання символів відбувається в процесі порівняння виділених характерних ознак з еталонними ознаками, відбираються в ході статистичного аналізу результатів, отриманих в процесі навчання системи.

Таким чином, смислова або контекстна інформація може бути використана як для вирішення невизначеностей, що виникають при розпізнаванні символів, що володіють ідентичними розмірами, так і для коригування слів та фраз в цілому.


3. Методи попередньої обробки зображень текстових символів


Передобробка є важливим етапом у процесі розпізнавання образів і дозволяє виробляти згладжування, нормалізацію, сегментацію і апроксимацію відрізків ліній.

<...


Назад | сторінка 2 з 23 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Розрахунок кількості символів у тексті
  • Реферат на тему: Роль символів і знаків у культурології
  • Реферат на тему: Значення анімалістичних символів Європейських країн
  • Реферат на тему: Дифузія кримінальних норм і символів в російській культурі
  • Реферат на тему: Системи розпізнавання образів