Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Курсовые проекты » Ознаки символів, використовувані для автоматичного розпізнавання

Реферат Ознаки символів, використовувані для автоматичного розпізнавання





вузлах нормалізованого растра можуть використовуватися значення, що характеризують перепад яскравості. Такі вхідні параметри дозволяють краще виділяти краю літери. Система розпізнавання рукопечатних цифр, що використовують такі вхідні параметри. Вступники на розпізнавання зображення наводяться до розміру 16х16 пікселів. Після цього вони піддаються додатковій обробці з метою виділення ділянок з найбільшими перепадами в яскравості.

Одним із широко використовуваних методів підвищення точності розпізнавання є одночасне використання декількох різних розпізнавальних модулів і наступне об'єднання отриманих результатів (наприклад, шляхом голосування). При цьому дуже важливо, щоб алгоритми, використовувані цими модулями, були якомога більш незалежні. Це може досягатися як за рахунок використання розпізнавальних модулів, що використовують принципово різні алгоритми розпізнавання, так і спеціальним підбором навчальних даних.

Один з таких методів був запропонований кілька років тому і заснований на використанні трьох розпізнавальних модулів (машин). Перша машина навчається звичайним чином. Друга машина навчається на символах, які були відфільтровані першою машиною таким чином, що друга машина бачить суміш символів, 50% з яких були розпізнані першою машиною вірно і 50% невірно. Нарешті, третя машина навчається на символах, на яких результати розпізнавання перший і другий машин різні. При тестуванні розпізнавані символи подаються на вхід всім трьом машинам. Оцінки, одержувані на виході всіх трьох машин складаються. Символ, який отримав найбільшу сумарну оцінку видається як результату розпізнавання.

Більш детальна інформація по даному методу розпізнавання образів представлена ??в додатку «Б».

6. Постобработка результатів розпізнавання


У високоточних системах OCR, таких як, наприклад, системи зчитування й обробки машиночитаних паспортно-візових документів, якість розпізнавання, одержуване при розпізнаванні окремих символів, що не вважається достатнім. У таких системах необхідно використовувати також контекстну інформацію. Використання контекстної інформації дозволяє не тільки знаходити помилки, але і виправляти їх.

Існує велика кількість додатків OCR, що використовують глобальні та локальні позиційні діаграми, триграми, п-грами, словники і різні поєднання цих методів. Розглянемо два підходи до вирішення такого завдання: словник і набір бінарних матриць, апроксимуючих структуру словника.

Доведено, що словникові методи є одними з найбільш ефективних при визначенні та виправленні помилок класифікації окремих символів. При цьому після розпізнавання всіх символів деякого слова словник проглядається в пошуках цього слова, з урахуванням того, що воно, можливо, містить помилку. Якщо слово є в словнику, це не говорить про відсутність помилок. Помилка може перетворити одне слово, що знаходиться в словнику, в інше, що також входить в словник. Така помилка не може бути виявлена ??без використання смисловий контекстної інформації, тільки вона може підтвердити правильність написання. Якщо слово в словнику відсутній, вважається, що в слові допущена помилка. Для виправлення помилки вдаються до заміни такого слова на схоже слово зі словника. виправлення не провадиться, якщо в словнику знайдено декілька відповідних варіантів заміни. У цьому випадку інтерфейс деяких систем дозволяє запропонувати користувачеві різні варіанти рішення, наприклад, виправити помилку, ігнорувати її і продовжувати роботу або внести це слово в словник.

Головний недолік у використанні словника полягає в тому, що операції пошуку та порівняння, що застосовуються для виправлення помилок, вимагають значних обчислювальних витрат, що зростають зі збільшенням обсягу словника.

Деякі розробники з метою подолання труднощів, пов'язаних з використанням словника, намагаються виділяти інформацію про структуру слова із самого слова. Така інформація говорить про ступінь правдоподібності п-грамів (наприклад, пари і трійки букв) у тексті. N-грами також можуть бути глобально позиціонувати, локально позиціонувати або взагалі непозіціонірованнимі.

Наприклад, ступінь достовірності непозіціонірованной пари букв може бути представлена ??у вигляді бінарної матриці, елемент якої дорівнює 1, тоді і тільки тоді, коли відповідна пара букв мається на деякому слові, що входить до словник. Позиційна бінарна діаграма Dy є бінарною матрицею, визначальною, яка з пар букв має ненульову ймовірність виникнення в конкретній позиції (i, j). Набір всіх позиційних діаграм включає бінарні матриці для кожної пари положень.


7. Реалізація алгоритму розпізнавання букв


У рамках курсової роботи була написана програма частково реалізує основні блоки автомат...


Назад | сторінка 6 з 23 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Алгоритм і програма розпізнавання образів
  • Реферат на тему: Історія систем розпізнавання образів
  • Реферат на тему: Системи розпізнавання образів
  • Реферат на тему: Математична теорія розпізнавання образів
  • Реферат на тему: Розробка програми розпізнавання зорових образів