Зміст
Введення
1. Типові проблеми, пов'язані з розпізнаванням символів
2. Структура систем оптичного розпізнавання текстів
3. Методи попередньої обробки зображень текстових символів
4. Ознаки символів, використовувані для автоматичного розпізнавання
4.1 Кореляція і зіставлення шаблонів
4.2 Статистичні розподілу точок
4.3 Інтегральні перетворення
4.4 Структурний аналіз
5. Класифікація символів
5.1 Порівняння з еталоном
5.2 Нейромережеві структури
6. Постобработка результатів розпізнавання
7. Реалізація алгоритму розпізнавання букв
8. Тестування програми
9. Аналіз алгоритмів оптичного розпізнавання символів
10. Огляд існуючих систем оптичного розпізнавання символів
Висновок
Список літератури
Програми
Введення
символ автоматичне розпізнавання текстовий
Завдання розпізнавання текстової інформації при перекладі друкарського і рукописного тексту в машинні коди є однією з найважливіших складових проектів, що мають на меті автоматизацію документообігу. Разом з тим це завдання є одним з найбільш складних і наукоємних в області автоматичного аналізу зображень. Навіть людина, що читає рукописний текст, у відриві від контексту робить у середньому 4% помилок. Що стосується систем зчитування друкованих документів, то тут складність полягає в тому, що у відповідальних додатках, таких як, наприклад, автоматизація введення паспортно-візової інформації, необхідно забезпечити високу надійність розпізнавання (більше 98-99%) навіть при поганій якості друку і оцифровки вихідного тексту.
В останні десятиліття, завдяки використанню сучасних досягнень комп'ютерних технологій, були розвинені нові методи обробки зображень та розпізнавання образів, завдяки чому стало можливим створення таких систем розпізнавання друкованого тексту, які задовольняли б основним вимогам систем автоматизації документообігу. Тим не менш, створення кожного нового додатка в даній області як і раніше залишається творчим завданням і вимагає додаткових досліджень у зв'язку зі специфічними вимогами з дозволу, швидкодії, надійності розпізнавання та обсягом пам'яті, якими характеризується кожна конкретна задача розробки проблемно-орієнтованої системи автоматичного введення в комп'ютер паперової документації.
Різні технології, об'єднані під загальним терміном розпізнавання символів raquo ;, підрозділяються на розпізнавання в реальному режимі часу і розпізнавання в пакетному режимі, кожен з яких характеризується власною апаратною частиною і власними алгоритмами розпізнавання.
У типовій системі оптичного розпізнавання текстів (OCR) вводяться символи читаються і оцифровуються оптичним сканером. Після цього кожен символ піддається локалізації та виділенню, і вийшла матриця піддається передобробці, т. Е. Згладжування, фільтрації і нормалізації. У результаті предобработки виділяються характерні ознаки, після чого проводиться класифікація. У роботі описуються базові ідеї та методи, що дозволяють вирішити зазначені підзадачі, а також їх модифікації, що використовуються в сучасних системах розпізнавання.
Теорія машинного зору існує не перший день, по цьому в літературі можна знайти достатньо підходів і рішень. Спершу перерахуємо деякі з них:
. Алгоритм скелетизації.
Це метод розпізнавання одинарних бінарних образів, заснований на побудову кістяків цих образів і виділення з кістяків ребер і вузлів. Далі по співвідношенню ребер, їх числа і числу вузлів будується таблиця відповідності образам. Так, наприклад, скелетом кола буде один вузол, скелетом букви П - три ребра і два вузли, причому ребра відносяться як 2: 2: 1. У програмуванні даний метод має кілька можливих реалізацій, докладніше інформацію за методом скелетезаціі можна знайти нижче в розділі посилання.
. Нейромережеві структури.
Напрям було дуже популярним в 60е - 70е роки, надалі інтерес до них трохи зменшився, т.к солідне число нейронів вимагає солідні обчислювальні потужності, які зазвичай відсутні на простеньких мобільних платформах. Однак треба мати на увазі, що нейромережі іноді дають вельми цікаві результати, за рахунок своєї нелінійної структури, більш того деякі нейромережі здатні розпізнавати образи інваріантні щодо повороту без якої або зовнішньої предобработки. Так, наприклад, мережі на основі неокогнейтронов здатні виділяти деякі характерні риси образів, і розпізнавати їх як би образи який...