ів (малюнок 1.14 (d , e));
Якщо висота прямокутника - менше ніж 1/3 висоти його вертикально суміжного прямокутника, то необхідно об'єднати їх також як на попередньому кроці.
Коли всі прямокутники отримані, використовується горизонтальний і вертикальний метод проектування, щоб ефективно обмежити текстові рядки. Значення інтенсивності, використовувані в оцінці проектування, є сумою «відгуків» у чотирьох штрихових картах. Для згенерованого граничного відповідності прямокутників текстовим рядкам видалені деякі очевидні нетекстові прямокутники, якщо їх висоти не належать діапазону, або їх коефіцієнт пропорційності перевищує певний поріг. Малюнок 1.13 (d) показує кінцеві рядки передбачуваного тексту після операції проектування. [15]
.3.1.1.4 Перевірка наявності тексту
Для кожного передбачуваної ділянки тексту йде перевірка новим класифікатором SVM, щоб, нарешті, перевірити чи є це істинної текстовим рядком.
{1.4, 1.0, 0.6, 0.2}
SVM класифікатор навчався на наборі даних з 200 текстових рядків і 160 нетекстових рядків. [15]
Рис. 1.15 Перевірка наявності тексту
На малюнку 1.15 (b, c) видно результат використання SVM класифікатора.
.3.1.1.5 Експериментальні результати
На малюнку 1.16 показані деякі результати випробування даного алгоритму.
Для кількісних порівнянь були взяті два показники:
Швидкість - середня кількість оброблених зображень в секунду склала 12,9;
Точність - ставлення правильно виявлених текстових областей і наявних склала 91,1%.
Висока точність полягає в тому, що використання двох простих класифікаторів досягає кращої продуктивності, ніж використання одного складного. [15]
Рис. 1.16 Результати випробувань
Також існують інші алгоритми виявлення тестових областей:
.3.1.2 Алгоритм «Швидке і стійке текстове виявлення в зображеннях і відео кадрах»
Цей алгоритм розроблений в Інституті обчислювальних технологій китайської Академії Наук, Китай.
В основі алгоритму лежать чотири властивості:
(1) Щільне різноманітність інтенсивності;
(2) Контраст між текстом і його фоном;
(3) Структурна інформація;
(4) Властивість текстури.
Щоб класифікувати блок зображення в текстовий або НЕ текстовий різними моделями класифікаторів, в алгоритмі запропонована інша структура виявлення. Вона використовує ці чотири властивості. У грубому виявленні блоки тексту виходять виходячи з першого і другого властивостей, припускаючи, що у всіх текстових областей є щільне різноманітність інтенсивності і контраст з фоном. Потім ці текстові області за допомогою третьої властивості поділяються на текстові рядки, а властивість чотирьох використовується, щоб відрізнити текст від інших нетекстових шаблонів, щільне різноманітність інтенсивності яких подібно тексту.
Ми розглядаємо чотири види особливостей текстури, щоб ідентифікувати текстові рядки.
Вони включають:
Особливості невеликої хвилі;
Особливості гістограми невеликої хвилі;
Особливості входження невеликої хвилі;
Особливості гістограми рахунку.
Використовується алгоритм вибору особливості, щоб знайти ефективні особливості, і класифікатор SVM, щоб виконати текстову/нетекстовий задачу класифікації.
Рис. 1.17 Блок-схема алгоритму
У порівнянні з існуючими підходами основні переваги запропонованого алгоритму наступні:
(1) Швидке виявлення.
(2) Виявлення тексту зі зміною розміру шрифту.
(3) Комбінація особливостей текстури. У роботах дослідники використовують традиційні особливості текстури, щоб відрізнити текст з нетекстовий шаблонами. У цій роботі чотири види особливостей об'єднані, щоб виконати це завдання. Використовується передовий алгоритм вибору особливості, для знаходження ступеня важливості різних особливостей.
(4) Дійсно стійке текстове виявлення. Метод може виявити текст в різних розмірах і кольорах. Він також нечутливий до текстової орієнтації рядки при використанні орієнтованої області. Процедура класифікації зменшує помилкові тривоги і робить метод ефективним навіть у складному фоні. [16]
.3.1.2.1 Многошкальная декомпозиція невеликої хвилі
Перетворення невеликої хвилі (малюнок 1.17) використовується в цьому алгоритмі для хорошого визначення місця розташування, обчислюється за допомогою окремого фільтра як:
(а) оригінал з різним розміром тексту;
(b) Після перетворення.
Рис. 1.17 Дворівневе перетворення хвилі
«H» і «G» - високі і низькі смугові фільтри відповідно, місця розташування в двох рівнях декомпозиції, - многошкальное уявлення глибини оригінального зображення.
Текст різних розмірів може бути витягн...