й (як приклад на малюнку 1 представлено порівняння двох зображення з камери відео спостереження та підготовленого зображення для навчання мережі).
Малюнок 1. Відмінності підготовлених і реальних даних (зліва - підготовлене зображення, праворуч - зображення з камери відеоспостереження)
Можна спробувати вирішити цю проблему доповнивши навчальну вибірку прикладами з перекрученими даними, але це призведе до збільшення кількості навчальних даних, що в свою чергу зменшить час навчання і чим більше існує можливих спотворень, тим більше прикладів доведеться додати. Також додавання перекручених прикладів в набір навчальних вибірок, може погано позначитися на узагальнюючої здатності мережі.
Ще одним недоліком традиційних повнозв'язних мереж є ігнорування топології, геометричної структури зображення [4,7]. Зображення представляється у вигляді вхідного вектора і дані (пікселі) можна подавати в будь-якому фіксованому порядку, це не вплине на результат навчання. З іншого боку зображення являє собою плоский двомірний об'єкт, в якому кожен піксель має чітко визначену позицію. Сусідні пікселі пов'язані між собою, і цей зв'язок несе цінну інформацію про зображення [7]. Зв'язок пікселів дозволяє витягувати локальні ознаки (наприклад, лінії, кути і т.д.), з яких потім можуть бути отримані більш загальні ознаки. На малюнку 2, на зображенні зліва пікселі несуть локальну інформацію про двох пересічних лініях, на зображенні праворуч розташовані хаотично, і це теж є свого роду інформацією. Дані ознаки зображень не можна виділити за допомогою простої багатошарової мережі.
Малюнок 2. Локальна зв'язок пікселів зображення
згортальне нейронні мережі забезпечую часткову стійкість до змін масштабу, зсуви і повороти, зміні ракурсу та іншим спотворень [7]. Цей тип мережі розробив і вперше застосував Yann LeCun відомий дослідник в області комп'ютерного зору та робототехніки. Згорткові мережі орієнтовані на роботу із зображеннями і враховують локальні зв'язки між пікселями, що робить їх кращими в порівнянні з традиційними багатошаровими мережами. Переваги згортальних мереж обумовлюють їх вибір для вирішення задачі розпізнавання образів і класифікації ознак виділяються з зображень.
1.2 Загальні властивості та особливості функціонування
Три архітектурних рішення дозволяють сверточних нейронних мереж забезпечувати інваріантність до зміни масштабу, повороту, зрушенню і незначним просторовим спотворень [4,7]:
· Локальне витяг ознак. Кожен нейрон отримує вхідний сигнал від локального рецептивного поля в попередньому шарі (малюнок 3), це забезпечує локальну двомірну зв'язок нейронів [4].
Малюнок 3. Сканування рецептивних полем
· Шари у вигляді набору карт ознак. Обчислювальні шари складаються з наборів карт ознак, площин для яких всі нейрони повинні використовувати одне загальне безліч синаптичних ваг. Дана форма ускладнює структуру мережі, але має переваги. По-перше, загальні ваги зменшують загальне число настроюються коефіцієнтів, а по-друге забезпечується детектування деяких рис в будь-якому місці зображення [7]. У кожному такому шарі ми отримуємо карти з розташування певних ознак, чим більше карт, тим більше ознак.
Малюнок 4. Шари у вигляді карт ознак. Загальні ваги для нейронів картки
· Ієрархічна організація з просторовими підвибірки. Виділяють два види шарів: згортки і підвибірки. За кожним шаром згортки йде шар підвибірки, він здійснює подвиборку і локальне усереднення, за рахунок чого досягається зменшення дозволу для карт ознак і підвищується стійкість вхідного сигналу до зсувів і незначним деформаціям [4,7].
згортальне нейронна мережа є багатошаровою. Згорткові і подвиборочние шари чергуються один з одним. Кожен з цих шарів, у свою чергу, складається з набору карт (площин), причому нейрони однієї карти мають однакові ваги, використовувані для зв'язку з усіма локальними ділянками попереднього шару. Зображення попереднього шару сканується невеликим вікном і пропускається крізь набір ваг, отриманий результат відображається на відповідний нейрон поточного шару. Таким чином, набір площин являє собою карти характеристик, і кожна карта знаходить свої ознаки (ділянки) в будь-якому місці попереднього шару.
1.3 Структура і робота мережі.
Розглянемо структуру типової згортальне мережі (малюнок 5):
Малюнок 5. Структура згортальне мережі
Дані про зображення подаються на вхідний шар, який не несе який або функціонального навантаження і служить лише для подачі зображення на вхід мережі. Далі за вхід...