ано, яким чином слід сформулювати у термінах нейронної мережі задачу розпізнавання рукописних букв. Завдання розпізнавання рукописних літер
Дано: растрове чорно-біле зображення літери розміром 30x30 пікселів
Треба: визначити, яка це буква (в алфавіті 33 літери) Формулювання для нейронної мережі:
Дано: вхідний вектор з 900 двійкових символів (900 = 30x30)
Треба: побудувати нейронну мережу з 900 входами і 33 виходами, які позначені літерами. Якщо на вході нейронної мережі зображення літери "А", то максимальне значення вихідного сигналу досягається на виході "А". Аналогічно нейронна мережа працює для всіх 33 букв. Пояснимо, навіщо потрібно вибирати вихід нейронної мережі з максимальним рівнем сигналу. Справа в тому, що рівень вихідного сигналу, як правило, може приймати будь-які значення з якогось відрізка. Однак, в даній задачі нас цікавить не аналоговий відповідь, а всього лише номер категорії (номер букви в алфавіті). Тому використовується наступний підхід - кожній категорії зіставляється свій вихід, а відповіддю нейронної мережі вважається та категорія, на чиєму виході рівень сигналу максимальний. У певному сенсі рівень сигналу на виході "А" - це вірогідність того, що на вхід нейронної мережі була подана рукописна буква "A". Завдання, в яких потрібно віднести вхідні дані до однієї з відомих категорій, називаються завданнями класифікації. Викладений підхід - стандартний спосіб класифікації за допомогою нейронних мереж.
3. Як побудувати нейронну мережу
Тепер, коли стало ясно, що саме ми хочемо побудувати, ми можемо переходити до питання "як будувати таку нейронну мережу". Це питання вирішується в два етапи: 1. Вибір типу (архітектури) нейронної мережі. 2. Підбір ваг (навчання) нейронної мережі. На першому етапі слід вибрати наступне: які нейрони ми хочемо використовувати (число входів, передавальні функції); яким чином слід з'єднати їх між собою; span> що взяти в якості входів і виходів нейронної мережі. Це завдання на перший погляд здається неозорої, але, на щастя, нам необов'язково придумувати нейронну мережу "з нуля" - існує кілька десятків різних нейромережевих архітектур, причому ефективність багатьох з них доведена математично. Найбільш популярні й вивчені архітектури - це багатошаровий перцептрон, нейронна мережа із загальною регресією, нейронні мережі Кохонена та інші. Про всі ці архітектури скоро можна буде прочитати в спеціальному розділі цього підручника.
На другому етапі нам слід "навчити" обрану нейронну мережу, тобто підібрати такі значення її ваг, щоб вона працювала пот...