При застосуванні нейронних мереж необхідно вирішити наступні завдання:
- постановка задачі, придатної для вирішення за допомогою нейронної мережі;
- вибір моделі ІНС;
- підготовка вихідних даних для навчання ІНС;
- навчання ІНС;
- власне рішення задачі за допомогою навченої ІНС.
Крім того, іноді потрібен ще один етап - інтерпретація рішення, отриманого нейронною мережею.
Найбільш трудомісткими процесами при використанні нейронних мереж є підготовка вихідних даних для навчання та навчання нейронної мережі.
2. Загальні відомості про принципи побудови нейронних мереж
. 1 Штучні нейронні системи
Пошуки алгоритмів, що дозволяють автоматично використовувати накопичених досвід, тривають уже понад 100 років. З появою дешевих ЕОМ відбувся різкий стрибок у цій галузі. Виникли нових обасти діяльності - нейроінформатіка, нейрокібернетика та ін. Приставка нейро у назві зовсім не випадкова. По-перше, нейрокомп'ютери і нейропрограмми явялються самонавчального, що відрізняє їх від звичайних ЕОМ (програм); по-друге, принципи їх роботи нагадують (хоча й віддалено) взаємодія клітин нервової системи - нейронів - через спеціальні зв'язку - синапси.
Основою роботи самообучающихся нейропрограмм є нейронна мережа, що представляє собою сукупність нейронів - елементів, пов'язаних між собою певним чином. Нейрони і міжнейронні зв'язки задаються програмно на звичайному комп'ютері або можуть мати матеріальну основу - особливі мікросхеми, які застосовуватися в спеціально створених нейрокомп'ютером. Функціонування нейрона в нейрокомп'ютером або нейропрограмме віддалено нагадує роботу біологічного нейрона.
Біонейрон - клітина, що має довгі відростки, пов'язані з іншими нейронами за допомогою синапсів, предающих електричний імпульс від одного нейрона до іншого. Відростки підрозділяються на дендрити, що передають сигнали до даного нейрону, і аксони, які передають сигнали від даного нейрона.
2.2 Математична модель нейрона
Основний елемент нейронної мережі - це формальний нейрон. Модель нейрона Маккаллок-Питтса, яка і зараз є найбільш вживаним формалізмом для опису окремого нейрона в нейронної мережі складається з наступних елементів. Адаптивний суматор, показаний на малюнку 2.1, обчислює скалярний добуток вектора вхідного сигналу X на вектор параметрів W. Перетворювач сигналу, зображений на малюнку 2.2, отримує скалярний вхідний сигнал (X, W) і переводить його в F (X, W). Послідовним з'єднанням адаптивного суматора з перетворювачем, як показано на малюнку 2.3, отримуємо нейрон. У більшості випадків на виході кожного нейрона варто точка розгалуження, що служить для розсилки вихідного сигналу нейрона по входах інших елементів, рисунок 2.4.
Малюнок 2.1 - Адаптивний суматор Малюнок 2.2 - Перетворювач
Малюнок 2.3 - Формальний нейрон
Малюнок 2.4 - Нейрон з точкою розгалуження на виході
Нейрон здійснює операцію нелінійного перетворення суми добутки вхідних сигналів на вагові коефіцієнти:
, (2.1)
де X - вектор вхідного сигналу;
W - ваговий вектор;
F - оператор нелінійного перетворення.
Сума добутків вхідних сигналів на вагові коефіцієнти називається зваженою сумою. Вона являє собою скалярний добуток вектора ваг на вхідний вектор:
,
де | W |, | X | - відповідно довжини векторів W та X;
- кут між векторами W та X.
Довжини вагового та вхідного векторів визначаються через їх координати:
;
.
Так для нейронного елемента довжина вагового вектора після навчання | W |=const, то величина зваженої суми визначається проекцією вхідного вектора на ваговий вектор:
,
де Xw - проекція вектора X на вектор W.
Якщо вхідні вектори унормовані, тобто | X |=const, то величина зваженої суми буде залежати тільки від кута між векторами X і W. Тоді при різних вхідних сигналах зважена сума змінюватиметься за косинусоидальной закону. Максимального значення вона сягатиме при коллінеарності вхідного і вагового векторів.
Якщо сила зв'язку wi негативна, то такий зв'язок називається гальмує. В іншому випадку синоптична зв'язок є посилюючої.
Оператор нелінійного перетворення називається функцією активації нейронного елемента. В якості цього оператора можуть використовуватися різні функції, які визначаються відповідно до розв'язуваної завданням і типом нейронної мережі. Розглянемо найбільш пошире...