тів) для ефективного вирішення поставленого завдання. Зазвичай навчання нейронної мережі здійснюється на деякій вибірці. У міру процесу навчання, який відбувається за певним алгоритмом, мережа повинна все краще і краще (правильніше) реагувати на вхідні сигнали.
Виділяють три типи навчання: з учителем, самонавчання і змішаний. У першому способі відомі правильні відповіді до кожного вхідного прикладу, а ваги підлаштовуються так, щоб мінімізувати помилку. Навчання без вчителя дозволяє розподілити зразки по категоріям за рахунок розкриття внутрішньої структури і природи даних, виходи НС формуються самостійно, а ваги змінюються по алгоритму, що враховує тільки вхідні та похідні від них сигнали. При змішаному навчанні комбінуються два вищевикладених підходу.
Оскільки помилка залежить від ваг нелінійно, отримати рішення в аналітичній формі неможливо, і пошук глобального мінімуму здійснюється за допомогою ітераційного процесу - так званого навчає алгоритму . Розроблено вже більше сотні різних навчальних алгоритмів, відрізняються один від одного стратегією оптимізації та критерієм помилок. Звичайно як заходи похибки береться середня квадратична помилка (СКО):
(1.8)
де М - Число прикладів у навчальній множині;
d - Необхідний вихідний сигнал;
y - Отриманий вихідний сигнал. p> Навчання нейромережі проводиться методом градієнтного спуску, тобто на кожній ітерації зміна ваги проводиться за формулою. br/>
, (1.9)
де e - коефіцієнт навчання, що визначає швидкість навчання. p> Відзначимо два властивості повної помилки. По-перше, помилка E = E ( W ) є функцією стану W , визначеної на просторі станів. За визначенням, вона приймає невід'ємні значення. По-друге, в деякому навченим стані W * , в якому мережа не робить помилок на навчальній вибірці, дана функція приймає нульове значення. Отже, навчені стану є точками мінімуму введеної функції E ( W ). p> Таким чином, завдання навчання нейронної мережі є завданням пошуку мінімуму функції помилки в просторі станів
1.6 Нейромережеві системи управління
Нейроуправленіе являє собою нове високотехнологічне напрямок в теорії управління, активно розвивається в усьому світі з кінця 70-х років. Нейронні мережі є предметом дослідження цілого ряду дисциплін. З точки зору теорії управління нейронні мережі вибираються в якості моделі об'єкта управління або безпосередньо регулятора, а динамічний процес її налаштування являє собою процес синтезу системи управління. p> Проблема синтезу регуляторів розглядається з двох позицій, а саме: прямі методи та непрямі методи синтезу нейромережевих систем управління:
В· прямі методи синтезу - регулятор реалізується безпосередньо на нейромережі. Застосування методу не викликає труднощів, однак необхідність постійного перенавчання нейромережі призводить до ряду проблем;
1) непрямі методи синтезу - нейромережа використовується в якості моделі об'єкта управління, а синтез регулятора здійснюється традиційним методом.
У загальному випадку управління об'єктом за допомогою нейромережі можна схемою на малюнку 1.5
В
Малюнок 1.5 Управління за допомогою нейроконтролера. br/>
При цьому навчання самого нейроконтролера безпосередньо за вхідними даними об'єкта може бути зроблено за допомогою схеми, представленої на малюнку 1.6 з застосуванням найбільш поширеного алгоритму.
В
Малюнок 1.6. Навчання нейроконтролера за допомогою алгоритму зворотного поширення помилки.
2.1 Розробка нейросевого регулятора з спостерігає пристроєм. Використання нейроконтролера Model Reference Control
Як приклад використання нейромережі показаний нейромережевої регулятор з спостерігає пристроєм. Даний регулятор компенсує нелінійну складову прискорення маніпулятора, обумовлену дією сили тяжіння. Об'єкт управління і його математичний опис представлені нижче.
Рука обертається в вертикальній площині і має одну ступінь свободи.
В
Малюнок 3.1 Схема руху руки робота
Рівняння руху руки робота:
(3.1)
де П† - кут повороту руки, u - обертаючий момент двигуна постійного струму.
Складова прискорення -10sin П† враховує силу тяжіння. p> Необхідно, щоб рука робота рухалася у відповідності з рівнянням:
(3.2)
Математичний опис об'єкта управління.
В якості вихідної динамічної системи використовується об'єкт управління, описуваний рівнянням (3.1). Зробимо заміну і. p> У результаті отримаємо систему диференціальних рівнянь:
, (3.3)
Матриця системи і матриця управління:
;
У цьому випадку бажаний процес (3.2) буде описуватися системою рівнянь: