оделювання мережі. Ця різниця носить назву "помилки навчання". Використовуючи помилки навчання для всіх наявних спостережень, можна сформувати функцію помилок або критерій якості навчання. Найчастіше в якості такого критерію використовується сума квадратів помилок. Для лінійних мереж при цьому вдається знайти абсолютний мінімум критерію якості, для інших мереж досягнення такого мінімуму не гарантується. Це пояснюється тим, що для лінійної мережі критерій якості, як функція ваг і зсуву, є параболоїдом, а для інших мереж - дуже складною поверхнею в N +1- вимірному просторі, де N - число вагових коефіцієнтів і зміщень. p align="justify"> З урахуванням специфіки нейронних мереж для них розроблені спеціальні алгоритми навчання. Алгоритми діють итеративно, по кроках. Величина кроку визначає швидкість навчання і регулюється параметром швидкості налаштування. При великому кроці є велика ймовірність пропуску абсолютного мінімуму, при малому кроці може сильно зрости час навчання. Кроки алгоритму прийнято називати епохами або циклами. p align="justify"> На кожному циклі на вхід мережі послідовно подаються всі навчальні спостереження, вихідні значення порівнюються з цільовими значеннями і обчислюється функція критерію якості навчання - функція помилки. Значення функції помилки, а також її градієнта використовуються для коригування ваг і зміщень, після чого всі дії повторюються. Процес навчання припиняється з таких трьох причин, якщо:
а) реалізовано задану кількість циклів;
б) помилка досягла заданої величини;
в) помилка досягла деякого значення і перестала зменшуватися.
У всіх цих випадках мережа мінімізувала помилку на деякій обмеженій навчальній множині, а не на безлічі реальних вхідних сигналів при роботі моделі. Спроби ускладнити модель і знизити помилку на заданому навчальній множині можуть призвести до зворотного ефекту, коли для реальних даних помилка стає ще більше. Ця ситуація називається явищем перенавчання нейронної мережі. p align="justify"> Для того щоб виявити ефект перенавчання нейронної мережі, використовується механізм контрольної перевірки. З цією метою частина навчальних спостережень резервується як контрольні спостереження і не використовується при навчанні мережі. У міру навчання контрольні спостереження застосовуються для незалежного контролю результату. Якщо на деякому етапі помилка на контрольному безлічі перестала спадати, навчання слід припинити навіть у тому випадку, коли помилка на навчальній множині продовжує зменшуватися, щоб уникнути явища перенавчання. У цьому випадку слід зменшити кількість нейронів або шарів, тому що мережа є занадто потужної для вирішення даної задачі. Якщо ж, навпаки, мережа має недостатню потужність, щоб відтворити залежність, то явище перенавчання швидше за все спостерігатися не буде і обидві помилки - навчання та контролю - не досягнуть необхідного рівня. p align="justify"> Таким чином, ...